Apple, MGIE Adlı Yeni Yapay Zeka Modelini Duyurdu

Apple, görüntüleri işlerken metin tabanlı komutları yorumlamak için çok modlu büyük dil modellerini (MLLM’ler) kullanan MLLM Kılavuzlu Görüntü Düzenleme ya da kısaca MGIE adı verilen yeni bir yapay zeka modeli tanıttı. Başka bir deyişle, araç, kullanıcının yazdığı metne göre fotoğrafları düzenleme yeteneğine sahip. Bunu yapabilen ilk araç olmasa da projenin “insan talimatları bazen mevcut yöntemlerin yakalanıp takip edilmesi için çok kısadır” deniyor.

Şirket, MGIE’yi Santa Barbara’daki Kaliforniya Üniversitesi’nden araştırmacılarla geliştirdi. MLLM’ler, basit veya belirsiz metin istemlerini, fotoğraf düzenleyicinin izleyebileceği daha ayrıntılı ve net talimatlara dönüştürme gücüne sahip. Örneğin, bir kullanıcı biberli pizzanın fotoğrafını “daha sağlıklı hale getirmek” için düzenlemek isterse, MLLM’ler bunu “sebze malzemeleri ekleyin” olarak yorumlayabiliyor ve fotoğrafı bu şekilde düzenleyebiliyor.

MGIE, görüntülerde büyük değişiklikler yapmanın yanı sıra metin istemleri yoluyla fotoğrafları kırpabiliyor, yeniden boyutlandırabiliyor ve döndürebiliyor. Hatta parlaklığını, kontrastını ve renk dengesini iyileştirebilmesi de mümkün. Ayrıca MGIE, bir fotoğrafın belirli alanlarını düzenleyebiliyor ve örneğin fotoğraftaki bir kişinin saçını, gözlerini ve kıyafetlerini değiştirebiliyor veya arka plandaki öğeleri kaldırabiliyor.

Apple, modeli GitHub aracılığıyla yayınladı ancak ilgilenenler şu anda Hugging Face Spaces‘ta barındırılan bir demoyu da denebiliyor. Apple, bu projeden öğrendiklerini herhangi bir ürününe dahil edebileceği bir araç veya özellik olarak kullanmayı planlayıp planlamadığını ise detaylandırmadı.

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir

x