Apple, son araştırmalarıyla dikkat çekici bir adım atarak görsel ve metinsel verileri işleyebilen yeni bir yapay zeka modeli olan MM1’i tanıttı. Bu model, görsel-altyazı çiftleri ve resim-metin belgeleri gibi farklı veri türlerini entegre ederek çok modlu bir yapıya sahip. Apple MM1, 30 milyara kadar parametreye sahip büyük bir dil modeli olan Google Gemini gibi modellerin dünyasına giriş yapıyor.
Apple’ın MM1’i, nesneleri sayabilme, görüntülerin parçalarını tanımlayabilme ve temel matematiksel işlevleri yerine getirebilme yeteneğine sahip olduğunu iddia ediyor. Ayrıca, bağlam içi öğrenme yetenekleri sayesinde sürekli olarak yeniden eğitilmeye veya ince ayar yapmaya gerek duymadan çeşitli görevleri yerine getirebiliyor. MM1 ayrıca çoklu görüntü muhakemesini destekleyerek birden fazla görseli yorumlayıp sonuçlar çıkarabiliyor.
Özellikle, MM1’in 30 milyar parametreli konfigürasyonu, karmaşık ve açık uçlu problem çözme yeteneği açısından önemli bir adım olarak öne çıkıyor. Araştırmacılar, modelin masadaki biralar için ödeme hesaplaması gibi gerçek dünya sorunlarını başarıyla çözebildiğini belirtiyorlar.
Ancak, MM1 şu anda sadece bir araştırma makalesiyle sınırlı ve henüz somut bir ürün olarak mevcut değil. Apple’ın yapay zeka alanındaki araştırmaları umut vaat ederken, henüz bir ürünün olmaması bazı endişelere yol açıyor. Son zamanlarda, Apple’ın Google Gemini’yi iOS 18’e entegre etmek için çalıştığına dair iddialar ortaya atıldı, ancak şu anda net bir bilgi bulunmuyor.
Bu gelişmeler, Apple’ın yapay zeka konusundaki ilerlemelerini vurgularken, hala belirli zorluklarla karşı karşıya olduğunu gösteriyor.