Apple, yaklaşık 1,5 yıl önce başlayan yapay zekâ yarışında net bir ürün tanıtamamak ve rakiplerinin hayli gerisinde kalmakla suçlanıyordu. Firmanın bu eleştirilere cevabıysa geleneksel iPhone lansmanları dışında en önemli ve büyük etkinliği olan Dünya Çapında Geliştiriciler Konferansı WWDC 2024 etkinliğinde geldi. Firma iOS 18, watchOS 11 ve macOS Sequoia gibi işletim sistemi güncellemelerinin yanı sıra Apple Intelligence yapay zekâ sistemini tanıttı.
Apple Intelligence, kullanıcıların günlük görevleri için özelleşmiş ve mevcut etkinliklerine anında uyum sağlayabilen, son derece yetenekli çok sayıda üretken modelden oluşuyor. Apple Intelligence’ta yerleşik olarak bulunan temel modeller; metin yazma ve düzeltme, bildirimleri önceliklendirme ve özetleme, aile ve arkadaşlarla yapılan sohbetler için eğlenceli görüntüler oluşturma ve uygulamalar arasındaki etkileşimleri basitleştirmek için uygulama içi eylemler gerçekleştirme gibi kullanıcı deneyimleri için ince ayarlardan geçirildi.
Öncelikle hemen belirtelim, Apple Intelligence iki farklı modelden oluşuyor: iOS ve iMac gibi cihazlar için geliştirilen daha düşük işlem gücüne sahip cihaz içi dil modeli ve daha geniş kapsamlı bulut modeli. Aşağıdaki genel bakışta, bu modellerden her ikisinin de yani yaklaşık 3 milyar parametreli cihaz içi dil modeli ve Private Cloud Compute ile kullanılabilen, Apple silikon sunucularında çalışan daha büyük bir sunucu tabanlı dil modelinin detaylarını bulabilirsiniz. Tabi bu modellere ek olarak Xcode’a zekâ katmak için bir kodlama modeli ve kullanıcıların örneğin Mesajlar uygulamasında kendilerini görsel olarak ifade etmelerine yardımcı olmak için bir yayılım modeli de eklenmiş durumda. Bu daha geniş model seti hakkında detaylar henüz netleşmedi.
Apple Intelligence benchmark sonuçları!
Detaylara gelecek olursak firmanın Apple Intelligence sisteminde en fazla ön plana çıkardığı özelliklerden birisi e-mail ve bildirimler içinde “özetleme” yeteneği. Bu yetenek, yapay zekâ aracının herhangi bir iletiyi bağlamdan kopmadan ve önemli noktaları atlamadan kısaltması ve özetlemesi anlamına geliyor. Yapılan performans testlerinde Apple Intelligence, benzer boyutlu açık kaynaklı Phi-3-mini ile kıyaslanmış ve hem e-mail hem de bildirimlerde daha iyi sonuçlar verdiği görülmüş.
Bir diğer test ise beyin fırtınası, sınıflandırma, kapalı soru cevaplama, kodlama, çıkarım yapma, matematiksel akıl yürütme, açık soru cevaplama, yeniden yazma, güvenlik, özetleme ve yazma yeteneklerini içeren genel bir değerlendirme testi. Bu test hem cihaz içi hem de bulut modeli için yapılmış ve yine benzer boyutlu, açık kaynaklı ve popüler ticari versiyonlar ile kıyaslamalı olarak gerçekleştirilmiş.
Ayrıca yapay zekâya sorulan sorulara verilen cevapların zararlı sonuçlar içerip içermediği (örneğin illegal bir madde temin etme yolları vs gibi) de yineaçık kaynaklı ve popüler ticari versiyonlar ile kıyaslamalı olarak gerçekleştirilmiş. Yapılan testlerde Apple’ın daha güvenilir ve daha fazla yardımcı olan yanıtlar ürettiği görülmüş.
Son olarak Apple Intelligence yazma becerisi, çeşitli yazma talimatlarından oluşan dahili özetleme ve kompozisyon ölçütleri ile değerlendirilmiş. Burada GPT-4-Turbo’nun daha üstün olması dikkat çekici
Apple Intelligence ön eğitimi nasıl yapıldı?
Temel modellerin her ikisi de 2023 yılında yayınlanan ve açık kaynaklı bir proje olan Apple’ın AXLearn çerçevesi üzerinde eğitildi. JAX ve XLA’nın üzerine inşa edilen bu yapı, modelleri TPU’lar ve hem bulut hem de şirket içi GPU’lar dahil olmak üzere çeşitli eğitim donanımları ve bulut platformlarında yüksek verimlilik ve ölçeklenebilirlikle eğitilmeyi sağlıyor. Veri, model ve dizi uzunluğu gibi birden fazla boyutta eğitimi ölçeklendirmek için veri paralelliği, tensör paralelliği, dizi paralelliği ve Fully Sharded Data Parallel (FSDP) kombinasyonunu kullanılmış durumda.
Temel modelleri, belirli özellikleri geliştirmek için seçilen verilerin yanı sıra web tarayıcısı AppleBot tarafından toplanan halka açık veriler de dahil olmak üzere lisanslı veriler üzerinde eğitildi. Web yayıncıları, bir veri kullanım kontrolü ile Apple Intelligence eğitimi için web içeriklerinin kullanılmasını devre dışı bırakma seçeneğine sahip.
Apple, temel modellerini eğitirken kullanıcılara ait özel kişisel verileri veya kullanıcı etkileşimlerini asla kullanmadığı iddiasında. Firma ayrıca internette herkese açık olan sosyal güvenlik ve kredi kartı numaraları gibi kişisel olarak tanımlanabilir bilgileri kaldırmak için filtreler uyguladığını söylüyor. Ayrıca eğitim külliyatına dahil edilmelerini önlemek için küfür ve diğer düşük kaliteli içerikleri de filtreliyor. Filtrelemeye ek olarak, yüksek kaliteli belgeleri belirlemek için veri çıkarma, veri tekilleştirme ve model tabanlı bir sınıflandırıcı uygulaması gerçekleştiriyor.
Eğitim sonrası hassas ayarlamalar nasıl gerçekleştirildi?
Veri kalitesinin model başarısı için çok önemli olduğu ortada, bu nedenle de Apple eğitim hattında hem insan açıklamalı hem de sentetik verileri içeren hibrit bir veri stratejisi kullandı ve kapsamlı veri iyileştirme ve filtreleme prosedürleri uyguladı. Firma eğitim sonrası için iki yeni algoritma geliştirdiğini ve bunların öğretmen komitesine sahip bir ret örnekleme ince ayar algoritması ve ayna iniş politikası optimizasyonuna sahip bir insan geri bildirim takviyeli öğrenme (RLHF) algoritması olduğunu açıklıyor. Bu iki algoritmanın modelin talimat takip kalitesinde önemli bir iyileşmeye yol açtığı ileri sürülmekte.
Daha fazla detay ve Apple’ın resmi açıklamasına buradan ulaşabilirsiniz.