İşte kısa bir kronoloji: Yaklaşık olarak 28 Ocak civarında, kullanıcı adı “Miqu Dev” olan bir kişi, önde gelen açık kaynak yapay zeka model ve kod paylaşım platformu olan HuggingFace’te bir dizi dosya yayınladı. Bu dosyalar, görünüşte yeni bir açık kaynak büyük dil modeli (LLM) olan “miqu-1-70b” adını taşıyordu.
Bu makalenin yayınlandığı zamanda hala mevcut olan HuggingFace girişi, yeni LLM’nin “Prompt formatı“nın, kullanıcıların nasıl etkileşimde bulunduğuyla ilgili olduğunu belirtti. Mistral’in, şu anda birçok kişi tarafından en iyi performans gösteren açık kaynak LLM olarak görülen Mixtral 8x7b’nin arkasındaki iyi finanse edilmiş açık kaynak Paris merkezli yapay zeka şirketi tarafından geliştirilen bir versiyonu olan Meta’nın Llama 2’nin hassas ayarlı ve yeniden eğitilmiş bir versiyonu olduğu belirtilmiştir.
Aynı gün, 4chan’de (muhtemelen “Miqu Dev” adlı bir kullanıcı) anonim bir kullanıcı, miqu-1-70b dosyalarının bir bağlantısını paylaştı. 4chan, uzun süredir çevrimiçi meme’lerin ve toksisitenin meşhur buluşma noktası olmasıyla bilinir ve kullanıcılar burada bu bağlantıyı fark etmeye başladılar.
Bazı kişiler, bulunan modeli ve görünüşe göre olağanüstü performansını (benchmarks olarak bilinen testlerle ölçülen) ortak LLM görevlerinde Elon Musk’ın sosyal medya platformu olan X’te paylaştılar. Bu performans, önceki lider olan OpenAI’in GPT-4 modeline EQ-Bench üzerinde yaklaşmaktaydı.
Üstten onay
Nihayet bugün, bu olasılıklardan ikincisinin doğrulamasına sahip olduğumuz görünüyor: Mistral’in kurucu ortağı ve CEO’su Arthur Mensch, durumu açıklamak için X platformuna geçti: “Erken erişim müşterilerimizden birinin aşırı hevesli bir çalışanı, oldukça açık bir şekilde eğittiğimiz ve dağıttığımız eski bir modelin kantlanmış (ve işaretlenmiş) bir sürümünü sızdırdı…
Birkaç seçilmiş müşteri ile hızlı bir şekilde çalışmaya başlamak için, bu modeli Llama 2’den yeniden eğittik ve tüm kümemize erişim sağladığımız andan itibaren öğrenmeye başladık; ön eğitim Mistral 7B’nin piyasaya sürülme gününde tamamlandı. O günden bu yana iyi ilerleme kaydettik, takipte kalın!“
Gülünç bir şekilde, Mensch, yasadışı HuggingFace gönderisine bir kaldırma talebinde bulunmak yerine, posterın “atıf düşünmeyi” düşünebileceği bir yorum bırakmak için de gitmiş gibi görünüyor.
Yine de, Mensch’in “takipte kalın!” notu ile görünüşe göre Mistral, GPT-4 seviyesinde performans gösteren bu sözde “Miqu” modelini eğitiyor olabilir; aslında yorumları cömertçe değerlendirilirse, bu seviyede performansı eşleştirebilecek veya aşabilecek bir versiyona sahip olabilir.
Açık kaynak yapay zeka ve ötesinde dönüm noktası mı?
Bu, sadece açık kaynaklı generatif yapay zeka için değil, aynı zamanda genel yapay zeka ve bilgisayar bilimi alanı için bir dönüm noktası olabilir: Mart 2023’te piyasaya sürüldüğünden beri GPT-4, çoğu ölçüte göre dünyanın en güçlü ve en yüksek performanslı LLM’si oldu. Google’ın şu anda mevcut olan ve uzun süredir söylentileri süren Gemini modellerinden hiçbiri, şu ana kadar (bazı ölçülere göre, mevcut Gemini modellerinin aslında eski OpenAI GPT-3.5 modelinden daha kötü olduğu söyleniyor) onu geçmeyi başaramadı.
Önemli bir nokta şu ki, muhtemelen işlevsel olarak ücretsiz kullanılabilecek açık kaynaklı bir GPT-4 sınıfı modelin piyasaya sürülmesi, OpenAI ve abonelik seviyeleri üzerinde büyük rekabet baskısı yaratabilir. Özellikle daha fazla işletme, uygulamalarını beslemek için açık kaynak modellere veya açık kaynak ve kapalı kaynak karışımına yönelirken, VentureBeat’in kurucusu ve CEO’su Matt Marshall’un son zamanlarda bildirdiği gibi.
OpenAI, daha hızlı GPT-4 Turbo ve GPT-4V (görüntü) ile bir avantaj elde edebilir, ancak durum oldukça açık; açık kaynak yapay zeka topluluğu hızla yetişiyor. OpenAI’in, GPT Store ve diğer özellikleriyle bir “sur” oluşturacak kadar öncü ve lider olacak mı?