Meta, büyük dil modeli Llama 3‘ün yeni bir sürümünü beklenenden önce piyasaya sürebilir. The Information‘ın raporlarına göre, bu yeni model, önümüzdeki hafta içinde küçük bir versiyonla kullanıcılara sunulabilir. Tam açık kaynaklı modelin ise Temmuz ayında çıkması planlanıyor ve Claude 3 ve GPT-4 gibi rakip modellerle rekabet edebilecek yetenekte olduğu iddia ediliyor.
Instagram’ın sahibi olan Meta, Llama ve diğer yapay zeka modellerini eğitmek için büyük yatırımlar yapıyor. Bu çabalar arasında Nvidia’dan yüz binlerce H100 GPU satın alma gibi girişimler de bulunuyor.
Meta Llama 3, Claude Haiku veya Gemini Nano gibi modellerle rekabet edebilecek küçük boyutlu bir dil modelinden, GPT-4 veya Claude Opus gibi daha büyük tam yanıt ve muhakeme yeteneklerine sahip modellere kadar geniş bir yelpazede çeşitli boyutlarda gelecek. Ancak, Llama 3 hakkında detaylı bilgi bulunmamakla birlikte, açık kaynak kodlu olması ve metin ve görsel girdileri anlayabilen çok modlu bir model olması bekleniyor.
Meta Llama 3 farklı boyutlarda bir dizi sürümü olması muhtemel, bu da 7 milyar parametrelik küçük versiyonlardan 100 milyardan fazla parametre içeren büyük versiyonlara kadar değişebilir. Ancak, bu parametre sayısı hala GPT-4’ün eğitimi için kullanılan trilyonlarca parametreden daha küçük olacak.
Selefinin aksine, Llama 3’ün aşırı ılımlılık kontrolleri ve katı korkuluklar nedeniyle eleştirilere neden olan daha az ihtiyatlı bir yaklaşıma sahip olması bekleniyor.
Meta’nın bu yeni dil modeliyle ilgili detaylar, önümüzdeki hafta piyasaya sürülecek olan küçük versiyonunun kullanıcılar tarafından erken denendiğinde daha fazla netlik kazanacak.