Kasım ayında yapay zeka kurucuları ve yatırımcıları “ölçekleme yasalarının ikinci çağında” olduğumuzu söylediler. Ayrıca yapay zeka modellerini iyileştirmenin yerleşik yöntemlerinin azalan getiriler gösterdiğini belirttiler. Kazançları koruyabileceğini öne sürdükleri umut verici yeni yöntemlerden biri “test zamanı ölçeklemesi” idi. Bu, OpenAI’nin o3 modelinin performansının arkasında yatan şey gibi görünüyor – ancak kendi dezavantajlarıyla birlikte geliyor.
OpenAI o3 modeli yapay zeka ölçeklemesi
Yapay zeka dünyasının büyük bir kısmı, OpenAI’nin o3 modelinin duyurusunu, yapay zeka ölçekleme ilerlemesinin “duvara çarpmadığının” kanıtı olarak aldı. o3 modeli, ARC-AGI adı verilen genel yetenek testinde diğer tüm modellerden önemli ölçüde daha fazla puan alarak ve başka hiçbir yapay zeka modelinin %2’den fazla puan alamadığı zor bir matematik testinde %25 puan alarak kıyaslamalarda iyi bir performans gösterdi.
OpenAI’nin o serisi modellerinin ortak yaratıcısı Noam Brown yaptığı açıklamada, girişimin o1’i duyurmasının üzerinden sadece üç ay geçtikten sonra o3’ün etkileyici kazanımlarını duyurduğunu belirtti. Bu, performansta böylesine bir sıçrama için nispeten kısa bir zaman dilimi.
Brown, bir tweet’inde “Bu gidişatın devam edeceğine inanmak için her türlü nedene sahibiz” dedi. Anthropic’in kurucu ortağı Jack Clark, pazartesi günü yazdığı bir blog yazısında, o3’ün yapay zekanın “ilerlemesinin 2025’te 2024’ten daha hızlı olacağının” kanıtı olduğunu söyledi. Clark bir rakibi tamamlıyor olsa bile, yapay zeka ölçeklendirme yasalarının devam ettiğini öne sürmek, Anthropic’e fayda sağlıyor.
Clark, gelecek yıl AI dünyasının AI modellerinden daha fazla getiri elde etmek için test zamanı ölçeklendirme ve geleneksel ön eğitim ölçeklendirme yöntemlerini bir araya getireceğini söylüyor. Belki de Anthropic ve diğer AI modeli sağlayıcılarının, tıpkı Google’ın geçen hafta yaptığı gibi, 2025’te kendi akıl yürütme modellerini yayınlayacağını öne sürüyor.