Açık kaynaklı DeepSeek, sınır ötesi bir akıl yürütme yapay zeka modelinin mutlaka milyarlarca dolar gerektirmediğini ve mütevazı kaynaklarla gerçekleştirilebileceğini kanıtladı. Huawei, Oppo ve Vivo gibi devler tarafından hızla ticari olarak benimsenirken, Microsoft, Alibaba ve Tencent gibi şirketler de platformlarında hızla yer verdi. Şimdi, bu popüler Çinli şirketin bir sonraki hedefi, kendilerini geliştirmek için döngüsel bir yargıç-ödül yaklaşımı kullanan kendini geliştiren AI modelleri.
Kendini geliştiren yapay zeka modelleri
DeepSeek ve Çin’in Tsinghua Üniversitesi’ndeki araştırmacılar, yapay zeka modellerini kendi kendini geliştiren bir şekilde daha akıllı ve verimli hale getirebilecek yeni bir yaklaşımı açıklıyor. Altta yatan teknoloji, öz-ilkeli eleştiri ayarlama (SPCT) olarak adlandırılır ve yaklaşım teknik olarak üretken ödül modellemesi (GRM) olarak biliniyor.
En basit haliyle, gerçek zamanlı bir geri bildirim döngüsü oluşturmaya benzer. Bir AI modeli, eğitim sırasında modelin boyutunun ölçeklendirilmesiyle temelde iyileştirilir. Bu, çok fazla insan emeği ve bilgi işlem kaynağı gerektirir. DeepSeek, altta yatan “yargıcın”, kullanıcı sorgularına bir yanıt hazırlarken bir AI modeli için kendi eleştiri ve ilke setiyle geldiği bir sistem öneriyor.
Bu eleştiri ve ilkeler seti daha sonra bir AI modelinin kalbinde belirlenen statik kurallarla ve istenen sonuçla karşılaştırılır. Yüksek derecede bir eşleşme varsa, AI’nın bir sonraki döngüde daha da iyi performans göstermesi için etkili bir şekilde rehberlik eden bir ödül sinyali üretilir. Makalenin arkasındaki uzmanlar, kendi kendini geliştiren yeni nesil AI modellerine DeepSeek-GRM adını veriyor. Makalede listelenen kıyaslamalar, bu modellerin Google’ın Gemini, Meta’nın Llama ve OpenAI’nin GPT-4o modellerinden daha iyi performans gösterdiğini öne sürüyor. DeepSeek, bu yeni nesil AI modellerinin açık kaynak kanalı üzerinden yayınlanacağını söylüyor.