Yapay zeka kodlama sorunlarını çözemiyor

- Advertisement -

OpenAI araştırmacıları en iyi yapay zekanın bile kodlama sorunlarının “çoğunluğunu çözemediğini” buldu. OpenAI araştırmacıları, en gelişmiş yapay zeka modellerinin bile insan kodlayıcılarla baş edemediğini itiraf ettiler. CEO Sam Altman, bu yıl sonuna kadar ” alt seviye ” yazılım mühendislerini yenebileceklerini söylüyor.

Yapay zeka kodlama konusunda beklentiyi karşılamıyor

Araştırmacılar, serbest çalışan sitesi Upwork’ten 1.400’den fazla yazılım mühendisliği görevi üzerine inşa edilmiş SWE-Lancer adlı yeni geliştirilmiş bir kıyaslama kullandılar. Kıyaslamayı kullanarak OpenAI, üç büyük dil modelini (LLM) — kendi o1 akıl yürütme modeli ve amiral gemisi GPT-4o ve Anthropic’in Claude 3.5 Sonnet’ini — teste tabi tuttu.

Atık bazlı güneş pili yeni umut olacak!

Biyokütle türevi bir polimer kullanılarak yapılan hibrit organik-inorganik perovskit güneş hücresi (HPSC), yüzde 21,39'luk bir...

Özellikle, yeni ölçüt, LLM’lerin Upwork’teki iki tür görevle ne kadar iyi performans gösterdiğini değerlendirdi: hataları çözmeyi ve bunlara düzeltmeler uygulamayı içeren bireysel görevler veya modellerin uzaklaşıp daha üst düzey kararlar almaya çalışmasını sağlayan yönetim görevleri içeriyordu. Modellerin internete erişmesine izin verilmiyordu. Bu da çevrimiçi olarak yayınlanmış benzer cevapları kopyalayamayacakları anlamına geliyordu. Modeller, Upwork’te toplamda yüz binlerce dolar değerinde görevler üstlendiler, ancak yalnızca yüzeysel yazılım sorunlarını çözebildiler ve daha büyük projelerdeki hataları veya bunların temel nedenlerini gerçekten bulamadılar. Bu kalitesiz ve yarı pişmiş “çözümler”, daha yakından incelendiğinde genellikle dağılan, kendinden emin görünen bilgileri tükürmede harika olan AI ile çalışan herkese muhtemelen tanıdık gelecektir.

Makalede, her üç LLM’nin de “bir insandan çok daha hızlı” çalışabildiği belirtiliyor. Ancak, hataların ne kadar yaygın olduğunu kavrayamadıkları veya bunların bağlamını anlayamadıkları, “yanlış veya yeterince kapsamlı olmayan çözümlere yol açtığı” belirtiliyor.

Araştırmacıların açıkladığı gibi, Claude 3.5 Sonnet, kendisine karşı çıkan iki OpenAI modelinden daha iyi performans gösterdi ve o1 ve GPT-4o’dan daha fazla para kazandı. Yine de, cevaplarının çoğu yanlıştı ve araştırmacılara göre, gerçek hayattaki kodlama görevlerinde güvenilir olmak için herhangi bir modelin “daha yüksek güvenilirliğe” ihtiyacı olacaktı. Daha açık bir ifadeyle, makale bu öncü modellerin hızlı çalışıp yakınlaştırılmış görevleri çözebilmelerine rağmen, bunları insan mühendisler kadar yetenekli olmadıklarını gösteriyor.

Lityum metal pil sıfır yanma riskine sahip!

Uzay tabanlı kuantum sensörü gezegenimizi izleyecek

Kagi yapay zeka arama asistanı ile kolaylık sağlıyor

Katlanabilen e-kitap okuyucu bir ilk oldu!

Netflix yapay zeka ile keşfi iyileştiriyor

Kagi yapay zeka arama asistanı ile kolaylık sağlıyor

Netflix yapay zeka ile keşfi iyileştiriyor

Volkswagen dahili yapay zeka teknolojisini tanıttı

ChatGPT görüntülerle düşünme özelliği kazandı

Sentetik beyin girişimi 6 milyon dolar topladı

22 yaşındaki kripto dahisi 65 milyon dolarlık vurgunla kayıplara karıştı!

Çin, ABD’yi siber saldırı ile suçluyor!

Apple kullanıcı verilerini cihaz üzerinde analiz edecek

Yaya geçidi düğmeleri siber saldırı ile değiştirildi

OpenAI kimlik doğrulama isteyecek

Lonca Girişimcilik Merkezi’nin onuncu dönem programı tamamlandı

Sentetik beyin girişimi 6 milyon dolar topladı

Girişimcilere Özel Pazarlama Koçluğu

Türkiye’nin şarj istasyonu kapsamı genişleyecek

Oyun fonları girişimciler için yeni fırsatlar sunuyor

Fintech sektörüne videolu kimlik doğrulama geliyor

Fintek şirketi Sipay 78 milyon dolar yatırım aldı!

Akbank, AkTech teknoloji şirketini kurdu!

Flow48, Seri A turunda 69 milyon dolar yatırım aldı!

Buy Now Pay Later sistemleri ve e-ticaret

WhatsApp teknoloji tarihinin en kârlı satın alması mı?

Kalp yetmezliği tedavisinde yeni bir dönem!

KOSGEB Girişimlerini Seçiyor!

İstanbul’un merkezinde bir girişimcilik merkezi!

Future of Mobility’25 düzenlendi! Elektrifikasyon ve otonom teknolojiler sahnede

Yapay zeka kodlama sorunlarını çözemiyor

Yapay zeka kodlama konusunda beklentiyi karşılamıyor

Atık bazlı güneş pili yeni umut olacak!

SON VİDEO

WhatsApp teknoloji tarihinin en kârlı satın alması mı?

CEVAP VER İptal

SDN NETWORK