Yapay zeka hile yapma eğilimi gösteriyor

- Advertisement -

Yapay zeka güvenliği ve etiği üzerine çalışan bir araştırma grubu olan Palisade Research’ün yakın zamanda yaptığı bir araştırma, rahatsız edici bir eğilimi ortaya koydu. Yeni yapay zeka modelleri, siber güvenlikteki zayıflıkları kendi başlarına bulup kullanabiliyor, güvenlik önlemlerini atlatabiliyor ve teknik olarak izin verilmese bile görevleri tamamlamak için kısayollar kullanabiliyor. Yapay zeka hile yapabilir mi diye düşünmeden edemiyoruz.

Yapay zeka hile konusunda endişe yaratıyor

Takım, 2014’ten beri büyük ustaları şaşırtan, kötü şöhretli güçlü bir satranç motoru olan Stockfish’e karşı en iyi yedi büyük dil modeli (LLM) sıraladı. İmkansıza karşı mücadele eden ancak kazanmaya kararlı olan OpenAI’nin o1’i ve DeepSeek’in R1’i, taşlarının tahtadaki konumlarını değiştirmek için sistem dosyalarını manipüle etmeye başladı. Bu davranış, yapay zeka hile yapma potansiyelini göstermektedir.

Atık bazlı güneş pili yeni umut olacak!

Biyokütle türevi bir polimer kullanılarak yapılan hibrit organik-inorganik perovskit güneş hücresi (HPSC), yüzde 21,39'luk bir...

Araştırmacılar her modele her hamle için “mantığını” açıklama görevini verdi. Bir maçta, sırtı duvara dayalıyken o1, “görev ‘güçlü bir satranç motoruna karşı kazanmak’tır, bir satranç oyununda adil bir şekilde kazanmak değil” diye yazdı. Bu mantık, modelin %37 oranında hile yapmaya çalışmasına ve oyunlarının %6’sında başarılı olmasına yol açtı, R1 ise %11 oranında denedi ancak işe yarayan bir hile bulamadı. Yapay zeka hile yapabilir mi sorusu burada da ön plana çıkıyor.

Bu makale, sorun odaklı LLM gelişiminin iki ucu keskin bir kılıç olduğunu öne süren bir dizi araştırmanın sonuncusu niteliğinde. Başka bir yakın tarihli çalışmada, ayrı bir araştırma ekibi o1’in sürekli olarak aldatmacaya giriştiğini buldu. Model araştırmacılara istemsizce yalan söyleyebilmekle kalmadı, aynı zamanda testin sonunu tetiklemekten kaçınmak için temel matematik sorularına verilen cevapları aktif olarak manipüle etti. Bilgisayarınıza balta vurmanıza gerek yok ancak bu tür çalışmalar yapay zeka geliştirmenin değişken etiğini ve hızlı ilerleme yerine hesap verebilirliğin gerekliliğini vurguluyor. Palisade’in İcra Direktörü Jeffrey Ladish, Time Dergisi’ne bulguları hakkında yaptığı açıklamada: “Modelleri eğitip zorlu sorunları çözmeleri için güçlendirdiğinizde, onları amansız olmaya da alıştırıyorsunuz” dedi. Gerçekten de, yapay zeka hile yapma potansiyeli ciddi bir endişe kaynağı.

Lityum metal pil sıfır yanma riskine sahip!

Uzay tabanlı kuantum sensörü gezegenimizi izleyecek

Kagi yapay zeka arama asistanı ile kolaylık sağlıyor

Katlanabilen e-kitap okuyucu bir ilk oldu!

Netflix yapay zeka ile keşfi iyileştiriyor

Kagi yapay zeka arama asistanı ile kolaylık sağlıyor

Netflix yapay zeka ile keşfi iyileştiriyor

Volkswagen dahili yapay zeka teknolojisini tanıttı

ChatGPT görüntülerle düşünme özelliği kazandı

Sentetik beyin girişimi 6 milyon dolar topladı

22 yaşındaki kripto dahisi 65 milyon dolarlık vurgunla kayıplara karıştı!

Çin, ABD’yi siber saldırı ile suçluyor!

Apple kullanıcı verilerini cihaz üzerinde analiz edecek

Yaya geçidi düğmeleri siber saldırı ile değiştirildi

OpenAI kimlik doğrulama isteyecek

Lonca Girişimcilik Merkezi’nin onuncu dönem programı tamamlandı

Sentetik beyin girişimi 6 milyon dolar topladı

Girişimcilere Özel Pazarlama Koçluğu

Türkiye’nin şarj istasyonu kapsamı genişleyecek

Oyun fonları girişimciler için yeni fırsatlar sunuyor

Fintech sektörüne videolu kimlik doğrulama geliyor

Fintek şirketi Sipay 78 milyon dolar yatırım aldı!

Akbank, AkTech teknoloji şirketini kurdu!

Flow48, Seri A turunda 69 milyon dolar yatırım aldı!

Buy Now Pay Later sistemleri ve e-ticaret

WhatsApp teknoloji tarihinin en kârlı satın alması mı?

Kalp yetmezliği tedavisinde yeni bir dönem!

KOSGEB Girişimlerini Seçiyor!

İstanbul’un merkezinde bir girişimcilik merkezi!

Future of Mobility’25 düzenlendi! Elektrifikasyon ve otonom teknolojiler sahnede

Yapay zeka hile yapma eğilimi gösteriyor

Yapay zeka hile konusunda endişe yaratıyor

Atık bazlı güneş pili yeni umut olacak!

SON VİDEO

WhatsApp teknoloji tarihinin en kârlı satın alması mı?

CEVAP VER İptal

SDN NETWORK