Yapay zekâ (AI) teknolojisi, insan zekâsını taklit etme konusundaki yetenekleriyle yine gündemde. Araştırmacılar, ChatGPT’nin arkasındaki yapay zekâ olan GPT-4’ün, ünlü Turing testini geçtiğini iddia etti. Bu iddia, çoğu kişinin ChatGPT’nin yanıtlarını bir insanınkinden ayırt edemediğini öne sürüyor.
Yapay zekâ ile olan etkileşimlerimiz hiç olmadığı kadar arttı. Araştırmacılar, insanlarla farklı türde üç yapay zekâ modelinin (AI) etkileşimlerini karşılaştırarak, insanların bu yanıtları ayırt edip edemeyeceklerini görmek için bir test gerçekleştirdi.
1950 yılında bilgisayar bilimcisi Alan Turing tarafından “taklit oyunu” olarak önerilen Turing testi, bir makinenin zekâsının insan zekâsından ayırt edilemez olup olmadığını belirler. Bir makinenin Turing testini geçmesi için, biriyle konuşarak onları insan olduğuna inandırması gerekir.
Yapay zekayı insan sananlar çoğunlukta
Bilim insanları, bu testi yeniden yapmak amacıyla 500 kişiye dört farklı yanıtlayıcı ile konuşmalarını sağladı. Bu yanıtlayıcılar arasında bir insan, 1960’ların AI programı ELIZA, GPT-3.5 ve ChatGPT’nin gücünü aldığı GPT-4 yer aldı. Konuşmalar beş dakika sürdü ve ardından katılımcılar, konuştuğu kişinin insan mı yoksa AI mı olduğunu belirtmek zorunda kaldı. 9 Mayıs’ta pre-print arXiv sunucusunda yayımlanan çalışmada, katılımcıların GPT-4’ü %54 oranında insan olarak değerlendirdikleri ortaya çıktı.
ELIZA, büyük dil modeli (LLM) veya sinir ağı mimarisi olmaksızın önceden programlanmış yanıtlar içeren bir sistem, %22 oranında insan olarak değerlendirilirken; GPT-3.5 %50 ve insan katılımcı %67 oranında insan olarak değerlendirildi.
IEEE’den AI araştırmacısı Nell Watson, “Makineler, insanlar gibi, duruma uygun nedenler uydurabilir, bilişsel önyargılara kapılabilir ve manipüle edilebilir hale geliyor. Bu unsurlar, AI sistemlerinde insan benzeri zaaflar ve tuhaflıklar ifade ediliyor ve bu da onları önceki yaklaşımlardan daha insan benzeri yapıyor” dedi.
Bu çalışma, AI ajanlarının Turing testini geçme çabalarının on yıllardır süren çalışmalarına dayansa da, AI sistemlerinin insan olarak algılanmasının yaygın sosyal ve ekonomik sonuçlar doğuracağına dair ortak endişeleri yineledi.
Bilim insanları ayrıca Turing testinin çok basit bir yaklaşım olduğuna dair geçerli eleştiriler olduğunu savundu ve “stilistik ve sosyal-duygusal faktörlerin, Turing testini geçmede geleneksel zekâ anlayışlarından daha büyük bir rol oynadığını” söyledi. Bu, makine zekâsını yanlış yerde aradığımızı gösteriyor.
Watson, çalışmanın gelecekteki insan-makine etkileşimleri için bir meydan okuma teşkil ettiğini ve özellikle hassas konularda gerçek doğası hakkında giderek daha paranoyak olacağımızı belirtti. Ayrıca çalışma, GPT döneminde AI’nın nasıl değiştiğini de vurguluyor.
“ELIZA, önceden belirlenmiş yanıtlarla sınırlıydı, bu da yeteneklerini büyük ölçüde sınırlıyordu. Birini beş dakika boyunca kandırabilir, ancak yakında sınırlamaları belirgin hale gelirdi,” dedi. “Dil modelleri, geniş bir konu yelpazesine yanıt verebilme, belirli dillerde veya sosyolektlerde konuşabilme ve kendilerini karakter odaklı kişilik ve değerlerle ortaya koyabilme konusunda sınırsız esneklik sunar. İnsan tarafından ne kadar zekice ve dikkatlice programlanmış olursa olsun, bu, el yapımı bir şeyden çok daha büyük bir adımdır.”