Human or Not oyunu Turing test sonuçları paylaşıldı. Oynayan kişilerin yaklaşık yüzde 30’u, bir kişi ile yapay zeka arasındaki farkı anlayamadı.
Adını bilgisayar bilimcisi Alan Turing‘den alan Turing testi, bir makinenin testi yapan kişiyi kandıracak kadar iyi bir insan gibi davranıp davranamayacağını belirlemeye çalışıyor. Human or Not adlı çevrimiçi bir oyun, insanlara benzer bir meydan okuma sundu ve sonuçlar geldi.
Yaklaşık bir ay önce başlatılan Human or Not, birisiyle iki dakika sohbet etmenizi ve ardından bunun başka bir insan mı yoksa bir yapay zeka botu mu olduğunu anlamaya çalışmanızı istiyor. Meydan okumayı kabul ederken, istediğiniz soruyu sorabilir veya istediğiniz yanıtı verebilirsiniz. Ancak iki dakika dolduğunda, diğer uçta kimin veya neyin olduğunu tahmin etmeniz gerekiyor.
Turing testi oyunu
Şimdiye kadar kaydedilen en büyük Turing testlerinden birinde milyonlarca konuşma oluşturduktan sonra geliştirici AI21 Labs, oyunu deneyen kişilerin yüzde 32’sinin bir insan ile bot arasındaki farkı anlayamadığını ve geriye doğru anlayanların yüzde 68’inin kaldığını tespit etti.
Genel olarak, insanlar başka bir kişiyi tanımlamaya çalışırken daha kolay zaman geçirdi. Bir insanla sohbet ederken, katılımcılar zamanın yüzde 73’ünde doğru yanıtı aldı. Ancak bir robotla konuşurken, zamanın yalnızca yüzde 60’ını doğru tahmin etti.
17 farklı ülke arasında, Fransa yüzde 71 ile en yüksek doğru tahmin yüzdesini elde ederken, Hindistan yüzde 63,5 ile en düşük puanı aldı. Amerika Birleşik Devletleri yüzde 67 ile orta sıralara doğru gelirken, İngiltere yüzde 67,5, İtalya yüzde 67 ve Rusya yüzde 66 ile puan aldı.
Human or Not, kullanıcılarına meydan okumak için GPT-4 ve AI21 Labs’ın kendi Jurassic-2’si gibi en büyük dil modellerine (LLM’ler) dayalı bir AI botu kullandı. Bu tür LLM’ler, sohbet robotlarının ve diğer yapay zeka araçlarının daha insan benzeri metinler oluşturmasına yardımcı olmak için derin öğrenmeye güveniyor. AI21, bu modelleri kullanmanın ötesinde, her oyunda farklı bir bot karakteri yaratacak bir çerçeve geliştirdi. Katılımcılar, insanı bottan ayırmaya çalışmak için birkaç numaraya başvurdu. Ancak iyi eğitimli ve bilgili yapay zeka ile bu numaralar her zaman işe yaramadı.
AI21 Labs, bulguları daha ayrıntılı olarak inceleyeceğini ve projede diğer önde gelen yapay zeka araştırmacıları ve laboratuvarlarıyla birlikte çalışacağını söyledi. Amaç, kamuoyunun, araştırmacıların ve politika yapıcıların yapay zekayı yalnızca üretkenlik araçları olarak değil, aynı zamanda çevrimiçi dünyanın gelecekteki üyeleri olarak daha iyi anlamalarına yardımcı olmak.