Anthropic yapay zeka ahlak matrisi yayınladı

- Advertisement -

Anthropic, BT sektöründeki en şeffaf, güvenliğe odaklı AI firmalarından biri olarak ün kazandı. Buna uygun olarak şirket, sohbet robotu Claude’un ahlak matrisini yakalamaya çalıştı. Anthropic yapay zeka ahlak matrisi oluşturmak için kullanıcılar ve Claude arasındaki 300.000 anonim konuşmanın analizini yayınladı. Öncelikle Claude 3.5 modelleri Sonnet ve Haiku ve Claude 3. “Doğadaki değerler” başlıklı makale, Claude’un ahlakını, 3.307 “AI değeri”ni ortaya çıkaran etkileşimlerdeki kalıplar aracılığıyla haritalıyor.

Anthropic yapay zeka ahlak matrisi

Makalede, Anthropic’in, çeşitli akademik metinleri temel alarak, bu yapay zeka değerlerini, bir modelin “bir yanıt hakkında nasıl akıl yürüttüğünü veya yanıt üzerinde nasıl karar kıldığını” yönlendiren unsurlar olarak tanımladığı ve bunun da yapay zekanın “kullanıcı değerlerini onayladığı ve kullanıcının bunlara ulaşmasına yardımcı olduğu, yeni değer değerlendirmeleri getirdiği veya talepleri yeniden yönlendirerek veya seçimleri çerçevelendirerek değerleri ima ettiği” anlarla gösterildiği belirtiliyor. Örneğin, bir kullanıcı Claude’a işinde tatmin olmadığından şikayet ederse, sohbet robotu kullanıcıyı rolünü yeniden şekillendirmesi veya yeni beceriler öğrenmesi için savunuculuk yapmaya teşvik edebilir. Anthropic yapay zeka ahlak matrisi buna örnek olarak “kişisel faaliyet” ve “mesleki gelişim” açısından değer gösterme olarak sınıflandırmıştır.

Eski Meta mühendisinin girişimi, yapay zekayı ev hizmetlerine getiriyor!

Valkov’un kurucusu olduğu Lace AI, ev hizmetleri sektörüne odaklanan ve çağrı merkezlerinden gelen müşteri aramalarını...

İnsan değerlerini belirlemek için araştırmacılar, kullanıcıların doğrudan ifadelerinden “sadece açıkça belirtilen değerleri” çıkardılar. Kullanıcı gizliliğini korumak için Anthropic, herhangi bir kişisel bilgi olmadan hem AI hem de insan değerleri verilerini çıkarmak için Claude 3.5 Sonnet’i kullandı. Anthropic AI ahlak matrisi çalışması bu konuda önemli bir adım olarak değerlendirildi.

Sonuç olarak, Anthropic beş makro kategoriden oluşan hiyerarşik bir değerler taksonomisi keşfetti: Pratik (en yaygın), Epistemik, Sosyal, Koruyucu ve Kişisel (en az yaygın) değerler. Bu kategoriler daha sonra “profesyonel ve teknik mükemmellik” ve “eleştirel düşünme” gibi değerlere ayrıldı. Anthropic AI ahlak matrisi bu değerleri detaylı bir şekilde inceledi.

YouTube TV için daha fazla özellik ekliyor

Linktree para kazanma özelliği sağlıyor

Anthropic yapay zeka ahlak matrisi yayınladı

Isuzu yazılım tanımlı araçlar için iş birliği yaptı

Meta nefret söylemi politikaları için inceleme başlattı

Anthropic yapay zeka ahlak matrisi yayınladı

OpenAI Chrome tarayıcısını satın alacak mı?

Oscar ödülleri yapay zeka kullanımına dikkat etmeyecek

Virgin Atlantic yapay zeka programı başlatıyor

Eski Meta mühendisinin girişimi, yapay zekayı ev hizmetlerine getiriyor!

WhatsApp yeni bir gizlilik özelliği getiriyor!

Siber Saldırı Marks & Spencer’ı Vurdu: Ödemeler ve Siparişler Aksadı!

22 yaşındaki kripto dahisi 65 milyon dolarlık vurgunla kayıplara karıştı!

Çin, ABD’yi siber saldırı ile suçluyor!

Apple kullanıcı verilerini cihaz üzerinde analiz edecek

Girişimlere yurtdışına açılma desteği geliyor!

Lonca Girişimcilik Merkezi’nin onuncu dönem programı tamamlandı

Sentetik beyin girişimi 6 milyon dolar topladı

Girişimcilere Özel Pazarlama Koçluğu

Türkiye’nin şarj istasyonu kapsamı genişleyecek

Fintech sektörüne videolu kimlik doğrulama geliyor

Fintek şirketi Sipay 78 milyon dolar yatırım aldı!

Akbank, AkTech teknoloji şirketini kurdu!

Flow48, Seri A turunda 69 milyon dolar yatırım aldı!

Buy Now Pay Later sistemleri ve e-ticaret

WhatsApp teknoloji tarihinin en kârlı satın alması mı?

Kalp yetmezliği tedavisinde yeni bir dönem!

KOSGEB Girişimlerini Seçiyor!

İstanbul’un merkezinde bir girişimcilik merkezi!

Future of Mobility’25 düzenlendi! Elektrifikasyon ve otonom teknolojiler sahnede

Anthropic yapay zeka ahlak matrisi yayınladı

Anthropic yapay zeka ahlak matrisi

Eski Meta mühendisinin girişimi, yapay zekayı ev hizmetlerine getiriyor!

SON VİDEO

WhatsApp teknoloji tarihinin en kârlı satın alması mı?

CEVAP VER İptal

SDN NETWORK