Yapay zeka araçlarının geliştirme aşamaları başından beri tartışma konusu oldu. İnsanlar ürettikleri içeriklerin yapay zekanın geliştirilmesinde kullanılmasından ve haklarının ihlal edilmesinden rahatsızlıklarını dile getiriyordu. OpenAI artık web tarayıcısının engellenebileceğini duyurdu.
OpenAI, web sitesi operatörlerinin sitelerinin Robots.txt dosyasında GPTBot tarayıcısına özellikle izin vermeyebileceğini veya IP adresini engelleyebileceğini söyledi. OpenAI blog gönderisinde, ”GPTBot kullanıcı aracısıyla taranan web sayfaları potansiyel olarak gelecekteki modelleri iyileştirmek için kullanılabilir ve ödeme duvarı erişimi gerektiren kaynakları kaldırmak için filtrelenir, kişisel olarak tanımlanabilir bilgiler (PII) topladığı veya politikalarımızı ihlal eden metinlere sahip olduğu bilinmektedir.” dedi.
Hariç tutulan kriterlere uymayan kaynaklar için, “GPTBot’un sitenize erişmesine izin vermek, AI modellerinin daha doğru olmasına ve genel yeteneklerini ve güvenliklerini geliştirmesine yardımcı olabilir.”
GPTBot’u engellemek, OpenAI’de internet kullanıcılarının büyük dil modellerini eğitmek için verilerinin kullanılmasını devre dışı bırakmalarına olanak tanıyan ilk adım olabilir. DeviantArt tarafından geçen yıl tasarlanan bir “NoAI” etiketi gibi, içeriği eğitimden çıkaracak bir bayrak oluşturmaya yönelik bazı erken girişimleri takip ediyor. Daha önce bir siteden kazınmış içeriği ChatGPT’nin eğitim verilerinden geriye dönük olarak kaldırmaz.
İnternet, OpenAI’nin GPT modelleri ve Google’ın Bard’ı gibi büyük dil modelleri için eğitim verilerinin çoğunu sağladı. Ancak OpenAI, verilerini sosyal medya gönderileri, telif hakkıyla korunan eserler veya internetin hangi bölümlerini bilgi için kazıdığını doğrulayıp almadığını doğrulamayacak. Ve AI eğitimi için veri tedarik etmek giderek daha tartışmalı hale geldi.
Reddit ve Twitter da dahil olmak üzere siteler, kullanıcılarının gönderilerinin AI şirketleri tarafından ücretsiz kullanımını engellemeye zorlarken, yazarlar ve diğer reklam öğeleri, çalışmalarının izinsiz kullanıldığı iddiasıyla dava açtı. Milletvekilleri ayrıca geçen ay AI düzenlemesiyle ilgili çeşitli Senato duruşmalarında veri gizliliği ve rıza sorularına tutunuyorlar.
Axios tarafından bildirildiği gibi, Adobe gibi şirketler, verileri bir anti-impersonation yasası aracılığıyla eğitim için değil olarak işaretleme fikrini ortaya attılar. OpenAI de dahil olmak üzere AI şirketleri, insanlara AI tarafından bir şey üretilip üretilmediğini bildirmek için bir filigran sistemi geliştirmek için Beyaz Saray ile bir anlaşma imzaladı, ancak eğitim için internet verilerini kullanmayı bırakma sözü vermedi.