Araştırmacılar, ChatGPT’ye teknik sorular yöneltti. Gelen cevapların, O’Reilly kitaplarında geçen bölümlerle neredeyse birebir örtüştüğünü belirtti. Kitap içerikleri, örnek kodlar ve açıklamalar, kelime kelime modelden çıktı.
Bu kitaplar halka açık değil. O’Reilly, içeriklerine sadece abonelikle erişim sağlıyor. Bu nedenle, içeriklerin modelde yer alması ciddi telif ihlali anlamına geliyor.
OpenAI henüz bu iddialara resmi bir açıklama yapmadı. Ancak uzmanlar, bu durumun mahkeme sürecine evrilebileceğini söylüyor. Telif hakları yasaları, içerik sahibinin izni olmadan kullanım yapılmasını kesin şekilde yasaklıyor.
O’Reilly Media, teknoloji ve yazılım alanında en prestijli yayın evlerinden biri. Özellikle Python, Linux, veri bilimi ve yapay zekâ konularında yayımladığı kitaplar sektörde referans kabul ediliyor.
Araştırmacılar, denemelerinde farklı kitaplara ait bölümlerden alıntılar kullandı. ChatGPT, bu bölümlere benzer metinleri dakikalar içinde sundu. Bazı yanıtlar, noktasına virgülüne kadar orijinal metne uyuyordu.
Uzmanlar, bu durumun yapay zekâ dünyasında büyük bir güven krizine yol açabileceğini belirtiyor. Eğitim verilerinin şeffaflığı, uzun süredir tartışma konusu. Bu gelişme, tartışmaları alevlendirecek gibi duruyor.
Telif hakkı savunucuları, derhal soruşturma başlatılması gerektiğini savunuyor. Geliştiriciler ise modellerin eğitildiği verilerin kamuya açık olması gerektiğini vurguluyor.
OpenAI’nin daha önce bazı eğitim verilerini gizli tuttuğu biliniyor. Ancak bu seferki iddialar, çok daha büyük sonuçlar doğurabilir. Özellikle O’Reilly gibi büyük bir yayıncının adı geçince, işler daha da karmaşık bir hale geliyor.
Yakında OpenAI’den bir açıklama bekleniyor. Şirket, bu iddiaları doğrular ya da yalanlarsa, sürecin yönü tamamen değişebilir.