Komedyen ve yazar Sarah Silverman, OpenAI ve Meta’nın AI modellerini eğitmek için eserlerini kendi rızası olmadan kullandığını iddia ediyor.
Komedyen ve yazar Sarah Silverman, 2017’deki bir Vergi Günü protestosunda burada görüldüğü gibi, aynı zamanda yazarlar Christopher Golden ve Richard Kadrey — OpenAI ve Meta’yı, her biri bir ABD Bölge Mahkemesinde, çifte telif hakkı ihlali iddiaları nedeniyle dava ediyorlar.
Davalar aralarında, OpenAI’nin ChatGPT’si ve Meta’nın LLaMA’sının yasadışı bir şekilde edinilmiş veri setlerinde eğitildiğini, eserlerini içeren bu veri setlerinin Bibliotik, Library Genesis, Z-Library ve diğer “gölge kütüphane” sitelerinden elde edildiğini belirtiyorlar, kitapların “torrent sistemleri aracılığıyla toplu olarak mevcut olduğunu” belirtiyorlar.
Golden ve Kadrey, dava hakkında yorum yapmayı reddetti, Silverman’ın ekibi ise sorulara herhangi bir yanıt vermedi.
ChatGPT Sarah Silverman eserlerini eğitim için kullanmış
OpenAI davasında, üçlü, ChatGPT’nin kitaplarını özetlediğini ve böylece telif haklarını ihlal ettiğini gösteren deliller sunuyor. Silverman’ın Bedwetter adlı kitabı, delillerde ChatGPT tarafından özetlenen ilk kitap olarak gösteriliyor, Golden’ın Ararat adlı kitabı da bir örnek olarak kullanılıyor, aynı şekilde Kadrey’in Sandman Slim adlı kitabı da. İddiada, sohbet botunun “davacıların yayınlanan eserleriyle birlikte sunduğu telif hakkı yönetim bilgilerini çoğaltmayı hiç düşünmediği” belirtiliyor.
Ayrı bir dava olan Meta’ya karşı olan dava, yazarların kitaplarının Meta’nın LLaMA modellerini eğitmek için kullandığı veri setlerine erişilebilir olduğunu iddia ediyor, bu da şirketin Şubat ayında tanıttığı açık kaynaklı AI Modeller dörtlüsüdür.
Şikayet, davacıların veri setlerinin yasadışı kökenlerine inandıkları nedenleri adımlar halinde açıklıyor – Meta’nın LLaMA’yı detaylandıran bir makalesinde, şirket eğitim veri setlerinin kaynaklarına işaret ediyor, bunlardan biri ThePile adında, EleutherAI adlı bir şirket tarafından derlenmiştir. Şikayet, ThePile’ın, bir EleutherAI makalesinde “Bibliotik özel izleyicinin içeriğinin bir kopyası”ndan bir araya getirildiği şeklinde tanımlanmış olduğunu belirtiyor. Davaya göre, Bibliotik ve diğer “gölge kütüphaneler” “açıkça yasadışıdır.”
Her iki iddiada da, yazarlar, “telif hakkı korumalı kitaplarının şirketlerin AI modelleri için eğitim materyali olarak kullanılmasına rıza göstermediklerini” belirtiyorlar. Davalarının her biri, çeşitli türden telif hakkı ihlalleri, ihmal, haksız zenginleşme ve haksız rekabeti içeren altı maddeden oluşuyor. Yazarlar, yasal tazminat, karların iadesi ve daha fazlasını arıyorlar.
Üç yazarı temsil eden avukatlar Joseph Saveri ve Matthew Butterick, LLMlitigation web sitesinde, “[ChatGPT’nin] telif hakkı korumalı metinsel materyallerde bulunan metine benzer metin üretme yeteneği hakkında endişeli olan yazarlar, yazarlar ve yayıncılardan duyduklarını” yazıyorlar.