OpenAI, model için genişletilmiş bir sürüme hazır hale getiren bir güvenlik azaltma yığını hazırladığını söylüyor.
DALL-E 3, ilk olarak geçen ay duyuruldu ve OpenAI, kullanıcıların görüntü oluşturucuyu beslemeleri için daha uzun ve daha görsel olarak tanımlayıcı istemler yazmak için ChatGPT‘den yararlanmalarına izin vererek önceki DALL-E 2‘yi nasıl geliştirdiğini gösterdi. Bing Chat ve Bing Image Generator‘a DALL-E 3 eklendi ve Microsoft‘un platformunu ChatGPT‘den bile önce modele daha geniş bir genel erişim sunan ilk platform haline getirdi.
Zararlı görüntüleri azaltmak için reklamı yapılan korkuluklar her zaman işe yaramadı; örneğin, bazı kullanıcılar Dünya Ticaret Merkezi ile ilgili istenmeyen görüntüler üretti. Microsoft belirli istemleri engelledikten sonra bile, diğer basit geçici çözümler benzer sonuçlar verdi.
Midjourney, Stable Diffusion ve eski DALL-E yinelemeleri gibi metin-görüntü oluşturucularının hepsi tartışmalardan adil bir pay aldı. Teknoloji, telif hakkı görüntü materyalleri, rıza dışı çıplaklar, deneklerin değişen etnik kökeni ve tanınmış kişilerin foto-gerçekçi yanlış beyanları çıktı.
OpenAI, bu sefer çok daha kapsamlı adımlar atacağına söz veriyor ve DALL-E 3‘e yapılan araştırmayı gösteren bir web sitesi sağlıyor. Şirket, modelin canlı sanatçılar, tanınmış kişilerin görüntüleri tarzında içerik üretme olasılığını sınırlayacak ve oluşturulan görüntüler arasında demografik temsili iyileştirecek. OpenAI ayrıca, bir görüntünün DALL-E 3 tarafından oluşturulup oluşturulmadığını algılamada yüzde 99 doğruluk sağlayabildiğini söylediği dahili bir “provenans sınıflandırıcı” aracına sahip.