Google, insanlara telefon verilerini ve fotoğraflarını kullanarak hayat hikayelerini anlatmak için Gemini AI projesini değerlendiriyor. “Project Ellmann”, kullanıcıların hayat hikayelerine “kuş bakışı” bakmalarına yardımcı olmak için yapay zekayı kullanmayı amaçlayan dahili bir Google teklifi. Buradaki fikir, arama sonuçlarını almak, kullanıcının fotoğraflarındaki desenleri tespit etmek, bir sohbet robotu oluşturmak ve bir kişinin hayatıyla ilgili “daha önce imkansız olan soruları yanıtlamak” için Gemini gibi yüksek lisans eğitimlerini kullanmak olacak. Ekip ayrıca, “ChatGPT’yi açtığınızı hayal edin, ancak o zaten hayatınızla ilgili her şeyi biliyor.” açıklamasıyla “Ellmann Chat”i de gösterdi.
Google Gemini AI ile hayat hikayeleri tasarlayacak
Google’daki bir ekip, fotoğraf ve arama gibi cep telefonu verilerini kullanarak kullanıcıların hayatlarının “kuşbakışı” görünümünü oluşturmak için yapay zeka teknolojisinin kullanılmasını önerdi. Biyografi yazarı ve edebiyat eleştirmeni Richard David Ellmann’ın anısına “Proje Ellmann” olarak adlandırılan fikir, arama sonuçlarını almak, kullanıcının fotoğraflarındaki desenleri tespit etmek, bir sohbet robotu oluşturmak ve “daha önce imkansız olan soruları yanıtlamak” için Gemini gibi yüksek lisans eğitimlerini kullanmak olacak. Ellmann’ın amacının “Hayat Hikayenizi Anlatıcınız” olmak olduğu belirtiliyor.
Şirketin bu özellikleri Google Fotoğraflar’da mı yoksa başka bir üründe mi üretmeyi planladığı belli değil. Şirketin bir blog gönderisine göre Google Fotoğraflar’da 1 milyardan fazla kullanıcı ve 4 trilyon fotoğraf ve video bulunuyor. Project Ellman, Google’ın ürünlerini yapay zeka teknolojisiyle oluşturmak veya geliştirmek için önerdiği birçok yoldan yalnızca biri. Çarşamba günü Google, bazı durumlarda OpenAI’nin GPT-4′ünden daha iyi performans gösteren en yeni “en yetenekli” ve gelişmiş yapay zeka modeli olan Gemini’yi piyasaya sürdü . Şirket, Gemini’yi Google Cloud aracılığıyla geniş bir müşteri kitlesine kendi uygulamalarında kullanmaları için lisanslamayı planlıyor. Gemini’nin öne çıkan özelliklerinden biri de çok modlu olmasıdır, yani resimler, video ve ses de dahil olmak üzere metnin ötesindeki bilgileri işleyebilir ve anlayabilir.
Sunumda, Ellmann’ın biyografileri, önceki anları ve sonraki fotoğrafları kullanarak kullanıcının fotoğraflarını “yalnızca etiketler ve meta veriler içeren piksellerden” daha derinlemesine tanımlayabildiği belirtiliyor. Üniversite yılları, Körfez Bölgesi yılları ve ebeveyn olarak geçirilen yıllar gibi bir dizi anı tanımlayabilmeyi öneriyor.