OpenAI iddiasına göre “görüntülerle düşünme” yeteneğine sahip birkaç yeni akıl yürütme modeli ortaya çıkardı. o3 ve o4-mini modelleri, görüntüleri yorumlama ve düzenleme ve modelin çıktısını iyileştirmek için herhangi bir bilgiyi alma konusunda güçlü yeteneklerle karakterize edilir. Eş zamanlı olarak, yetenekli modeller, ChatGPT’yi fotoğraflarda gösterilen konumları belirlemek için kullanma, yani coğrafi konum belirleme gibi eğlenceli yan görevleri beslemek için de kullanılıyor. Bu, sorumlu bir şekilde kullanılmazsa gizlilik kabusuna dönüşebilir.
ChatGPT görüntülerle düşünme ile hareket ediyor
Modellerin yayınlanmasının ardından uzman kullanıcılar, sınırlı ek girdilerle fotoğraflardaki konumları belirleme yeteneklerini fark ettiler. İki modelden o3 bu beceride yetenekli görünüyor ve ChatGPT tarafından başlatılan bir başka viral trendin kökenlerine tanıklık ediyor olabiliriz.
Modeller, bilgileri çıkarmak için görüntüleri düzenleyebilir, kırpabilir veya yakınlaştırabilir. Birçok örnek, insanlar da dahil olmak üzere engeller olsa bile Dünya yüzeyindeki herhangi bir noktayı (muhtemelen) konumun merkezi cazibesine yerleştirme yeteneğini göstermektedir. Model, yerin adıyla birlikte kesin coğrafi koordinatlarla yanıt veriyor gibi görünüyor ve bu numara iç mekan görüntülerinde de işe yarıyor gibi görünüyor.
Wharton yardımcı profesörü Ethan Mollick, modelin fotoğraflardan coğrafi etiketli bilgileri çekmediğini ve bunun yerine tüm düşünmeyi kendi başına yaptığını doğruladı. Herhangi bir AI modeli gibi, özellikle tek bir resim gibi sınırlı ipuçlarıyla yanlış yanıtlar vermeye eğilimlidir. Ancak konumu ilk seferde yanlış ayarlasa bile, model doğru konumu belirlediğini doğrulayana kadar görüntüleri sürekli olarak dilimlemeye çalışır, bunu X kullanıcısı Brett Cooper göstermiştir.
Coğrafi konum belirleme eğlenceli ve oyunbaz bir aktivite olsa da , büyük ölçüde uzmanlarla sınırlıydı ve umuyoruz ki, bu uzmanlar tek bir fotoğraftan tam coğrafi konumu sorumlu bir şekilde tahmin etmek için süper yeteneklerini kullanırlar. Ancak, ChatGPT’nin son güncellemesi, en yeni modellere erişimi olan herkes için süreci zahmetsiz ve kolay hale getiriyor.