Teksas Üniversitesi’nden araştırmacılar, sokakların seslerinden gerçek görüntüleri oluşturabilen yeni bir yapay zeka sistemi geliştirdi. “Ses Manzarasından Görüntüye Yayılma Modeli” adlı bu sistem, sokaklardaki ses kayıtlarından, o sokakların gerçek görüntülerini son derece yüksek bir doğrulukla üretmeyi başarıyor.
Sokakların sesinden görüntüsünü oluşturan yapay zeka geliştirildi
Sistem, Kuzey Amerika, Asya ve Avrupa’daki çeşitli kentsel ve kırsal bölgelerden alınan 10 saniyelik sesli-görsel kliplerle eğitildi. Bu klipler, YouTube videolarındaki durağan görüntüler ve çevresel seslerden oluşuyor. Derin öğrenme algoritmaları, seslerin hangi görsel öğelere karşılık geldiğini öğrenerek, eğitim sürecini tamamladı.
Eğitimden sonra sistem, sadece ortam seslerine dayanarak 100 farklı sokak görüntüsü oluşturdu. Bu görüntüler, bir grup jüri üyesi tarafından orijinal ses kaydına dayalı olarak %80 doğrulukla tanımlandı. Ayrıca yapılan bilgisayar analizinde, oluşturulan görüntülerin, orijinal videolardaki gökyüzü, yeşil alanlar ve binalar gibi unsurlarla güçlü bir ilişki gösterdiği belirlendi. Hatta bazı durumlarda, oluşturulan görüntüler güneşli, bulutlu veya gece gibi ışık koşullarını da doğru bir şekilde yansıttı.
Bu yapay zekanın, adli uygulamalarda ses kaydının nerede yapıldığını anlamak gibi potansiyelleri olsa da, bilim insanları bu çalışmanın amacını daha çok sesin yer algısı üzerindeki etkilerini keşfetmek olarak tanımlıyorlar. Ayrıca, sesin görsel algı ile birleşerek insan ruh sağlığı ve kentsel tasarım üzerinde nasıl bir etkisi olabileceği konusunda önemli bilgiler sağladığı düşünülüyor. Bu teknoloji, toplumların yaşam kalitesini artırmaya yönelik yeni tasarımlar için rehber olabilir.