Yapay zeka artık çizimlerden yeni yazılımlar oluşturabiliyor!

Alp Mülayimsi

1 yıl önce

Çarşamba günü, “tldraw” adlı bir beyaz tahta uygulama üreticisi, kullanıcıların bir yazılımın görüntüsünü çizmesine ve bunu yapay zeka kullanarak hayata geçirmesine olanak tanıyan “Make it Real” adlı yazılım özelliğinin prototipini yayınlayarak internette ses getirdi. Bu özellik, bir vektör çizimi, kullanıcı arayüzlerini kopyalayabilen ve hatta Breakout gibi oyunların basit uygulamalarını oluşturabilen işlevsel Tailwind CSS ve JavaScript web koduna görsel olarak yorumlamak için OpenAI’ın GPT-4V API’ını kullanıyor.

Tasarımcı Kevin Cannon, ekrandaki nesneleri döndüren işlevsel kaydırıcıların, nesne renklerini değiştirmek için bir arayüzün ve çalışan bir tik oyununun oluşturulmasını içeren viral bir X başlığının başında “Sanırım uzanmam gerekiyor” diye bir paylaşımda bulundu. Kısa süre sonra başkaları da bunu Breakout’un bir kopyasını çizme, tik tak eden çalışan bir kadranlı saat oluşturma, yılan oyununu çizme, Pong oyunu yapma, görsel durum tablosunu yorumlama ve çok daha fazlasını içeren şeylerle takip etti.

Kullanıcılar çevrimiçi olarak Make It Real’ın canlı demosunu deneyebilir. Ancak bunu çalıştırmak, OpenAI’den bir API anahtarı sağlamayı gerektirir ve bu büyük bir güvenlik riskidir. Başkaları API anahtarınızı ele geçirirse, bunu adınıza çok büyük bir fatura kesmek için kullanabilirler. Teknik açıdan bilgi sahibi olanlar kodu yerel olarak çalıştırabilir ancak yine de OpenAI API erişimi gerektirecektir.

Londra’da Steve Ruiz tarafından geliştirilen Tldraw, açık kaynaklı, işbirliğine dayalı bir beyaz tahta aracı. Oturum açmaya gerek kalmadan çizim, metin ve medya için temel, sonsuz bir tuval sunuyor. 2021’de başlatılan proje, 2,7 milyon dolarlık başlangıç finansmanı aldı ve çeşitli sponsorlar tarafından destekleniyor. GPT-4V API yakın zamanda piyasaya sürüldüğünde Ruiz, AI destekli işlevselliği tldraw’a getirmek için Sawyer Hood tarafından oluşturulan “draw-a-ui” adlı bir tasarım prototipini entegre etmişti.

GPT-4V, OpenAI’ın görsel görüntüleri yorumlayabilen ve bunları bilgi sistemi olarak kullanabilen geniş dil modelinin bir sürümü. Yapay zeka uzmanı Simon Willison’ın X’te açıkladığı gibi Make it Real, “çizilen bileşenlerin base64 kodlu bir PNG’sini oluşturup ardından bunu bir sistem istemi ve Tailwind kullanarak görüntüyü bir dosyaya dönüştürme talimatlarıyla birlikte GPT-4 Vision’a aktararak” çalışıyor. Aslında, GPT-4V’ye girişleri nasıl işleyeceğini ve bunları çalışan koda nasıl dönüştüreceğini söyleyen tam sistem istemi internette bulunabilir.

Daha fazla kişi GPT-4V’yi deneyip onu diğer çerçevelerle birleştirdikçe, önümüzdeki haftalarda muhtemelen OpenAI’ın vizyon ayrıştırma teknolojisinin daha yeni uygulamalarının ortaya çıktığını göreceğiz. Yine Çarşamba günü bir geliştirici, ayrı olarak ele aldığımız sahte yapay zeka tarafından oluşturulan David Attenborough sesiyle bir video akışının canlı, gerçek zamanlı anlatımını oluşturmak için GPT-4V API’ı kullandı.

Şimdilik, bize, çalışan bir prototip oluşturmanın görsel bir model oluşturmak ve bir yapay zekaya sahip olmak kadar basit olduğu, gelecekteki olası bir yazılım geliştirme modunun (veya en azından arayüz tasarımının) bir önizlemesi verilmiş gibi geliyor. Geliştirici Michael Dubakov’un kendi Make It Real eserini sergilerken yazdığı gibi, “Tamam, @tldraw resmen çılgınlık. 5 yıl içinde geldiğimiz nokta gerçekten ilginç… Artık inovasyon hızına ayak uyduramıyorum.”