Son dönemlerde yapay zeka alanında önemli gelişmeler yaşanıyor. Geçtiğimiz aylarda OpenAI, yapay zeka aracı ChatGPT’yi kullanıma sundu. Bu adım, bu alanda resmen bir yarış başlattı. Microsoft ve Google gibi teknoloji devleri bu yarışa dahil olmak için çalışmalar yürütüyor. Son olarak Google, OpenAI’ın dil modeli GPT’ye rakip olan Gemini’yi tanıttı. Peki Google Gemini özellikleri neler? GPT 4’e göre ne gibi farkları var? İşte tüm detaylar…
Google Gemini özellikleri
Google’ın kısa süre önce gerçekleştirdiği etkinlikte tanıttığı Gemini, geniş kullanım yelpazesinde hizmet verecek. Bu kapsamda dil modelinin üç farklı versiyon bulunuyor. Bunlar sırasıyla Gemini Ultra, Gemini Pro ve Gemini Nano.
En hafif versiyon olan Gemini Nano, Android cihazlarda çalıştırılmak üzere sunuldu. Gemini Pro, Google Bard da dahil olmak üzere şirketin yapay zeka araçlarına güç verecekken, aralarından en büyüğü olan Gemini Ultra ise veri merkezi ve kurumsal uygulamalar için tasarlandı.
Google CEO’su Sundar Pichai ve Kurucu Ortağı Demis Hassabis liderliğindeki Google DeepMind ekibi tarafından geliştirilen Gemini, özellikle metin, ses, görüntü, video ve yazılım kodu gibi farklı türlerde verileri işleyebiliyor. Python, Java, C++ ve Go gibi dünyanın en popüler programlama dillerinde yazılan kodları anlayabiliyor ve baştan yazabiliyor.
Google Bard için kullanılmaya başlandı!
Google’ın bundan birkaç ay önce ChatGPT rakibi olarak kullanıma sunduğu Google Bard, şimdiye kadar LaMDA dil modeline dayanıyordu. Teknoloji devi, yapay zeka aracının bundan böyle Gemini Pro ile destekleneceğini duyurdu ve bu değişiklik herkes için sunuldu.
Google Tensor İşleme Birimleri ile eğitildi
Google Tensor İşleme Birimleri (TPU’lar), Gemini’nin ilk sürümünü eğitmek için kullanıldı. Teknoloji devi, bununla diğer yapay zeka araçlarını da eğitti. Google Tensor İşleme Birimleri, diğer yapay zeka şirketleri tarafından da tercih ediliyor.
GPT-4’ten daha mı iyi?
Google Gemini, dil modelleri için 32 akademik kriterin 30’unu karşılıyor. Gemini Ultra, yüzde 90 puanla matematik, fizik, tarih, hukuk, tıp ve etik gibi 57 konuda MMLU (büyük çoklu görev dil anlayışı) konusunda insan uzmanlardan bile daha iyi performans sergileyen ilk dil modeli oldu. Bu bağlamda GPT-4’ten daha iyi bir konumda.
Gemini Ultra ve GPT-4’ün Beceri Performansı Karşılaştırması;
Beceri – Başarı Oranı | Gemini Ultra | GPT-4 |
---|---|---|
Genel: | Yüzde 90,0 | Yüzde 86,4 |
Muhakeme: | Yüzde 83,6 | Yüzde 83,1 |
Okuma Anlayışı: | Yüzde 82,4 | Yüzde 80,9 |
Sağduyulu Muhakeme: | Yüzde 87,8 | Yüzde 95,3 |
Temel Aritmetik İşlemler: | Yüzde 94,4 | Yüzde 92,0 |
Zorlu Matematik Problemleri: | Yüzde 53,2 | Yüzde 52,9 |
Python Kodu Üretimi: | Yüzde 74,4 | Yüzde 67,0 |
Gemini ve GPT-4V’nin Çoklu Modül Yetenekleri Performansı Karşılaştırması;
Yetenek – Başarı Oranı | Açıklama | Gemini | OpenAI GPT-4V |
---|---|---|---|
Resim: | Çok disiplinli kolej seviyesinde akıl yürütme sorunları | Yüzde 59.4 | Yüzde 56.8 |
VQAv2: | Doğal görüntü anlama | Yüzde 77.8 | Yüzde 77.2 |
TextVQA: | Doğal görüntülerde OCR | Yüzde 82.3 | Yüzde 78.0 |
DocVQA: | Belge anlama | Yüzde 90.9 | Yüzde 88.4 |
Infographic VQA: | Infografik anlama | Yüzde 80.3 | Yüzde 75.1 |
MathVista: | Görsel bağlamlarda matematiksel akıl yürütme | Yüzde 53.0 | Yüzde 49.9 |
VATEX: | İngilizce video altyazılama (CIDER) | Yüzde 62.7 | Yüzde 56.0 |
Perception Test MCQA: | Video soru cevaplama | Yüzde 54.7 | Yüzde 46.3 |
COVOST 2 (21 dil): | Otomatik konuşma çevirisi (BLEU puanı) | Yüzde 40.1 | Yüzde 29.1 |
FLEURS (62 dil): | Otomatik konuşma tanıma (kelime hata oranı temelinde, daha düşük daha iyi) | Yüzde 7.6 | Yüzde 17.6 |
Google ve Alphabet CEO’su Sundar Pichai’nin açıklaması şu şekilde;
Her teknoloji değişimi, bilimsel keşfi ilerletme, insan ilerlemesini hızlandırma ve yaşamı iyileştirme fırsatıdır. Şu anda yapay zeka ile gördüğümüz geçiş, mobil veya önceki web’e geçişten çok daha büyük olacak ve benim yaşamımızda gördüğümüz en derin olacak.
Yapay zeka, her yerde insanlar için gündelikten olağanüstüye kadar fırsatlar yaratabilir. Yeni inovasyon ve ekonomik ilerleme dalgalarını getirecek ve bilgi, öğrenme, yaratıcılık ve üretkenliği daha önce görülmemiş bir ölçekte tetikleyecektir. Beni heyecanlandıran da işte bu: yapay zekayı herkes için dünyanın her yerinde yardımcı yapma şansı.
Sekiz yıla yaklaşan yapay zeka odaklı bir şirket olarak ilerlemenin hızı sadece artıyor: Şu anda milyonlarca insan, ürünlerimizde genaratif yapay zekayı kullanarak, bir yıl önce dahi yapamayacakları şeyleri yapabiliyor; daha karmaşık sorulara cevap bulmaktan yeni araçlarla işbirliği yapmaya ve oluşturmaya kadar.
Aynı zamanda, geliştiriciler, modellerimizi ve altyapımızı kullanarak yeni genaratif yapay zeka uygulamaları inşa ediyorlar ve dünya genelindeki start-up’lar ve şirketler, yapay zeka araçlarımızla büyüyorlar. Bu inanılmaz bir ivme, ancak sadece mümkün olanın yüzeyine çıkmaya başlıyoruz.
Bu çalışmaya cesurca ve sorumlulukla yaklaşıyoruz. Bu, araştırmamızda iddialı olmayı ve insanlara ve topluma büyük faydalar sağlayacak yetenekleri peşinde koşarken, yapay zeka daha yetenekli hale geldikçe riskleri ele almak için hükümetlerle ve uzmanlarla işbirliği yapmayı içerir.
En iyi araçlara, temel modellere ve altyapıya yatırım yapmaya devam ediyoruz ve bu ilkelere rehberlik ederek bunları ürünlerimize ve diğerlerine getiriyoruz. Şimdi, Gemini ile yolculuğumuza bir sonraki adımı atıyoruz, en yetenekli ve genel modelimiz, birçok önde gelen ölçekte üstün performans sunan bir model.
Yapay zeka, hayatımın çalışmasının odak noktası oldu, birçok araştırma arkadaşım gibi. Bilgisayar oyunları için yapay zeka programlamaya genç yaşta başladığımdan beri ve beyinin çalışma şeklini anlamaya çalışan bir nörobilim araştırmacısı olarak yıllarca, daha akıllı makineler inşa edebilirsek, onları insanlık yararına kullanabileceğimize inandım.
Bu, Google DeepMind’deki çalışmalarımızı yönlendirmeye devam eden sorumlulukla dolu bir yapay zeka tarafından sorumlu bir dünya vaadi. Uzun süredir, insanların dünyayı anlama ve etkileşim kurma biçiminden esinlenmiş yeni bir nesil yapay zeka modelleri inşa etmek istedik.
Yazılımın zeki bir parçası gibi değil, daha çok kullanışlı ve sezgisel bir şey gibi hissettiren bir yapay zeka – bir uzman yardımcı veya asistan. Bugün, bu vizyona bir adım daha yaklaşıyoruz ve inşa ettiğimiz en yetenekli ve genel modeli olan Gemini’yi tanıtıyoruz.
Gemini, Google’daki farklı ekipler arasındaki büyük çaplı işbirliği çabalarının bir sonucudur, bu arada Google Research’teki meslektaşlarımız da dahil. Farklı türlerdeki bilgileri, metin, kod, ses, görüntü ve video dahil olmak üzere farklı bilgi türlerini genelleme ve sorunsuz bir şekilde anlama, çalıştırma ve birleştirme yeteneği olan multimodal bir yapay zeka olarak temellendirildi.
Gemini aynı zamanda en esnek modelimizdir, veri merkezlerinden mobil cihazlara kadar her şeyde verimli bir şekilde çalışabilir. State-of-the-art yetenekleri, geliştiricilerin ve kurumsal müşterilerin yapay zeka ile nasıl inşa edip ölçeklendirdiklerini önemli ölçüde artıracaktır.