Google yapay zekâ altyapısını güçlendiren yepyeni tek modeli duyurdu. Şirket Gemini Embedding 2 adını verdiği yepyeni modeli geliştiricilerin kullanımına açtı. Yeni sistemleri metin, görsel, video ve sesli gibi farklı bilgi türlerini aynı çözümleme ortamında işleyebilen çok modlu tek yapı sunuyor.
Gemini Embedding 2 Çok Modlu Yapay Zekâ Analizi Sunuyor
Google yepyeni Gemini Embedding 2 modelini herkese açık ön izleme sürümüyle duyurdu. Model farklı bilgi türlerini tekbaşına tek matematiksel temsilcilik alanına dönüştürebilen birinci mahalli çok modlu embedding modeli olarak tanıtıldı.

Embedding modelleri üretken yapay zekâ modellerinden farklı tek amaçla kullanılıyor. Bu modeller içerik üretmek seçenek verileri manaaya ve çözümleme etmeye odaklanıyor. Sistem metin, görüntü ya da video gibi verileri sayısal vektörlere dönüştürüyor. Yapay zekâ bu vektörler üzerinden veriler arasındaki ilişkileri çözümleme edebiliyor. Gemini Embedding 2 metin, görsel, video, sesli ve evrak gibi farklı bilgi türlerini aynı bilgi alanında temsilcilik edebiliyor. Sistem ayrıca 100 farklı dili kapsayan semantik mana analizi gerçekleştirebiliyor.
Google yepyeni modelin çok modlu çözümleme kapasitesini geliştirdiğini belirtiyor. Gemini Embedding 2 farklı bilgi türleri için kesin sınırlar dahilinde çalışıyor. Model metinleri verileri için 8192 token uzunluğuna kadar bağlam desteği sunuyor. Sistem aynı istekte PNG ya da JPEG formatında altı görsele kadar işlem yapabiliyor. Video analizinde MP4 ya da MOV formatında 120 saniyeye kadar içerik yardımleniyor.
Gemini Embedding 2 ayrıca sesli verilerini doğrudan çözümleme edebiliyor. Sistem sesli verisini işlemek için ara metinleri transkripsiyonu lüzumtirmiyor. Model aynı zamanda altı sayfaya kadar PDF belgelerini da embedding formatına dönüştürebiliyor.
Google yepyeni modelin karmaşık bilgi çözümleme süreçlerini basitlaştırdığını belirtiyor. Gemini Embedding 2 farklı medya türlerini tekbaşına tek sorguda çözümleme edebildiği için daha güçlü bağlamsal sonuçlar üretebiliyor. Model özellikle semantik arama, bilgi sınıflandırma ve bilgi kümeleme gibi görevlerde kullanılıyor. Sistem anahtarları kelimeler temelli tarama seçenek içeriklerin gerçek manaını çözümleme ederek sonuç üretiyor.
Google mühendisleri modelin Retrieval Augmented Generation diğer RAG sistemlerinde da kullanılabileceğini ifadeleri ediyor. Model farklı bilgi kaynakları arasındaki ilişkileri çözümleme ederek yapay zekâ yardımli malumat sistemlerini daha güçlü hale getiriyor.
Google yepyeni Gemini Embedding 2 modelini Gemini API ve Vertex AI platformları üzerinden geliştiricilerin kullanımına açtı. Model şu anda gemini-embedding-2-preview adıyla herkese açık ön izleme sürümünde bulunuyor. Google önceki embedding modeli olan gemini-embedding-001 sürümünü da kullanıma açık tutuyor. Eski modeller yalnızca metinleri tabanlı kullanım senaryolarına odaklanıyor.
Google mühendisleri yepyeni modelin özellikle büyük bilgi setlerinde daha doğru sonuçlar verdiğini ifadeleri ediyor. Şirket hukuk sektöründe yapılan testlerde modelin milyonlarca evrak arasında eleştirel malumatleri bulma başarısını artırdığını belirtiyor.
Google’ın yepyeni Gemini Embedding 2 modeli çok modlu bilgi analizi yetenekleriyle yapay zekâ araştırmalarında önemli tek adım olarak değerlendiriliyor. Uzmanlar bu tür modellerin gelecekte tarama motorlarından bilgi çözümleme platformlarına kadar birçok alanda kullanılacağını öngörüyor.

1 hafta önce
8















.png?format=webp&width=1200&height=630)













English (US) ·