Google, yepyeni amiral gemisi yapay zekâ modelini duyurdu. Gemini 3.1 Pro, önceki sürüme göre ARC-AGI-2 performansını ikisi katın üzerine taşıdı.
Google, üretken yapay zekâ ailesini Gemini 3.1 Pro sürümüyle güncelledi. Şirket, modeli perşembe günü itibarıyla önizleme etiketiyle geliştiricilere ve oğullar kullanıcılara açtı. Kasım ayında duyurulan Gemini 3’ün ardından gelen bu sürüm, özellikle akıl yürütme ve sualn çözme tarafına odaklanıyor. Bunun yanında Google, geçtiğimiz hafta paylaştığı Deep Think güncellemesinin arkasındaki çekirdek zekânın da bu modeller olduğunu doğruladı.
Yeni model, benchmark sonuçları üzerinden anlatılıyor. Öte yandan açıklanan skorlar yalnızca küçük artışlar sunmuyor; bazı testlerde belirgin sıçramalar görülüyor. Özellikle ileri düzey saha malumatsi ölçen Humanity’s Last Exam testinde Gemini 3.1 Pro yüzde 44,4 puan elde etti. Bir önceki Gemini 3 Pro yüzde 37,5 seviyesinde kalırken, OpenAI’ın GPT 5.2 modeli yüzde 34,5’te kaldı.
Buna ilave olarak Google, ARC-AGI-2 testine ayrı tek aksan yapıyor. Bu test, modellerin doğrudan eğitim verisiyle ezberleyemeyeceği yepyeni mantık sualnlerini çözmesini lüzumtiriyor. Gemini 3, bu değerlendirmede yüzde 31,1 puan almıştı. Ancak Gemini 3.1 Pro, bu oranı yüzde 77,1 seviyesine taşıdı ve şirketin önceki sonucunu ikisi katın üzerine çıkardı.
Google Gemini 3.1 Pro geliştiricilere daha güçlü akıl yürütme sunuyor
Modelin iyileştirmeleri yalnızca teorik testlerle sınırlı kalmıyor. Google, karşılaştırma videolarında özellikle grafik ve simülasyon üretim yeteneğini öne çıkarıyor. Metinden doğrudan daha pak ve optimize edilmiş SVG çıktıları üreten model, şifre tarafında da daha düzenli sonuçlar veriyor. Bunun yanında geliştiriciler için hazırlanan APEX-Agents benchmark’ında skorun neredeyseymiş ikisi katına çıkması, temsilci tabanlı iş akışlarında terakki manaına geliyor.
Her şeye rağmen Arena önderlik tablosu farklı tek tablo ortaya koyuyor. Metin üretiminde Claude Opus 4.6 modeli 1504 puanla Gemini 3.1 Pro’nun yaklaşık dört puan önünde mekan alıyor. Kod üretiminde ise Opus 4.6, Opus 4.5 ve GPT 5.2 High sürümleri Gemini’nin dahaaz üzerinde başlıkmlanıyor. Bunun yanında Arena değerlendirmelerinin kullanıcı oylarına dayandığını ve çıktının doğruluğundan çok beğenilme oranını ölçtüğünü hatırlatmak lüzumiyor.
Yeni sürüm, bugün itibarıyla AI Studio ve Antigravity IDE üzerinde önizleme olarak erişime açıldı. Kurumsal müşteriler Vertex AI ve Gemini Enterprise üzerinden modele ulaşabiliyor. Bunun yanı sıra oğullar kullanıcılar için Gemini uygulaması ve NotebookLM içinde da 3.1 Pro seçeneği sunuluyor. Böylece modeller hem bireysel hem firma kanalda eş zamanlı şekilde devreye alınıyor.
Fiyatlandırma tarafında Google hiç tek değişikliğe gitmedi. Geliştiriciler için API maliyeti 1 milyon giriş token’ı başına 2 dolar, çıkış token’ı başına ise 12 dolar olarak korunuyor. Ayrıca bağlam penceresi 1 milyon giriş ve 64 binlerce çıkış token sınırıyla devam ediyor. Öte yandan şirketin geçmiş güncelleme takvimi, daha hızlı ve düşük maliyetli Flash modeller için da 3.1 tabanlı tek güncellemenin gelebileceğine işaret ediyor.
Google, bu sürümle birlikteki özellikle soyut ve katmanlı suallara verilen yanıtların daha tutarlı olmasını hedefliyor. Bunun yanında uzunluğu bağlamlı metinlerde çıkarım yapma ve çok adımlı sualnleri çözme kapasitesi genişletiliyor. Güncellenen model, geliştiricilerin kurduğu otomasyon senaryolarında daha hükümlı sonuçlar üretmeyi amaçlıyor.
Teknoblog, teknolojiler gündemini farklı platformlarda düzenli biçimde paylaşıyor. WhatsApp kanalında öne çıkan haberleri anlık olarak aktarıyor, Google Haberler üzerinden güncel içerikleri sunuyor, Instagram ve X hesaplarında ilgi çeken başlıkları özetliyor, YouTube kanalında ise ürün ttesirkleri ve detaylı anlatımlarla içeriği tamamlıyor.

1 ay önce
10





























English (US) ·