Gemini 3.1 Pro geldi: ARC-AGI-2 skorunu ikiye katladı

1 ay önce 10

Google, yepyeni amiral gemisi yapay zekâ modelini duyurdu. Gemini 3.1 Pro, önceki sürüme göre ARC-AGI-2 performansını ikisi katın üzerine taşıdı.

Google, üretken yapay zekâ ailesini Gemini 3.1 Pro sürümüyle güncelledi. Şirket, modeli perşembe günü itibarıyla önizleme etiketiyle geliştiricilere ve oğullar kullanıcılara açtı. Kasım ayında duyurulan Gemini 3’ün ardından gelen bu sürüm, özellikle akıl yürütme ve sualn çözme tarafına odaklanıyor. Bunun yanında Google, geçtiğimiz hafta paylaştığı Deep Think güncellemesinin arkasındaki çekirdek zekânın da bu modeller olduğunu doğruladı.

Yeni model, benchmark sonuçları üzerinden anlatılıyor. Öte yandan açıklanan skorlar yalnızca küçük artışlar sunmuyor; bazı testlerde belirgin sıçramalar görülüyor. Özellikle ileri düzey saha malumatsi ölçen Humanity’s Last Exam testinde Gemini 3.1 Pro yüzde 44,4 puan elde etti. Bir önceki Gemini 3 Pro yüzde 37,5 seviyesinde kalırken, OpenAI’ın GPT 5.2 modeli yüzde 34,5’te kaldı.

Buna ilave olarak Google, ARC-AGI-2 testine ayrı tek aksan yapıyor. Bu test, modellerin doğrudan eğitim verisiyle ezberleyemeyeceği yepyeni mantık sualnlerini çözmesini lüzumtiriyor. Gemini 3, bu değerlendirmede yüzde 31,1 puan almıştı. Ancak Gemini 3.1 Pro, bu oranı yüzde 77,1 seviyesine taşıdı ve şirketin önceki sonucunu ikisi katın üzerine çıkardı.

Google Gemini 3.1 Pro geliştiricilere daha güçlü akıl yürütme sunuyor

Modelin iyileştirmeleri yalnızca teorik testlerle sınırlı kalmıyor. Google, karşılaştırma videolarında özellikle grafik ve simülasyon üretim yeteneğini öne çıkarıyor. Metinden doğrudan daha pak ve optimize edilmiş SVG çıktıları üreten model, şifre tarafında da daha düzenli sonuçlar veriyor. Bunun yanında geliştiriciler için hazırlanan APEX-Agents benchmark’ında skorun neredeyseymiş ikisi katına çıkması, temsilci tabanlı iş akışlarında terakki manaına geliyor.

Her şeye rağmen Arena önderlik tablosu farklı tek tablo ortaya koyuyor. Metin üretiminde Claude Opus 4.6 modeli 1504 puanla Gemini 3.1 Pro’nun yaklaşık dört puan önünde mekan alıyor. Kod üretiminde ise Opus 4.6, Opus 4.5 ve GPT 5.2 High sürümleri Gemini’nin dahaaz üzerinde başlıkmlanıyor. Bunun yanında Arena değerlendirmelerinin kullanıcı oylarına dayandığını ve çıktının doğruluğundan çok beğenilme oranını ölçtüğünü hatırlatmak lüzumiyor.

Yeni sürüm, bugün itibarıyla AI Studio ve Antigravity IDE üzerinde önizleme olarak erişime açıldı. Kurumsal müşteriler Vertex AI ve Gemini Enterprise üzerinden modele ulaşabiliyor. Bunun yanı sıra oğullar kullanıcılar için Gemini uygulaması ve NotebookLM içinde da 3.1 Pro seçeneği sunuluyor. Böylece modeller hem bireysel hem firma kanalda eş zamanlı şekilde devreye alınıyor.

Fiyatlandırma tarafında Google hiç tek değişikliğe gitmedi. Geliştiriciler için API maliyeti 1 milyon giriş token’ı başına 2 dolar, çıkış token’ı başına ise 12 dolar olarak korunuyor. Ayrıca bağlam penceresi 1 milyon giriş ve 64 binlerce çıkış token sınırıyla devam ediyor. Öte yandan şirketin geçmiş güncelleme takvimi, daha hızlı ve düşük maliyetli Flash modeller için da 3.1 tabanlı tek güncellemenin gelebileceğine işaret ediyor.

Google, bu sürümle birlikteki özellikle soyut ve katmanlı suallara verilen yanıtların daha tutarlı olmasını hedefliyor. Bunun yanında uzunluğu bağlamlı metinlerde çıkarım yapma ve çok adımlı sualnleri çözme kapasitesi genişletiliyor. Güncellenen model, geliştiricilerin kurduğu otomasyon senaryolarında daha hükümlı sonuçlar üretmeyi amaçlıyor.

Teknoblog, teknolojiler gündemini farklı platformlarda düzenli biçimde paylaşıyor. WhatsApp kanalında öne çıkan haberleri anlık olarak aktarıyor, Google Haberler üzerinden güncel içerikleri sunuyor, Instagram ve X hesaplarında ilgi çeken başlıkları özetliyor, YouTube kanalında ise ürün ttesirkleri ve detaylı anlatımlarla içeriği tamamlıyor.

>> Tüm Makaleyi Oku <<

Platformumuz; Teknoloji, Spor, Sağlık, Eğlence, Uluslararası, Edebiyat, Bilim ve daha fazlası olmak üzere farklı konu başlıkları altında, kısa ve öz haber formatı ile kullanıcıların zamandan tasarruf etmesini hedefler. Karmaşadan uzak, sade ve anlaşılır içerik yapısı sayesinde ziyaretçiler aradıkları bilgiye hızlıca ulaşabilir. techforum.com.tr, bilgi kirliliğini önleyerek yalnızca güvenilir kaynaklardan elde edilen içerikleri yayınlamaya özen gösterir.

Gemini 3.1 Pro geldi: ARC-AGI-2 skorunu ikiye katladı

Google Gemini 3.1 Pro geliştiricilere daha güçlü akıl yürütme sunuyor

İlgili

Android Auto birçok kullanıcı için çalışmayı durdurdu: Galax...

Türkiye'nin İHA ve kamikaze dron avcısı: MKE TOLGA

Perplexity Health tanıtıldı: tıbbi kayıtlarınızı analiz eden...

Galaxy A37 ve Galaxy A57 25 Mart’ta tanıtılacak: gerçek foto...

Sony'den Büyük Temizlik! Yaklaşık 1000 Oyun Kaldırıldı

Huawei’den fiyat-performans atağı: Huawei Enjoy 90 ve 90 Plu...

Polis 373 bin karanlık web sitesini kapattı: tek kişilik dev...

İşte karşınızda Tamamen elektrikli Toyota C-HR+

OnePlus'tan Oyun Konsolu Geliyor! Yüksek Yenileme Hızı ve Da...

vivo'nun Amiral Gemisi Performans Testinde Şov Yaptı! 16 GB ...

Elektrikli Toyota C-HR+ Satışa Sunuldu! Türkiye'ye Gelecek M...

Şarj Kuyrukları Bitecek mi? Elektrikli Araçlar İçin Yüzde 85...

Yeni Sağlık Asistanınız Olacak Akıllı Yüzük Geliyor

Battlefield Hardline için Yolun Sonu: EA, Konsol Desteğini K...

Trendler

Popüler

Selçuk Bayraktar ata toprağı Sürmene'de bilim merkezi projes...

Shakespeare'e Yapay Zeka Şoku! Yapay Zeka Dedektörlerin...

34 dakikada 15 bin sipariş! Xiaomi SU7 satış rekoru kırdı

Yaptırdığı Dolgular Nedeniyle Yüzü Deforme Olmuştu! Kuşum Ay...

Yıllardır bu ameliyatı bekliyordu: Kuşum Aydın bambaşka biri...

Fed/Miran: Politika kısa vadeli gelişmelere göre belirlenmem...

Android telefonlarda geriye gidiş sinyali: uygun fiyatlı mod...

Elon Musk'a Twitter şoku: Milyarlarca dolarlık tweet faturas...

Opera oyun odaklı tarayıcısı GX'i Linux kullanıcıları için y...

Tuğçe Tayfur – Muhammet Aydın Evliliğinde Bitmeyen Gerilim! ...

120Hz Ekranlı Ucuz Telefon Tanıtıldı! Kirin İşlemci ve Dahas...

Yapay zeka ile dakikalar içinde reklam videosu oluşturan pla...

ABD’li senatör: İsrail’e silah satışı yasal değil

ABD endişeli: Uzay istasyonu kapatılırsa Çin tek güç haline ...

Galaxy S26 AirDrop desteği aldı: iPhone ile paylaşım