Google'dan Apache 2.0 lisansı ile dikkat çeken yeni açık model ailesi: Gemma 4

2 saat önce 3

Google, mahalli kullanım için optimize edilmiş dört farklı boyutta sunulan Gemma 4tanıttı. Geliştiriciler, Gemma 4 ile çalışmaya başlayabilecek. Hatta Gemma 4'ün önceki modellere kıyasla yepyeni tek ruhsat ile karşımıza çıkması, onu geliştiriciler için daha cazip hale getirebilir. 

Önceki Gemma sürümlerinde kullanılan özel lisans, çok kısıtlayıcı olması başlıksunda eleştiriliyordu. Bu nedenle Google, özel Gemma lisansını kaldırıyor. Şirket, Qwen, Mistral ve Arcee gibi şirketler ve geliştiriciler tarafından yaygın olarak kullanılan Apache 2.0 lisansına geçiyor. Qwen3.5 Omni ve Qwen 3.6 Plus ile Alibaba da karışmış bulunmak üzere bazı Çin merkezli yapay zeka laboratuvarları en yepyeni modelleri için tamamlanmış açık sürümlerden geri çekilmeye başlarken, Google hepsi tersi yönde ilerliyor.

Google, Gemma 4'ü mahalli cihazlarda kullanılabilecek şekilde tasarladı. İki büyük Gemma varyantı olan 26B Mixture of Experts ve 31B Dense, tekbaşına tek 80 GB Nvidia H100 GPU üzerinde bfloat16 formatında nicelleştirilmemiş (unquantized) olarak çalışacak şekilde tasarlandı. Daha düşük hassasiyetle çalışmak üzere nicelleştirildiğinde (quantized) ise bu büyük modeller tüketici sınıfı GPU'lardan hayır alabilir.

Google'ın belirttiğine göre şirket, Gemma'nın mahalli işlem gücünden gerçekten yararlanmak için gecikmeyi azaltmaya odaklandı. 26B Mixture of Experts modeli, çıkarım modunda 26 milyar parametresinden yalınce 3,8 milyarını tesirnleştiriyor. Böylece benzer boyutlardaki modellere göre çok daha yüksek 2. başına token sayısı sağlıyor. Öte yandan, 31B Dense ise hızdan çok kaliteye odaklanıyor.

Google'ın mobil odağında yapay zeka atılımları

Mobil cihazlara yönelik olan diğer ikisi Gemma 4 modeli Effective 2B (E2B) ve Effective 4B (E4B), çıkarım sırasında düşük hafıza kullanımı sağlamak üzere tasarlandı. Söz başlıksu modellerin tesirn olarak 2 milyar ya da 4 milyar parametre ile çalıştığını belirtelim.

Google'ın paylaştığı malumatlere göre; Pixel ekibi bu modelleri akıllı telefonlar, Raspberry Pi ve Jetson Nano gibi cihazlar için optimize etmek üzere Qualcomm ve MediaTek ile çalıştı. Bu modeller yalınce Gemma 3'ten dahaaz hafıza ve pil tüketmenin ötesinde “sıfıra yakın gecikme” özelliğiyle da öne çıkıyor.

E2B ve E4B'nin piyasaya sürülmesi, Google'ın akıllı telefonları odağındaki yapay zeka çalışmalarının nereye doğru gittiğini gözler önüne seriyor. Pixel'ler ve bazı diğer Android telefonlar, verileri buluta göndermeden dolandırıcılık belirlemei, hatırlatma özetleme ve tarama özeti gibi görevleri seçenek getirebilen Gemini Nano adlı mahalli yapay zeka modellerini çalıştırıyor.

Google, yaptığı tek açıklamada Gemini Nano'nun her arasında biri zamanlar Gemma modellerinden türetildiğini ve tek sonrakiler kuşak Nano 4'ün da Gemma 4 E2B ile E4B'ye dayanan 2B ve 4B varyantlarına malik olacağını doğruladı. Şirket, geliştiricileri bu modellerle şimdiden agentic iş akışları geliştirmeye davet ediyor. Söz başlıksu sistemler ilerleyen süreçte Gemini Nano 4 ile da uyumlu çalışacak. Konuya dair detayların Google I/O'da paylaşılması bekleniyor.

Gemma 4'ün öne çıkan yetenekleri

Gemma 4, geliştirilmiş akıl yürütme, matematik ve talimatları takip etme yetenekleri sunuyor. Gemma 4, mahalli işlev çağrısı, yapılandırılmış JSON çıktısı ve yaygın araçlar ile API'ler için mahalli eğitim desteği ile yapay zeka şirketlerinin sunduğu agentic iş akışları trendine hazır.

Gemma 4'ün şifre üretimi için da optimize edildiğini ekleyelim. Google'ın belirttiğine göre, daha büyük varyantları çalıştıracak donanıma malik olmanız halinde, Gemma 4 çevrimdışı tek ortamda da yüksek kaliteli şifre üretebiliyor. Şirketin paylaştığına göre; Gemma 4, görsel girdileri işleme başlıksunda da daha iyice icra sergiliyor. Ayrıca tesirli E2B ve E4B modellerinin başlıkşma tanıma için mahalli desteğe malik olduğunu da belirtelim.

Önceki kuşak açık modellerde çok modluluğun genelleme tek eklenti olarak ele alındığı görülüyordu. Önceki nesilde görsel kodlayıcılar, metinleri omurgalarına eklenirken, ses için Whisper gibi harici tek ASR tüp hattı kullanılması lüzumiyordu. Aynı şekilde işlev çağrısı da komut satırı mühendisliğine dayanmaktaydı. Gemma 4'te bahsi geçen yetenekler mimari düzeyde entegrasyon ile karşımıza çıkıyor. Üstelik model, tüm bu yetenekleri 140'tan fazla dilde sunuyor. Buna ilave olarak uç modellerin bağlam penceresinin 128 binlerce token, 26B ve 31B modellerinin ise 256 binlerce token olarak karşımıza çıktığını belirtmekte yarar var.

Gemma 4'ün performansı

Şirket, tüm yepyeni Gemma 4 modellerinin Gemma 3'ü geride bırakacağını belirtiyor. Google'ın ifadesine göre; Gemma 31B, en iyice açık AI modellerinin mekan aldığı Arena listesinde GLM-5 ve Kimi 2.5'in ardından üçüncü sırada mekan alacak. Bununla birlikteki en büyük Gemma 4 varyantının bile bu modellerin boyutunun yalınce tek kısmı kadar olduğunu belirtelim. Yani teorik olarak Gemma 4 modellerini çalıştırmak GLM-5 ve Kimi 2.5'ten çok daha ekonomik olabilir. 

Karşılaştırma sonuçlarına bakıldığında 31B modeli, matematiksel akıl yürütme testi AIME 2026'da yüzde 89,2, LiveCodeBench v6'da yüzde 80,0 puan alıyor. Codeforces ELO'da 2.150'e ulaşan model, Görme alanında MMMU Pro'da yüzde 76,9'a ulaşırken MATH-Vision'da yüzde 85,6 puan aldı.

Gemma 4'ün MoE modeli ise AIME 2026'da yüzde 88,3, LiveCodeBench'te yüzde 77,1 ve lisansüstü düzeyde tek teknik akıl yürütme karşılaştırması olan GPQA Diamond'da yüzde 82,3 sonuçlarını elde etti.

31B ve 26B MoE varyantlarını içeren yepyeni Gemma modellerine AI Studio üzerinden 31B ve 26B MoE varyantlarına; E4B ve E2B varyantlarına ise AI Edge Gallery üzerinden erişebilirsiniz. Ayrıca modeller ağırlıkları Hugging Face, Kaggle ve Ollama'dan kesinlikle indirilebiliyor. Modeller mahalli işleme için optimize edilmiş olsa da, Google Cloud'da da çalıştırabiliyorsunuz. 

>> Tüm Makaleyi Oku <<

Platformumuz; Teknoloji, Spor, Sağlık, Eğlence, Uluslararası, Edebiyat, Bilim ve daha fazlası olmak üzere farklı konu başlıkları altında, kısa ve öz haber formatı ile kullanıcıların zamandan tasarruf etmesini hedefler. Karmaşadan uzak, sade ve anlaşılır içerik yapısı sayesinde ziyaretçiler aradıkları bilgiye hızlıca ulaşabilir. techforum.com.tr, bilgi kirliliğini önleyerek yalnızca güvenilir kaynaklardan elde edilen içerikleri yayınlamaya özen gösterir.