Google'dan bellek performansını 8 kat artıran yapay zeka sıkıştırma algoritması: TurboQuant

1 saat önce 4

Google, yepyeni yapay zeka hafıza sıkıştırma algoritması TurboQuant’ı duyurdu. Google Research, bu teknolojiyi performansı tesirlemeden yapay zekanın çalışma belleğini küçültmenin yepyeni tek yolu olarak tanımlıyor. Büyük Dil Modelleri (LLM'ler), kocaman belgeleri ve karmaşık başlıkşmaları işlemek için bağlam pencerelerini genişlettikçe, Anahtar-Değer (KV) önbellek darboğazı ile karşı karşıya kalıyor.

Modelin işlediği her arasında biri kelime, yüksek hızlı bellekte yüksek boyutlu tek vektör olarak depolanmak durumunda. Uzun süreli görevlerde, bu sayısal kopya kağıdı hızla büyürken, çıkarım sırasında kullanılan GPU, VRAM sistemini tüketiyor. Bu nedenle zaman içinde modeller performansının hızla düştüğü görülüyor.

Yalnızca yazılımdan oluşan TurboQuant algoritma paketi ise aşırı KV önbellek sıkıştırması için matematiksel tek şablon sunuyor. TurboQuant, kesin tek modelin kullandığı KV hafıza miktarını vasat olarak 6 kat azaltıyor ve ilgi logitlerini (attention logits) hesaplamada 8 kat icra artışı sağlıyor. Böyle bakıldığında bunu modellerinde uygulayan işletmelerin maliyetlerini yüzde 50'den fazla azaltabileceğini söyleyebiliriz.

Google Research'ün duyurusu 7,7 milyondan fazla görüntüleme alırken, yayınlanmasından sonrakiler 24 zaman içinde, cemaat üyeleri algoritmayı Apple Silicon için MLX ve llama.cpp gibi popüler mahalli yapay zeka kütüphanelerine taşımaya başladı.

Teknik çözümleyici Prince Canuma, X'te paylaştığı tek gönderide Qwen3.5-35B modelini testleri etmek için MLX'te TurboQuant'ı uyguladığını açıkladı. Canuma, 8,5K ile 64K token arasında değişen bağlam uzunluklarında, her arasında biri niceleme düzeyinde yüzde 100 hepsi eşleşme olduğunu açıkladı. Canuma'nın belirttiğine göre; 2,5 bitlik TurboQuant, doğruluk kaybı olmadan KV önbelleğini neredeyseymiş 5 kat azalttı.

Google araştırmacıları, 2024'te başlayan ve yıllarca süren tek araştırma sürecinin sonucunda TurboQuant'ı piyasaya sürdü. Google araştırmacılarının 2025'in başlarında PolarQuant ve Quantized Johnson-Lindenstrauss (QJL) gibi ilköğretim matematiksel framework'leri ele saha makaleler ile karşımıza çıktığını gördük. TurboQuant, halüsinasyonlara da nedenler olan nicelleştirme yanlışlarını aşmak için PolarQuant ve Quantized Johnson-Lindenstrauss'dan yararlanıyor.TurboQuant biçimsel olarak tanıtılması, akademik olarak sunulan teorilerden büyük ölçekli üretime geçişi işaret ediyor.

Teorik temelli algoritmalar ve ilgili araştırma makaleleri, şu anda ücretsiz olarak kullanıcılara açılmış durumda. Hatta firma kullanım da mümkün. Google'ın sunduğu kaynaklar, zekadan ödün vermeden modeller boyutunu küçültmek için eğitim sürecine ihtiyaç duyulmayan tek çözüm sunuyor.

>> Tüm Makaleyi Oku <<

Platformumuz; Teknoloji, Spor, Sağlık, Eğlence, Uluslararası, Edebiyat, Bilim ve daha fazlası olmak üzere farklı konu başlıkları altında, kısa ve öz haber formatı ile kullanıcıların zamandan tasarruf etmesini hedefler. Karmaşadan uzak, sade ve anlaşılır içerik yapısı sayesinde ziyaretçiler aradıkları bilgiye hızlıca ulaşabilir. techforum.com.tr, bilgi kirliliğini önleyerek yalnızca güvenilir kaynaklardan elde edilen içerikleri yayınlamaya özen gösterir.

Google'dan bellek performansını 8 kat artıran yapay zeka sıkıştırma algoritması: TurboQuant

İlgili

Regular Show Geri Dönüyor: Regular Show Lost Tapes’den İlk T...

vivo'nun Uygun Fiyatlı Akıllı Telefonu Yolda! Bataryası Büyü...

16 GB RAM'li Telefon, İçinizi Rahat Ettirecek Özellikle Geli...

Skoda, Çin pazarından çekilme kararı aldı

Yapay zeka destekli robotlar savaş alanında test ediliyor

Kurumsal müşterilere yönelik açık kaynaklı EdgeOps platformu...

Intel’in yeni çipi ve LG ekranı: Pil performansında dikkat ç...

82 Yaşındaki Çiftçiden 26 Milyon Dolarlık Teklife Ret: Tekno...

EdgeOps Platform Sağlayıcısı Yerli Girişim Datasance, Yatırı...

Eğitim Teknolojileri Girişimi Intechne, Gedik Holding’den Ya...

iPhone çökertme kodu açık kaynak yazılım platformunda yayınl...

Google Büyük Dil Modellerini Daha Verimli Hale Getirecek Tur...

TCL 320Hz Ekranlı Oyun Monitörü Tanıttı! 27 İnç Büyüklüğünde...

Efsane Payday Serisinin Yeni Oyunu Geliyor! Fragman Paylaşıl...

Trendler

Popüler

Denetimler sürüyor: Kadıköy’de 50 araç trafikten men edildi

Fatih Sultan Mehmet Köprüsü 'endometriozis' farkındalığı içi...

ABD'nin cari açığı 2025'te 5 yılın en düşüğüne indi

İki motosiklet çarpıştı: Dayı-yeğen yaralandı

Bakan Fidan'dan 'İran' diplomasisi

PlayStation Plus Essential Nisan ayında Lords of the Fallen ...

Ay’da yeni dönem: NASA 20 milyar dolarlık üs kuruyor

Nükleer Santralde çalışan Rusya vatandaşı Müslüman oldu

Meta’dan Girişimcilik ve Yapay Zeka Hamlesi: “Meta Small Bus...

Fitch, Tüpraş'ın görünümünü "Pozitif"e yükseltti

Instagram Âdeta E-Ticaret Sitesine Dönecek: Influencer'lar I...

Rusya/Zaharova: Avrupa ülkelerinin gemi alıkoyma uygulamalar...

Spotify, yapay zeka içeriklerinin gerçek sanatçılara atfedil...

Osmangazi Köprüsü’nden atlayan kadının ünlü fenomen olduğu o...

Gama-Cas yıldızının gizemli X-ışını emisyonları çözüldü