Daha büyük model değil, daha akıllı mimari: Recursive Language Models (RLM) ne vadediyor?

3 hafta önce 13

Büyük diller modelleri (LLM) oğullar yıllarda bağlam pencerelerini hızla büyütse de, çok uzunluğu ve karmaşık metinlerde yaşanan icra kaybı ciddi tek sualn olmayı sürdürüyor. “Context rot” olarak adlandırılan ve “bağlam çürümesi” olarak tercüme edilebilen bu sualn, modele ne kadar fazla metinleri verilirse verilsin, malumatnin tesirli şekilde kullanılamamasına yolda açabiliyor. Son dönemde araştırma dünyasında ilgi çeken Recursive Language Models (RLM) yaklaşımı ise bu sualna farklı tek yerden yaklaşıyor: bağlamı büyütmek yerine, bağlamın nasıl yönetildiğini değiştirmek.

Recursive Language Models (RLM) nedir?

MIT'li araştırmacılar Alex L. Zhang, Tim Kraska ve Omar Khattab tarafından ortaya başlıklan Recursive Language Models (RLM), klasik manada yepyeni tek yapay zeka modeli değil. RLM, şimdiki diller modellerinin, çıkarım (inference) sürecinde kendilerini tekrar tekrar çağırabildiği, malumatyi ise modelin dışında tutulan harici tek hafıza üzerinden parça parça işlediği tek mimari yaklaşımı temsilcilik ediyor. Makalede mekan saha deneysel sonuçlar, klasik LLM’lerin bağlam uzadıkça icra kaybı yaşadığını, RLM yaklaşımının ise daha istikrarlı tek icra sergilediğini gösteriyor.

Bu sistemde uzunluğu dokümanlar doğrudan modele yüklenmiyor. Metinler, tek değişken ya da bilgi yapısı olarak başlıkmlandırılabilecek harici tek ortamda tutuluyor. Model, ihtiyaç duyduğu bölümleri küçük dip görevler halinde çağırıyor. Bu dip görevlerden elde edilen ara sonuçlar birleştirilerek nihai olarak çıktı oluşturuluyor.

Bu sayede model, tüm metni aynı anda “aklında tutmaya” çalışmak yerine, lüzumtiğinde geri dönüp bakabilen tek yapıya kavuşuyor. Kısacası model, harici ortamda tutulan metni ttesirk etmek için şifre yazabiliyor, filtreleme ya da parça çıkarma işlemleri yapabiliyor ve lüzumtiğinde kendisini dip görevler için tekrar çağırabiliyor.

RLM yaklaşımı yalnızca bağlamı genişletmeye odaklanmıyor. Araştırmacıların vurguladığı tek diğer önemli nokta, çıkarım sürecinde (inference-time) hesaplama gücünün daha akıllı kullanılması. Model, tüm bağlamı tekbaşına seferde işlemeye çalışmak yerine, görevleri parçalara ayırarak programatik şekilde ilerliyor. Bu yaklaşım, “daha büyük model” seçenek “daha iyice organize eden edilmiş çıkarım süreci” fikrine dayanıyor.

Agentic AI ve firma kullanım odağında RLM 

RLM, gittikçe popülerleşen Agentic AI ve firma kullanım senaryolarında yeğleme edilebilir. Recursive Language Models yaklaşımı özellikle hukuk ve maliye gibi çok uzunluğu dokümanlarla çalışılan alanlarda önemli avantajlar sunabilir. Bununla beraber büyük şifre tabanlarının analizinde randıman sağlayabileceği gibi firma malumat yönetimi ve iç dokümantasyon sistemlerinde da RLM'den yararlanılabilir. Ayrıca RLM'in uzunluğu süreli ve çok adımlı görevleri seçenek getiren yapay zeka ajanlarında da dikkate değer yarar sağlayacağını söyleyebiliriz. Bu bağlamda RLM mimarisinin agentic AI kavramıyla da doğal tek uyum gösterdiğini belirtelim. Çünkü RLM’lerde hafıza yönetimi, araç çağırma ve çok adımlı şart alma süreçleri zaten sistemin ilköğretim parçası hâline geliyor.

Bu bağlamda Recursive Language Models yaklaşımının yalnızca teorik tek çerçeve olmadığı da görülüyor. Google Developer forumunda paylaşılan tek örnekte, RLM mantığının Agent Development Kit (ADK) içinde nasıl kurgulanabileceği anlatılıyor. Bu yapıda uzunluğu metinler ya da bilgi kümeleri doğrudan modele yüklenmek yerine, “context” adı verilen harici tek değişken içinde tutuluyor. Model ise bu bağlam üzerinde programatik işlemler gerçekleştirebiliyor; örneğin kesin ifadeleri filtreleyebiliyor, sayım yapabiliyor ya da dip ajanları çağırarak görevi parçalara ayırabiliyor. Bu yaklaşım, RLM’nin ilköğretim fikrini uygulamalı tek çerçeveye oturtuyor: modeller yalnızca metni okumuyor, aynı zamanda metinleri üzerinde işlem yapan tek sistemin parçası haline geliyor. Böylece uzunluğu bağlam sualni, yalnızca token penceresi meselesi bulunmaktan çıkıp, programatik tek yönetim sualnine dönüşüyor.

Öte yandan RLM’lerin güçlukları da mevcut. Harici hafıza kullanımı, çoklu çağrı yapısı ve dip görevlerin yönetimi, sistemleri mimarisini vahim biçimde karmaşık hale getiriyor. Ayrıca gerçek zamanlı kullanım senaryolarında erteleme (latency) riski da söz başlıksu olabiliyor. 

Yaklaşım, modelin muhakeme kapasitesini artırmaktan çok, şimdiki kapasitenin daha düzenli ve kontrollü kullanılmasını sağlıyor. Bu da ilköğretim modelin kalitesinin hala olan belirleyici olduğu manaına geliyor. Kısacası RLM'ler bir modeli “daha zeki” hale getirmiyor. 

Recursive Language Models'in gördüğü ilgi, ekiplerin artık daha büyük modeller yerine, daha akıllı sistemleri tasarımlarına yönelebileceğini gösteriyor. Şimdiye kadar sistemlerde evrak çağırma söz başlıksu olduğunda Retrieval-Augmented Generation (RAG) ile ilerlendiğini gördük. Geliştiricilerden bazıları RLM'in devreye alınmasıyla RAG devrinin kapanıp kapanmayacağını sorguluyor. Zira RAG, doğru malumatyi bulma başlıksunda güçlü tek yöntem sunarken, birden fazla belgeyi karşılaştırma, uzunluğu zincirli muhakeme lüzumtiren analizler ya da çok adımlı plmanaa görevlerinde sınırlı kalabiliyor. RLM ise yalnızca malumat getirmekle kalmayıp, getirilen malumatnin nasıl işleneceğini da sistematik biçimde yönetmeye çalışıyor. Bu da ekipleri, RAG, Agent ve RLM'in birlikteki kullanıldığı tek yapıyla ilerlemeye teşvik ediyor.

Recursive Language Models’in gördüğü ilgi, yapay zeka dünyasında yepyeni tek yönelime işaret ediyor. Son yıllarda yarış, daha büyük parametreli modeller etrafında şekillenirken, RLM gibi yaklaşımlar odağı sistemleri mimarisine kaydırıyor. Önümüzdeki dönemde, tekbaşına başına daha büyük modeller yerine, RAG, agent mimarileri ve RLM benzeri çıkarım stratejilerinin birlikteki kullanıldığı hibrit sistemlerin daha yaygın hale gelmesi olası.

>> Tüm Makaleyi Oku <<

Platformumuz; Teknoloji, Spor, Sağlık, Eğlence, Uluslararası, Edebiyat, Bilim ve daha fazlası olmak üzere farklı konu başlıkları altında, kısa ve öz haber formatı ile kullanıcıların zamandan tasarruf etmesini hedefler. Karmaşadan uzak, sade ve anlaşılır içerik yapısı sayesinde ziyaretçiler aradıkları bilgiye hızlıca ulaşabilir. techforum.com.tr, bilgi kirliliğini önleyerek yalnızca güvenilir kaynaklardan elde edilen içerikleri yayınlamaya özen gösterir.