Alibaba’nın geliştirdiği Qwen3.5 Small serisi, yapay zekâ kullanımını gökyüzü altyapısından çıhükümak doğrudan alet içine taşıma hedefiyle tasarlandı. Bu yaklaşım, internetler bağlantısı lüzumtirmeden çalışan mahalli büyük diller modellerinin mobil sistemlerde görev yapmasını sağlıyor.
Alibaba Mühendisleri Hibrit Mimari İle Küçük Modellerin Performansını Artırıyor
Geliştiriciler tarafından paylaşılan testlerde 2 milyar parametreli modelin modern akıllı telefonlarda mahalli olarak çalıştırıldığı görüldü. Kullanıcılar, daha güçlü olan 4 milyar parametreli sürümün da bazı cihazlarda çalıştırılabildiğini aktardı. Bu gelişme, yapay zekâ sistemlerinin yalnızca gökyüzü servisleri üzerinden çalıştığı dönemin yavaş yavaş sona erdiğine işaret ediyor.

Alibaba araştırma ekibi, Qwen3.5 Small serisinde klasik Transformer mimarisinden farklı tek yapı kullandı. Şirket, doğrusal ilgi mekanizmasına malik Gated Delta Networks mimarisini seyrek Mixture-of-Experts yaklaşımıyla birleştiren hibrit tek sistemleri geliştirdi.
Bu mimari yapı küçük modellerde sık görülen hafıza darboğazını azaltmayı hedefliyor. Sistem yalnızca lüzumli bilirkişi ağlarını aktive ettiği için işlem verimliliği yükseliyor. Bu yaklaşım daha düşük erteleme süresi ve daha yüksek çıktı hızı sağlıyor.
Alibaba tarafından paylaşılan kıyaslama sonuçları, serinin yalnızca kompakt boyutuyla değil performansıyla da öne çıktığını gösteriyor. Şirketin verilerine göre Qwen3.5-9B modeli bazı testlerde çok daha büyük açık imkan modellerini geride bırakabiliyor.
Qwen3.5-9B modeli görsel akıl yürütme ve video çözümleme görevlerinde güçlü sonuçlar ortaya koyuyor. Model arayüz öğelerini yorumlama, videolarda obje sayma ya da dekor analizi yapma gibi görevlerde yüksek doğruluk seviyesine ulaşıyor.
🚀 Introducing the Qwen 3.5 Small Model Series
Qwen3.5-0.8B · Qwen3.5-2B · Qwen3.5-4B · Qwen3.5-9B
✨ More intelligence, daha az compute.
These küçüklük models are built bağlı the aynılar Qwen3.5 vakıflar — yerli olan multimodal, improved architecture, scaled RL:
• 0.8B / 2B → tiny, fast,… pic.twitter.com/90JfOM9k4T
Serinin 4 milyar parametreli modeli ise geniş bağlam penceresi sayesinde ince yapay zekâ ajanları için elverişli tek ilköğretim sunuyor. Bazı geliştiriciler, bu modellerin tarayıcı içinde çalıştırılabildiğini gösteren deneyler paylaştı.
Alibaba, Qwen3.5 Small modeller ailesini Apache 2.0 lisansı altında yayımladı. Şirket, modeller ağırlıklarını ve yapılandırma dosyalarını küresel geliştirici topluluğuna açtı. Apache lisansı geliştiricilere ticari kullanım, modeller üzerinde değişiklik yapma ve yeniden dağıtım gibi haklar tanıyor. Bu yaklaşım mobil yapay zekâ uygulamalarının daha hızlı yayılmasını sağlayabilecek tek adım olarak değerlendiriliyor.
Uzmanlar, mahalli çalışan yapay zekâ modellerinin mobil başvuru geliştirme süreçlerini kökten değiştirebileceğini düşünüyor. Mobil cihazlarda çalışan güçlü modeller, gökyüzü bağımlılığını azaltarak yapay zekâyı günlük teknolojinin doğal tek parçası hâline getirebilir.

2 hafta önce
8




























English (US) ·