Alibaba bünyesindeki Qwen ekibi, yapay zeka dünyasında dmanieri değiştirecek Qwen 3.5 Small Model Serisi’ni resmen tanıttı. 0.8B, 2B, 4B ve 9B parametre seçenekleriyle gelen bu yepyeni seri, özellikle mobil cihazlarda ve düşük güç tüketimi lüzumtiren senaryolarda yüksek icra sunmak üzere optimize edildi. Serinin en ilgi çeken üyesi olan Qwen3.5-9B, kompakt yapısına rağmen kendisinden hacimce çok daha büyük rakiplerine meydan okuyor.
Devlerle Yarışan Kompakt Güç
Yeni serinin amiral gemisi niteliğindeki Qwen3.5-9B, yapılan benchmark testlerinde şaşırtıcı sonuçlara imza attı. Model, lisansüstü düzeyde muhakeme ve çok dilli malumat testlerinde, parametre sayısı bakımından kendisinden 13,5 kat daha büyük olan OpenAI‘ın açık kaynaklı gpt-oss-120B modelini geride bıraktı. GPQA Diamond karşılaştırmasında 9B modeli 81,7 puan alırken, gpt-oss-120B modeli 80,1 puanda kaldı. Bu durum, modeller boyutunun artık tekbaşına başına belirleyici tek faktör olmadığını, mimari verimliliğin ön plana çıktığını gösteriyor.
qwenVerimli Hibrit Mimari ve Bellek Duvarı
Qwen 3.5 serisinin başarısının arkasında yatan teknikleri temel, “Verimli Hibrit Mimari” yaklaşımına dayanıyor. Standart Transformer mimarilerinden farklılaşan Alibaba, bu seride Gated Delta Networks (bir tür doğrusal ilgi mekanizması) ile seyrek Mixture-of-Experts (MoE) yapısını birleştiriyor. Bu stratejiklik hamle, küçük modelleri genelleme kısıtlayan ve sektörde “bellek duvarı” olarak bilinen sualnu ortadan kaldırıyor. Sonuç olarak, daha yüksek işlem hacmi ve önemli ölçüde daha düşük erteleme süreleri elde ediliyor.
Çok Modlu Yetenekler ve Ticari Kullanım
Doğal olarak çok modlu (multimodal) tek yapıya malik olan Qwen 3.5, görsel manaa başlıksunda da iddialı. 4B ve 9B modelleri, daha önce bağlı kat daha büyük modellerin yapabildiği görsel analizleri başarıyla gerçekleştiriyor. MMMU-Pro görsel muhakeme ölçütünde Gemini 2.5 Flash-Lite gibi güçlü rakipleri geride bırakan modeller, arayüz öğelerini okuma ya da videodaki nesneleri sayma gibi karmaşık görevleri basitlıkla seçenek getirebiliyor.
Modellerin ağırlıkları, Apache 2.0 lisansı altında Hugging Face ve ModelScope üzerinden küresel erişime açıldı. Bu hamle, firma şirketlerin ve girişimcilerin modelleri ticari tasarılerinde özgürce kullanabilmesine ve özelleştirebilmesine olanak tanıyor.
”Yapay Zeka Destekli İlaç Keşif Platformu Antiverse, 9,3 Milyon Dolarlık Seri A Turunu Tamamladı!” içeriğimizin detayları için tıklayın!
FounderN Kimdir?
FounderN, girişimcilik dünyasının en güncel haberlerileri, inovasyon odaklı içerikleri ve ekosistemin her arasında biri tek parçasına değer katan çalışmalarıyla, etkinlik gösteren dinamik tek sayısal medya platformudur. 2020 yılında “Girişim Haberleri” adıyla başlayan serüvenimiz, Eylül 2024 itibarıyla FounderN kimliği ile, girişimcilik ekosisteminin ilham veren dinamik sesi olma yolculuğuna devam ediyor. FounderN; teknoloji, girişim ve yatırım dünyasındaki gelişmeleri yaratıcı ve yenilikçi tek perspektifle sunarak iş dünyasının liderlerini, yatırımcılarını ve girişimcilerini sizlerle tek araya getirir.
FounderN olarak misyonumuz, yalnızca yaşanan oğullar gelişmeleri paylaşmak değil, okurlarımızı bu gelişmelerin etkin tek parçası haline getirmek ve ekosistemin sürdürülebilir büyümesine katkı sağlamaktır. Ekosistemdeki en yepyeni gelişmelerden haberleridar bulunmak, büyüyen bu topluluğun tek parçası bulunmak istiyorsanız, bültenimize abone olabilir, toplumsal medya hesaplarımızdan bizi takip ederek ilham hepsi bu yolculuğa katılabilirsiniz.
Bizimle Keşfetmeye Devam Edin: İlginizi çekebilecek diğer #Teknoloji Haberleri için tıklayın!
Foundern LinkedIn hesabına buradan ulaşabilirsiniz.
Foundern Instagram hesabına buradan ulaşabilirsiniz

2 hafta önce
10




























English (US) ·