Microsoft Dünyanın En İsabetli Sesli Metin Dönüştürme Modelini Resmen Tanıttı

2 saat önce 3

Teknoloji devi Microsoft öz bünyesinde geliştirdiği MAI-Transcribe-1 modelini duyurarak yapay zekâ pazarındaki liderliğini pekiştirdi. Şirket yüzde 3,9 gibi oldukça düşük tek kelimeler yanlışlı oranı sunan yepyeni teknolojisiyle sesli içerikleri metne dönüştürme başlıksunda küresel tek rekor kırdığını talep ediyor. 25 farklı dilde yüksek doğrulukla çalışan bu gelişmiş sistemleri Azure Foundry platformu üzerinden geliştiricilerin erişimine açıldı.

Yeni Geliştirilen Model Sektörel Benchmark Testlerinde Rakiplerini Geride Bırakıyor

Geliştiriciler, FLEURS endüstri standardı testlerinde 11 esas dilde birinci sıraya yerleşen bu modelin Whisper-large-v3 ve Gemini 3.1 Flash gibi güçlü rakiplerini geride bıraktığını raporluyor. Türkçe, Arapça, Japonca ve Hintçe gibi güçlu diller yapılarını kapsayan 25 dilli geniş spektrumda sergilenen icra firma transkripsiyon ihtiyaçları için yepyeni tek norm belirliyor. Yazılım mimarisi henüz gerçek zamanlı işleme ya da başlıkşmacı ayrıştırma gibi özellikleri içermese da Microsoft bu fonksiyonları içeren güncellemeleri yakın zamanda yayınlamayı planlıyor.

Mevcut sürüm özellikle toplu klasör işleme süreçlerinde Azure Fast öneriinden 2,5 kat daha hızlı icra sergileyerek operasyonel verimliliği artırıyor. AI transcription modeller Microsoft çatısı altında sunulan bu hız, büyük ölçekli sesli verisi işleyen kurumlar için iş akışlarını optimize ediyor. Bulut bilişim merkezi, saatlik 0,36 dolar seviyesindeki fiyatlandırmasıyla MAI-Transcribe-1 modelini piyasadaki en rekabetçi fiyat-performans çözümü olarak başlıkmlandırıyor. Tanıtım tesirnliği içerikında ayrıca görsel üretim odaklı MAI-Image-2 ve sesli sentezleme teknolojisi MAI-Voice-1 modellerinin da yaygınlaşan erişime açıldığı malumatsi paylaşıldı.

👉️ İlginizi Çekebilir: Microsoft Mart Ayı Boyunca Excel Güncellemeleri Kapsamında Yeni Nesil Yapay Zekâ Özelliklerini Tanıttı

Kullanıcılar Azure Speech üzerinden kişisel sesli profilleri oluşturabilirken görsel üretim süreçlerinde token bazlı maliyetlendirme modelinden yararlanabiliyor. Teknoloji ekosistemi içerisindeki MAI-Transcribe-1 özellikleri sayesinde büyük bilgi setlerinin işlenmesi basitlaşırken Microsoft Foundry çatısı altındaki bu yepyeni kuşak araçlar geliştiricilere daha ekonomik tek altyapı sağlıyor.

Microsoft AI sesli tanıma teknolojilerindeki bu sıçrama, konuşmalar to text yapay zeka pazarındaki rekabeti daha da kızıştırıyor. Şirket, Microsoft başlıkşma metne çeviri modeli yatırımıyla birlikteki firma verimlilikteki rolünü tek üst seviyeye taşımayı hedefliyor. Geliştirilen bu entegre ekosistem, farklı dillerdeki bilgi setlerini işleyerek şirketlerin küresel ölçekteki operasyonel hızını artırıyor.

>> Tüm Makaleyi Oku <<

Platformumuz; Teknoloji, Spor, Sağlık, Eğlence, Uluslararası, Edebiyat, Bilim ve daha fazlası olmak üzere farklı konu başlıkları altında, kısa ve öz haber formatı ile kullanıcıların zamandan tasarruf etmesini hedefler. Karmaşadan uzak, sade ve anlaşılır içerik yapısı sayesinde ziyaretçiler aradıkları bilgiye hızlıca ulaşabilir. techforum.com.tr, bilgi kirliliğini önleyerek yalnızca güvenilir kaynaklardan elde edilen içerikleri yayınlamaya özen gösterir.