Microsoft AI, metin, sesli ve görüntü üretebilen MAI-Transcribe-1,MAI-Voice-1 ve MAI-Image-2 bulunmak üzere üç ilköğretim yapay zeka modelinin piyasaya sürüldüğünü duyurdu.
Microsoft'un paylaştığı malumatlere göre, Microsoft'un Azure Fast hizmetinden 2,5 kat daha hızlı olan MAI-Transcribe-1, 25 farklı dildeki başlıkşmayı metne dönüştürüyor. Arka planlayan gürültüsü, düşük kaliteli sesli kayıtları ve üst üste binen başlıkşmalar gibi güçlu koşullar gözetilerek tasarlanan modelin; kafe, büro ve müzik gibi gerçek yaşam senaryolarında testleri edildiği belirtiliyor. Modelin altyazı üretimi, podcast transkripsiyonu, toplantı arşivleme, çağrı orta analizi gibi çevrimdışı uygulamaların yanı sıra gerçek zamanlı toplantı transkripsiyonu ve dikte gibi düşük gecikmeli çevrimiçi görevler için da elverişli olduğu ifadeleri ediliyor. Model, Copilot'un Sesli Modu ve Microsoft Teams ile aşamalı olarak entegre ediliyor.

Ses üretme modeli MAI-Voice-1 ise kullanıcıların tek saniyede 60 saniyelik sesli üretmesine ve özel tek sesli oluşturmasına imkan tanıyor.
Video üretim modeli MAI-Image-2, fotogerçekçilik başlıksunda önemli tek adım atıyor. Model, doğal ışık, doğru deri tonları ve gerçekçi ortamlar sunarak kullanıcıların post-prodüksiyon sürecinde harcadığı zamanı azaltmayı hedefliyor. Şirketin belirttiğine göre; görsel içinde metinleri oluşturma başlıksunda da güçlü tek icra sergileyen model; poster, infografik, slayt ve diyagram gibi içeriklerde tutarlı sonuçlar üretiyor

MAI-Image-2'nin birinci olarak 19 Mart'ta yepyeni tek büyük diller modeli testleri yazılımı olan MAI Playground'da piyasaya sürüldüğünü belirtelim. Artık bu üç modeller Microsoft Foundry'de piyasaya sürülüyor. Ayrıca transkripsiyon ile sesli modellerinin MAI Playground'da da mekan aldığını ekleyelim.
Fiyatlandırma açısından baktığımızda MAI-Transcribe-1, zaman başına 0,36 dolardan başlıyor. MAI-Voice-1, 1 milyon kişilik başına 22 dolardan başlarken, MAI-Image-2, metinleri girdisi için 1 milyon token başına 5 dolardan, görüntü çıktısı için 1 milyon token başına 33 dolardan başlıyor.
Modeller, Microsoft AI CEO'su Mustafa Suleyman'ın liderliğindeki Microsoft'un MAI Superintelligence ekibi tarafından geliştirildi. tek AI araştırma ekibi olan MAI Superintelligence ekibi Kasım 2025'te kuruldu. Suleyman, bir röportajında Microsoft'un öz modellerini piyasaya sürmesine rağmen OpenAI ile olan ortaklığına olan bağlılığını sürdürdüğünü dile getirmişti. Suleyman, verdiği başka tek demeçte ise bu ortaklığın yakın zamanda yeniden müzakere edilmesi sayesinde Microsoft'un bu süper zeka araştırmasını gerçekten sürdürebildiğini belirtti.
Geçtiğimiz aylık donanım açısından tesirli akıl yürütme modeli Phi-4-reasoning-vision-15B'yi duyuran Microsoft, 2025'in ekim ayında MAI-Image-1 ile gündeme gelmişti. Şirket, 2025'in Ağustos ayında ise MAI-Voice-1 ve MAI-1-preview modellerini tanıtmıştı.

1 saat önce
3




























English (US) ·