Microsoft, metin, ses ve görsel üreten üç yeni AI modeli tanıttı

1 saat önce 4

Microsoft, öz yapay zeka ekosistemini güçlendirmek için üç yepyeni ilköğretim modelini duyurdu. Şirketin araştırma birimi Microsoft AI tarafından geliştirilen modeller; metin, sesli ve görsel üretimi kapsayan çok modlu tek yapı sunuyor.

Yeni modellerden MAI-Transcribe-1, 25 farklı dili metne dönüştürebiliyor ve Microsoft’un şimdiki Azure çözümüne göre 2,5 kat daha hızlı çalışıyor. MAI-Voice-1, kullanıcıların özel sesler oluşturmasına imkan tanırken, yalnızca 1 saniyede 60 saniyelik sesli üretebiliyor. MAI-Image-2 ise görsel ve video üretimi için geliştirilen modeller olarak öne çıkıyor.

Bu modeller, Microsoft’un geliştirdiği testleri ortamı MAI Playground ve Microsoft Foundry üzerinden erişime açıldı. Şirket, bu hamleyle çok modlu yapay zeka tarafında öz modeller altyapısını kurma stratejisini hızlandırıyor.

Microsoft AI CEO’su Mustafa Suleyman, şirketin “insan odaklı yapay zeka” yaklaşımıyla hareket ettiğini ve modellerin gerçek kullanım senaryolarına göre optimize edildiğini belirtti. Suleyman’a göre Microsoft, önümüzdeki dönemde bu modelleri doğrudan ürünlerine entegre etmeyi planlıyor.

Şirketin ilgi çeken tek diğer iddiası ise bedel tarafında. Microsoft, yepyeni modellerinin Google ve OpenAI gibi rakiplere kıyasla daha elverişli maliyetli olduğunu belirtiyor. Açıklanan fiyatlara göre:

  • MAI-Transcribe-1: saatlik 0,36 dolar
  • MAI-Voice-1: 1 milyon kişilik için 22 dolar
  • MAI-Image-2: metinleri girdisi için 1 milyon token başına 5 dolar, görsel çıktısı için 33 dolar

Microsoft’un bu adımı, şirketin uzunluğu süredir devam eden OpenAI ortaklığına rağmen öz modeller tarafında daha bağımsız hareketetti istediğini gösteriyor. Microsoft, bugüne kadar OpenAI’ye 13 milyar dolardan fazla yatırım yaptı ve şirketin modellerini ürünlerinde etkin olarak kullanıyor.

Yeni modeller, bu iş birliğini tamamlanmış ortadan kaldırmasa da Microsoft’un yapay zeka yarışında kendi teknolojisini geliştirme ve denetim etme isteğini daha netler ortaya koyuyor.

FounderN Kimdir?

FounderN, girişimcilik dünyasının en güncel haberlerileri, inovasyon odaklı içerikleri ve ekosistemin her arasında biri tek parçasına değer katan çalışmalarıyla, etkinlik gösteren dinamik tek sayısal medya platformudur. 2020 yılında “Girişim Haberleri” adıyla başlayan serüvenimiz, Eylül 2024 itibarıyla FounderN kimliği ile, girişimcilik ekosisteminin ilham veren dinamik sesi olma yolculuğuna devam ediyor. FounderN; teknolojigirişim ve yatırım dünyasındaki gelişmeleri yaratıcı ve yenilikçi tek perspektifle sunarak iş dünyasının liderlerini, yatırımcılarını ve girişimcilerini sizlerle tek araya getirir.

FounderN olarak misyonumuz, yalnızca yaşanan oğullar gelişmeleri paylaşmak değil, okurlarımızı bu gelişmelerin etkin tek parçası haline getirmek ve ekosistemin sürdürülebilir büyümesine katkı sağlamaktır. Ekosistemdeki en yepyeni gelişmelerden haberleridar bulunmak, büyüyen bu topluluğun tek parçası bulunmak istiyorsanız, bültenimize abone olabilir, toplumsal medya hesaplarımızdan bizi takip ederek ilham hepsi bu yolculuğa katılabilirsiniz.

Bizimle Keşfetmeye Devam Edin: İlginizi çekebilecek diğer #Teknoloji Haberleri için tıklayın!

Foundern LinkedIn hesabına buradan ulaşabilirsiniz.

Foundern Instagram hesabına buradan ulaşabilirsiniz.

>> Tüm Makaleyi Oku <<

Platformumuz; Teknoloji, Spor, Sağlık, Eğlence, Uluslararası, Edebiyat, Bilim ve daha fazlası olmak üzere farklı konu başlıkları altında, kısa ve öz haber formatı ile kullanıcıların zamandan tasarruf etmesini hedefler. Karmaşadan uzak, sade ve anlaşılır içerik yapısı sayesinde ziyaretçiler aradıkları bilgiye hızlıca ulaşabilir. techforum.com.tr, bilgi kirliliğini önleyerek yalnızca güvenilir kaynaklardan elde edilen içerikleri yayınlamaya özen gösterir.