Google DeepMind'dan 70'ten fazla dilde aksan ve ton kontrolü sunan yeni ses modeli: Gemini 3.1 Flash TTS

12 saat önce 14

Google'ın yapay zeka birimi DeepMind yepyeni metinden sese dönüştürme modeli Gemini 3.1 Flash TTS'i kullanıma sundu. Şirketin belirttiğine göre; önceki robotik modellerin aksine, bu model, kullanıcıların metinleri tabanlı komutlar aracılığıyla konuşma robotunun yanıtlarının sesli stilini, sunumunu ve hızını yönlendirmelerine imkan tanıyor.

Ayrıca Gemini 3.1 Flash TTS, modelin çıkardığı sesi denetlemek için, sesli tonunu ve vurgusunu uyarlayabilen gelişmiş seçenekler sunuyor. Seçenekler arasında hevesli, pozitif sürpriz ve malumatlendirici mekan alıyor. Buna ilave olarak, modeller kullanıcıların çeşitli esas dillerin farklı bölgesel aksanlarını seçmesini da sağlıyor.

Bu özelliklerin yanı sıra kullanıcılar, sağlayan Gemini 3.1 Flash TTS’nin yönetmen düzeyindeki kontrollerini kullanarak modelin başlıkşma stilini ve hızını ayarlayabiliyor. Ayrıca, kullanıcıların seçebileceği format şablonları da mevcut. Bu formatlar arasında podcast sohbeti, sesli kitap anlatıcısı, diller öğretmeni, sesli asistan, sağlık rehberi, haberleri spikeri ve hayır temsilcisi stilleri mekan alıyor. Google'ın belirttiğine göre; kullanıcılar, ortamı tanımlayarak ve kesin konuşma talimatları vererek diledikleri sahneyi hazırlayabilecek. Aynı şekilde kullanıcıların bu ayarları başvuru programlama arayüzü kodu olarak dışa aktarabileceğini da belirtelim.

Gemini 3.1 Flash TTS, daha doğal sesli başlıkşma deneyimleri sunmayı amaçlıyor. Şirketin ifadesine göre; model, Japonca, Hintçe ve Almanca karışmış bulunmak üzere 70'ten fazla dilde daha doğal sesli başlıkşma deneyimleri üretebiliyor. Bu arada modelin tüm çıktılarında SynthID filigranlarına malik olduğunu belirtelim. Böylece Gemini 3.1 Flash TTS tarafından üretilen içerikler basitca belirleme edilebiliyor.

Model, Artificial Intelligence TTS önderlik tablosunda 1211 puanla yaygınlaşan sıralamada ikinciliğe yerleşerek diğer birçok popüler metinden sese dönüştürme modelini geride bıraktı. Geliştiriciler bu modele şu anda Gemini API ve Google AI Studio üzerinden erişebiliyor. İşletmeler, Vertex AI platformu üzerinden kullanıcılar iseGoogle Vids üzerinden Gemini 3.1 Flash TTS'i deneyebilir.

>> Tüm Makaleyi Oku <<

Platformumuz; Teknoloji, Spor, Sağlık, Eğlence, Uluslararası, Edebiyat, Bilim ve daha fazlası olmak üzere farklı konu başlıkları altında, kısa ve öz haber formatı ile kullanıcıların zamandan tasarruf etmesini hedefler. Karmaşadan uzak, sade ve anlaşılır içerik yapısı sayesinde ziyaretçiler aradıkları bilgiye hızlıca ulaşabilir. techforum.com.tr, bilgi kirliliğini önleyerek yalnızca güvenilir kaynaklardan elde edilen içerikleri yayınlamaya özen gösterir.

Google DeepMind'dan 70'ten fazla dilde aksan ve ton kontrolü sunan yeni ses modeli: Gemini 3.1 Flash TTS

İlgili

Cadence ve Nvidia robotik simülasyon sorununa odaklandı

Güncelleme alan modeller genişliyor

Google, Gemini’ye Kişisel Zekâ Destekli AI Görsel Üretimi Ek...

Samsung Gazı Köklüyor: Galaxy S27 Ultra Performansta Seviye ...

Fırsatı Kaçırmayın! Sevilen Yarış Oyunu İndirime Girdi

Google’dan Arama Deneyimine Yeni Adım: AI Mode ile Web Artık...

Papara, TMSF İhalesiyle Emlak Katılım Bankası’na Devredildi

Anthropic CPO’su Mike Krieger, Figma Masasından Kalktı!

Samsung kullanıcılarına müjde: One UI 9 güncellemesi alacak ...

Yapay Zeka Savaşlarında Yeni Atak OpenAI, Codex ile Masaüstü...

Fintech Girişimi Slash 1,4 Milyar Dolar Değerlemeyle Yatırım...

Kapatmak için kaydır özelliğini devre dışı bırakın

Samsung'un Fiyat/Performans Telefonu Yolda! Tasarım Değişiyo...

Lumio Vision 9 (2026) performans odaklı amiral gemisi olarak...

Trendler

Popüler

Google DeepMind'dan 70'ten fazla dilde aksan ve ton kontrolü...

'C31K' hakkında ne biliyoruz? 100 bin üyeli 'dijital cehenne...

Dikey Video Bağımlılarına: Bu Ayar Sayesinde YouTube Shorts'...

App Store'da Deepfake Krizi: Apple Birçok Deepfake Uygulamas...

Resident Evil 0 Remake Eşli Oynanış Desteği ile Gelebilir

Dacia’nın uygun fiyatlı yeni elektrikli aracı testlerde görü...

Bir Psikolojik Korku Oyunu Steam'de Ücretsiz Oldu (Kütüphane...

Liverpool'da sakatlık kabusu. Yıldız ismin aşil tendonu kopt...

Hem müzakere hem restleşme teslim olmayız

Malatya'da uyuşturucu operasyonu: 2 gözaltı

Yapay Zekâ Artık Koddan İbaret Değil: Google, Bir 'Filozof'u...

Xiaomi 18 Pro'da Özel Bir Yapay Zekâ Tuşu Yer Alacak: Peki N...

Oyunlarda Hile Zannettirecek Kulaklık Geliyor! 54 Saat Pil Ö...

Assassin’s Creed Black Flag Resynced Ubisoft Başlatıcısında ...

JD Vance bu sözlere dondu kaldı: Çocukları bombalıyorsunuz!