Speechz Text to speech 1.0

Lisans: Ücret -siz ‎Dosya boyutu: N/A
‎Kullanıcı Derecelendirmesi: 0.0/5 - ‎0 ‎Oy

Hakkı -nda Speechz Text to speech

Speechz Metinden konuşmaya

Konuşma sentezi insan konuşmasının yapay üretimidir. Bu amaçla kullanılan bir bilgisayar sistemi konuşma synthesizer denir ve yazılım veya donanım ürünlerinde uygulanabilir. Metinden konuşmaya (TTS) sistem normal dil metnini konuşmaya dönüştürür; diğer sistemler, fonetik transkripsiyonlar gibi sembolik dilsel temsilleri konuşmaya dönüştürür. [1] Sentezlenmiş konuşma, bir veritabanında depolanan kaydedilmiş konuşma parçalarının biraraya edilmesiyle oluşturulabilir. Sistemler depolanan konuşma birimlerinin boyutunda farklılık gösterir; telefonları veya diphone'ları depolayan, ancak netlikten yoksun olabilecek bir sistemdir. Belirli kullanım etki alanları için, tüm sözcüklerin veya tümcelerin depolanması yüksek kaliteli çıktı sağlar. Alternatif olarak, bir synthesizer tamamen "sentetik" ses çıkışı oluşturmak için ses sistemi ve diğer insan ses özellikleri bir model dahil edebilirsiniz. [2] Bir konuşma synthesizer kalitesi insan sesine benzerliği ve anlaşılma yeteneği ile değerlendirilir. Anlaşılır bir metin-konuşma programı görme engelli veya okuma engelli kişilerin ev bilgisayarında yazılı çalışmaları dinlemelerine olanak tanır. Birçok bilgisayar işletim sistemi 1990'ların başından beri konuşma sentezleyicileri dahil edilmiştir.

Tipik bir TTS sistemine genel bakış

Otomatik duyuru MENÜ0:00 İsveç'e gelen bir treni duyuran sentetik bir ses. Bu dosyayı oynarken sorun mu yaşıyor? Medya yardımına bakın.

Microsoft Sam örneği MENÜ0:00 Microsoft Windows XP'nin varsayılan konuşma synthesizer ses söyleyerek "Hızlı kahverengi tilki tembel köpek üzerinden atlar 1,234,567,890 kez. soi" Bu dosyayı oynarken sorun mu yaşıyor? Medya yardımına bakın. Metin-konuşma sistemi (veya "motor") iki bölümden oluşur:[3] bir ön uç ve bir arka uç. Ön uç iki ana görevi vardır. İlk olarak, sayılar ve kısaltmalar gibi semboller içeren ham metni yazılı sözcüklerin eşdeğerine dönüştürür. Bu işlem genellikle metin normalleştirme, ön işleme veya belirteçleştirme olarak adlandırılır. Ön uç daha sonra her sözcüğe fonetik transkripsiyonlar atar ve metni tümcecikler, yan tümceler ve tümceler gibi prozodik birimlere böler ve işaretler. Sözcüklere fonetik transkripsiyon atama işlemine metinden fonme veya grafeme-to-phoneme dönüştürme denir. Fonetik transkripsiyonlar ve prosody bilgi birlikte ön uç tarafından çıktı sembolik dilsel temsil ilerler. Arka uç—genellikle synthesizer&mdash olarak adlandırılır;sonra sembolik dilsel temsili sese dönüştürür. Bazı sistemlerde, bu bölüm hedef prosody 'nin (pitch kontur, fonme süreleri) hesaplanmasını içerir[4] ve daha sonra çıkış konuşmasına uygulanır.