Speech Synthesis atau sintesis pidato adalah kemampuan sebuah komputer untuk menghasilkan suara yang menyerupai suara manusia. Meskipun mereka tidak bisa meniru spektrum penuh irama manusia dan intonasi. Sebuah sistem komputer yang digunakan untuk tujuan ini disebut synthesizer pidato, dan dapat diimplementasikan dalam perangkat lunak atau hardware. Speech Synthesis adalah termasuk sebuah teks-to-speech (TTS), yaitu sistem mengkonversi teks ke dalam pidato bahasa normal. Kebanyakan perangkat lunak text-to-speech dapat membaca file berbasis teks dengan suara-suara alam dengan menggunakan mesin berbagai suara. Suara teks-to-speech engine di Vista adalah Microsoft Anna, dan Microsoft Sam pada Windows XP. Vista pengguna dapat mendengar suara sangat jelas dari Anna, dan kualitas suara Anna Microsoft jauh lebih baik daripada Microsoft Sam. Sintesis pidato Windows program yang disebut narator telah dikirimkan dengan Windows2000, Windows XP dan Vista. Bila pengguna Windows ingin mendapatkan suara tidak hanya membaca tetapi juga file audio seperti gelombang dan file mp3 pidato, mereka dapat menginstal bebas teks-to-speech dan panopreter text-to-mp3 aplikasi yang ditawarkan oleh panopreter.com. Hal membaca file teks dan mengkonversi pidato menjadi gelombang dan mp3 file, pengguna dapat mengimpor file audio yang dihasilkan ke perangkat portabel, dan mendengarkan mereka sambil berjalan, jogging atau Komuter untuk bekerja.
Speech sintesis menjadi alat bantu teknologi vital dan penerapannya di daerah ini sangat signifikan dan luas, sekarang umum digunakan oleh orang-orang dengan disleksia dan kesulitan membaca lainnya maupun oleh anak-anak pra-melek. Sementara itu, aplikasi sintesis pidato dan gadget pada bahasa alat belajar. Teknik sintesis Pidato sekarang juga digunakan dalam produksi hiburan seperti game, anime dan yang sejenis, dan banyak digunakan dalam produk telekomunikasi juga.
Multimodal pidato sintesis (kadang-kadang disebut sebagai visual pidato sintesis-audio) menggabungkan wajah animasi disinkronkan untuk melengkapi pidato disintesis. Kesulitan yang sama yang mendasari gangguan berbicara individu sering menghalangi kemampuan mereka untuk berkomunikasi melalui ekspresi wajah. Meskipun pidato disintesis semakin hidup seperti, mungkin beberapa waktu sebelum ini mendekati kapasitas untuk nuansa ucapan yang alami. sistem Multimodal menggabungkan sarana menambah isyarat non-verbal untuk pidato (seperti kepala-gemetar, tersenyum, dan mengedip, misalnya) untuk membuat pengguna arti sejelas mungkin.
Sumber : http://www.techtext.net/id/information-technology/computer-speech-synthesis-software.html