TTS(text to speech),又稱為文語轉換或機器朗讀系統。
ASR(Automatic Speech Recognization)又稱語音識別系統。
三匯公司最早于1995年開發(fā)成功第一代漢字語音庫,該語音庫采用真人錄音,并附加了漢字文本與相應語音之間的檢索表,可以實現簡單的TTS應用。1999年三匯與IBM公司合作,成為IBM中文語音識別系統在國內最早的推廣應用者。
三匯關于中文TTS和語音識別的軟件產品有:
漢字語音庫
真人發(fā)音,支持全部的漢字發(fā)音,并提供二級字符內碼與語音庫偏移量的索引表?捎糜诤唵蔚腡TS應用,例如播放數字、人名、地名、股票名稱等。提供C語言編程示例源代碼,適用于任何操作系統和任何語音卡。
中文TTS系統
完整的中文TTS系統,具有海量詞庫,能正確識別多音字,能正確掌握朗讀的語調和節(jié)奏。采用可選的男聲或女聲真人發(fā)音,可調的音量、語速和語調,具有較好的真實感,主觀可懂度大于99%。適用于IVR系統的語音提示,有聲EMAIL系統,大容量新聞信息發(fā)布等應用,可以省去繁瑣的預先錄音工作,支持全部型號的三匯語音卡。
系統可工作于預先合成和實時動態(tài)合成兩種方式,采用客戶/服務器結構支持多通道大容量系統。
支持操作系統:
WINDOWS NT 4.0
WINDOWS 2000
使用編程工具:
VB、VC、BC、VF、PB、DELPHI等,提供豐富的編程序查源代碼。
IBM Viavoice Telephoney中文電話語音識別系統
三匯語音卡為國內最早集成IBM ViaVoice Telephony語音識別系統的公司,應用最成熟,是IBM公司在國內語音識別領域最重要的合作伙伴和系統經銷商。所有三匯語音卡均支持IBM ViaVoice Telephony語音識別系統,同時該系統也為使用者提供了一個開放式的語音識別引擎和完善的應用開發(fā)環(huán)境,用戶可以方便快捷地在電話系統中集成語音識別功能,為聲訊服務系統、電子商務平臺和涉及電話通信的語音應用系統提供語音交互界面。
性能特點:
◆語音識別引擎采用實際電話信道的語音樣本,連續(xù)語音識別率高。
◆語音識別引擎沒有特定授話人的限制,對于各種不同信噪比的電話信道均具有很好的適應性。
◆電話語音應用系統伸縮性較強,不僅可以運行在單機系統上,而且可以擴展為多引擎、多服務器的大型企業(yè)級應用。
◆語音合成自然清晰,易于理解。
◆語音識別引擎可以辨識無限量的詞匯表。
◆輸入語音即可添加詞匯,也可以在系統運行狀態(tài)下對詞匯集進行動態(tài)添加,添加方法靈活。
◆與硬件無關的C/C++應用編程接口,可以方便地掛接語音識別引擎和語音合成引擎。
◆可以輸出不同候選結果及相似度得分。
杭州三匯公司供稿 CTI論壇編輯