首頁>>>技術>>>語音應用>>>語音合成(TTS)  語音合成產品

淺談TTS與CTI技術

2004/07/12

  CTI技術使電信和計算機相互融合,克服了傳統電信和計算機服務相對單一的缺點,將兩者完美結合了起來。其應用領域非常廣泛,任何需要語音、數據通信,特別是那些希望把計算機網與通信網結合起來完成語音數據信息交換的系統都會用到CTI技術。

TTS即語音合成技術(Text To Speech),它涉及聲學、語言學、數學信號處理技術、多媒體技術等多個學科技術,是中文信息處理領域的一項前沿技術,實現把計算機中任意出現的文字轉換成自然流暢的語音輸出。

  TTS在CTI系統中可以應用在IVR(交互式語音應答)服務器上,以提供語音交互式平臺,為用戶電話來訪提供語音提示,引導用戶選擇服務內容和輸入電話事務所需的數據,并接受用戶在電話撥號鍵盤上輸入的信息,實現對計算機數據庫等信息資料的交互式訪問。

  在IVR中應用TTS可以自動將文本信息轉換為語音文件,或者實時地將文本信息合成語音并通過電話發(fā)布。實現文本與語音自動雙向轉換,以達到人與系統的自動交互,隨時隨地為客戶服務。維護人員不必再人工錄音,只須將電子文檔引入系統中,系統可以自動將電子文檔轉換為語音信息播放給客戶。數據庫中存放的大量數據,無需事先進行錄音,能夠隨時根據查詢條件查出并合成語音進行播報,從而大大減少了座席人員的工作負擔。

  那么應如何將TTS功能附加到CTI應用中呢?某些比較先進的交換平臺,已經在交換機的內部實現了TTS的功能,并作為標準接口的一部分對外提供,業(yè)務開發(fā)商只需要簡單的調用他們即可以在業(yè)務中使用該功能。

  對于未實現TTS功能的PBX,就需要業(yè)務開發(fā)商自己去選擇合適的平臺,在此基礎上進行二次開發(fā),即調用所選TTS平臺提供的標準接口,實現語音合成功能。

  目前CTI已經成為全球發(fā)展最為迅猛的產業(yè)之一,每年以50%的速度增長,CTI如同計算機產業(yè)一樣是一個金字塔形的產業(yè)鏈,從上到下會以至少20倍的幅度增值。TTS作為一種誘人的新技術,如果能很好的嵌入到增值業(yè)務的應用中去,必將形成一個更好的應用前景。

  杭州音通軟件有限公司是由國家教育部和浙江省人民政府聯辦并依托浙江大學而成立的高新技術公司,音通公司主要致力于計算機語音技術的研發(fā)并逐步開拓語音識別、語音流媒體傳輸等其它語音領域的研究。其核心技術(Intone_TTS)是具有自主知識產權的中文語音合成技術,在由浙江省科技廳組織的鑒定中被專家一致鑒定為國內領先地位,并已申請多項國家專利。

  Intone_TTS是一套把文本信息轉換為語音信息的開發(fā)工具包,為系統集成商、軟件開發(fā)商提供了完備的接口函數和編程示例,使用戶能夠靈活的進行調用,并集成到其它應用系統中。接口需要語音合成運行庫的支持,適合多種開發(fā)環(huán)境。開發(fā)者可以根據具體的應用場合進行選擇。

  它能夠對所有的漢字、英文、阿拉伯數字進行語音合成;
  支持繁體字及多音字的編輯;
  合成效果:自然、平滑;
  規(guī)范的函數調用接口,同時支持微軟SAPI的調用;支持同步調用和異步調用方式;
  支持PCM Wave,uLaw/aLaw Wave,ADPCM,Dialogic Vox等多種語音格式;
  支持GB2312碼(簡體中文)、BIG5碼(繁體)、UNICODE碼;
  支持多路通道同時合成;
  支持Dialogic、東進、三匯等主流語音板卡;

杭州音通軟件公司供稿 CTI論壇編輯



相關鏈接:
2004年度國家科技成果重點推廣計劃捷通華聲榜上有名 2004-06-28
開放式語音架構與新一代呼叫中心應用 2004-04-23
自然語言理解技術,智能信息服務的核動力 2004-04-19
有背景音樂,語音服務更好聽了 2004-04-13
蘋果為盲人推出語音界面 2004-04-09

分類信息:     文摘   技術_語音合成_文摘