首頁>>廠商>>語音識別與合成>> 捷通華聲

捷通華聲語音網站解決方案

2001/11/16

1.1 背景和現狀

隨著互聯網的發(fā)展,網絡的硬件設備的容量和技術水平在不斷提高,網絡帶寬正在持續(xù)快速增長和放大;在軟件方面,流媒體、語音合成等技術也日臻成熟;ヂ摼W硬件水平和軟件技術的相互作用,為語音、圖形圖象、動態(tài)影像等大容量數據在互聯網上的傳送提供了可能。

近年來,一些語音網站紛紛開通,其中比較著名是2000年4月18日在英國誕生的全球首位互聯網虛擬主持人:安娜諾娃(Ananova,www.ananova.com)。從技術角度分析,安娜諾娃的實現,基于三項主要的技術,即數字動畫技術、語音合成技術和流媒體技術。數字動畫技術可以為安娜諾娃創(chuàng)建人類的表情,語音合成技術可以將新聞的內容合成為人類的語言,流媒體技術可以使用戶在線收看、收聽安娜諾娃所播報的新聞。

在中國,也先后出現了類似的網站,諸如香港一家電視臺的“Icy”, 51Go網站的“GoGirl”和天津電視臺的“言東方”等等。

但是,以上這些以漢語為信息載體的虛擬主持人(語音網站)或者沒有實現語音方式,或者聲音全部是用人工提前錄音的方式錄制的,沒有實現用計算機進行實時動態(tài)合成。

1.2 捷通華聲語音網站方案解決的技術問題

1.3解決方案之一:jTTS—Service語音服務器方案

語音服務器-IIS服務器-瀏覽器

語音服務器方案是指利用捷通華聲在CTI領域成熟應用的jTTS Service語音服務器,增加一臺或多臺語音服務器到現有的IIS服務系統的網絡環(huán)境中;在IIS服務器中,增加訪問語音服務器的功能。當IIS服務器需要流媒體輸出時,向語音服務器發(fā)出請求,語音服務器接受IIS服務器的請求,并對請求的數據進行合成、格式轉換,得到流媒體后返回給IIS服務器,IIS服務器再將此流媒體傳輸給用戶。

(1) jTTS Service

(2)ASP(用于響應Web頁面請求、播放的腳本程序、ASP程序)

在本方案中,語音服務器是構建語音網站的后臺。jTTS Service將處于監(jiān)聽某一TCP/IP端口狀態(tài),響應來自IIS服務器的多用戶請求。而IIS服務器則增加通過TCP/IP請求服務器和接受服務器返回數據的程序,來完成流媒體獲得的功能。

瀏覽器端(Explorer)發(fā)出瀏覽請求,網站服務器(IIS)根據請求查找流媒體(音頻流)文件,如有,則將流媒體返回客戶端,并啟動客戶端的MS media player播放流媒體。若沒有,則向語音服務器(jTTS Service)發(fā)出合成請求,并將所需合成的文本通過Socket接口傳送至語音服務器;語音服務器響應網站服務器的合成請求后,將調用jTTS合成技術進行語音合成,并調用WMF SDK將生成的音頻文件轉換成流媒體格式ASF;通過Socket接口返回IIS服務器端后,將此流媒體文件存儲到指定的Web目錄,同時將流媒體返回瀏覽器端,啟動MS media player播放。其流程如下:

 

(1)可實現語音服務器的分布式工作方式,對客戶端的請求自動調度,平衡負載,以達到更高的性能。

(2)適用于訪問量大(同時60線程及以上并發(fā)合成)的門戶網站或提供虛擬主機的IDC、ASP。

(3) 對現有的IIS服務系統不產生影響,也無需硬件升級,只需在IIS服務器上安裝客戶端軟件。

(4)投入少、實現簡單,只需增加一臺或多臺語音服務器(視服務量大小,建議配置:PIII550 128M 10G以上)到現有的IIS服務系統的網絡環(huán)境中。

1.服務器端

語音服務器:

(1)一臺或多臺語音服務器(視服務量大小建議配置:PIII550 128M 10G以上)。

(2)NT4.0、SP4及以上、WMF SDK4.0及以上或Windows 2000、WMF SDK4.0及以上。

(3)jTTS Service(捷通華聲TTS服務器)服務器端軟件。

IIS服務器:

(1)jTTS Service (捷通華聲TTS服務器)客戶端軟件。

2.Web頁面端

(1)加入傳播參數的腳本,加入調用播放器的腳本文件(mediaplayer.asp)。

(2)加入播放參數(播放文件標志、播放引擎)。

1.4解決方案之二:jTTS-Web Service Pack語音網站服務包方案

語音網站服務包+IIS服務器-瀏覽器

與語音服務器方案不同的是,語音網站服務包方案不添加語音服務器,而是在IIS服務器中安裝捷通華聲語音網站服務包,從而構成集網站服務器(IIS)、語音服務器(TTS)于一身的語音網站服務器。其工作方式與語音服務器方案大致相同。當IIS服務器響應瀏覽器請求需要流媒體輸出時,通過內部COM控件向底層的jTTS發(fā)出請求,jTTS依據COM所傳遞的參數,對請求的數據進行合成、格式轉換后,直接將此流媒體傳輸給客戶端的瀏覽器。

 

(1)COM控件(TTSPlayer.dll,用于鏈接Web腳本和TTS合成引擎jTTS_ma.dll的動態(tài)鏈接程序)

(2)jTTS SDK

在語音網站服務器中,語音服務器位于系統的底層,其作用是響應來自IIS服務器的請求服務,來完成流媒體的生成。

瀏覽器端(Explorer)發(fā)出瀏覽請求時,加在Web頁面的服務器端ASP程序和腳本程序自動響應,根據請求查找流媒體(音頻流)文件,如有,則將流媒體返回客戶端,并啟動客戶端的MS media player播放流媒體。若沒有,則向通過COM控件(TTSPlayer.dll)的傳遞函數向COM傳遞參數,并發(fā)送合成請求;COM控件根據參數和請求調用捷通華聲語音合成系統jTTS(jTTS_ma.dll)生成Wave格式的音頻文件,并返回給COM控件;COM控件得到之后再調用WMF SDK將所生成的音頻文件轉換成流媒體格式ASF,在保存到指定目錄后開始將此流媒體返回客戶端,啟動MS media player播放。其流程如下:

(1)投入少,實現簡單,不需增加任何硬件設備,性價比高。

(2)適用于訪問量不大(同時60線程左右并發(fā)合成)的企業(yè)、機關及各類網站或提供虛擬主機服務的IDC、ASP。

(3)對現有的IIS服務系統影響小,需在IIS服務器上安裝jTTS-Web Service Pack軟件。

 

 

1.服務器端

對IIS服務器的要求是SP4及以上,增加以下組件

jTTS SDK2.1、添加并注冊COM控件(TTSPlayer.dll)、WMF SDK4.0及以上。

2.Web頁面端

(1)加入傳播參數的腳本,加入調用播放器的腳本文件(mediaplayer.asp)。

(2) 加入播放參數(播放文件標志、播放引擎)。

 

捷通華聲供稿 CTI論壇編輯



相關鏈接:
捷通華聲發(fā)布jASR5.5 ASR價格面前將無怯步 2008-04-16
捷通華聲TTS成功登陸中國郵政儲蓄銀行 2008-04-03
捷通華聲 jTTS 5.5 全面支持 MRCPv2標準 2008-03-31
捷通華聲移動導航HCI解決方案廣受青睞 2008-03-26
身邊的“智能”生活 2007-12-28