移動語音互聯網
2003/09/03
1.1 語音互聯網場景
你會說話嗎?會說話就能上網,你不再需要掌握一些基本的輸入方式,你不再需要熟悉小小的鍵盤。張嘴說話,就是你給互聯網下達的指令。從PC到WAP到Voice,每一次浪潮都把互聯網的門檻降低了一大截。
也許有一天,我們可以離開PC、離開筆記本,只是隨手撥通電話,就可以知道當天發(fā)生的國際大事,就可以了解同步的股票行情,還可以知道他鄉(xiāng)的天氣是否合適旅游。通過手機來上網,以說話來代替鍵盤輸入,以語音控制來代替鍵盤控制。伴隨語音識別和文本語音轉換技術、互聯網技術、嵌入式技術、CTI等新技術的不斷發(fā)展,人類用語音征服世界的夢想在逐步實現。我們"說"著上網,"聽"網上大千世界。移動語音互聯網使我們擺脫了鼠標線的束縛,同時使那些沒有電腦的人或有視力障礙的人都能夠得到互聯網上的信息。
1.2 語音互聯網結構

整個語音互聯網由V-ISP接入服務平臺、ICGW信息控制關口、V-ICP內容提供平臺、管理平臺四部分組成。這四部分分別完成不同的功能。
V-ISP接入信息服務平臺、ICGW信息控制服務平臺、中心管理平臺這三個平臺是移動需要在實現語音互聯網項目中建設的平臺。V-ICP內容提供服務平臺則是在現在的ICP網頁內容和應用的基礎上,通過使用標準的語音解釋協(xié)議,實現文字信息語音化的平臺。新太科技對于移動全網的建設建議是基于對目前移動網絡和互聯網的理解上建議的。在全國各個省級單位建設一個V-ISP,在全國建設幾個ICGW,便于統(tǒng)一管理用戶接入和內容接入的問題,有V-ISP完成用戶接入,包括接入處理、媒體處理功能,而ICGW完成對于內容提供商的管理,包括接入、內容審核、計費等功能,做到全網用戶一點接入,一點交費。而對于內容提供商同樣做到一點接入、一點帳務結算。
作為互聯網語音化的核心技術,VXML技術可以實現對文字內容的語音控制。VoiceXML是一個由AT&T, IBM, Lucent and Motorola率先領導及發(fā)起的語音標記語言規(guī)格。通過VXML運行環(huán)境就可以實現網頁HTML內容和電話語音的交互。我們在媒體處理模塊中內嵌了一個VXML解釋器,可以對符合該規(guī)范的網頁內容按客戶的需求進行解釋,實現交互服務。
VXML是一個開放的技術,可以克服傳統(tǒng)一個新的業(yè)務受開發(fā)人員能力的影響的不足。VXML Server把電話、語音、IVR等技術封裝起來,業(yè)務邏輯則可以分離到Web Server上。這樣使得用戶可以通過"寫網頁"的開發(fā)方式來開發(fā)新業(yè)務。業(yè)務設計人員從此不需要關心這些業(yè)務在技術上如何實現,而開發(fā)難度的降低也帶來了開發(fā)周期的縮短,更復雜的新應用成為可能,讓適合做業(yè)務內容的廠家真正做自己擅長的工作。
通過這種方式,各內容提供商則是在現在的ICP網頁內容和應用的基礎上,通過使用標準的語音解釋協(xié)議,VXML運行環(huán)境結合TTS、IVR、ASR(可選)等媒體資源,實現文字信息語音化的平臺。通過VXML運行環(huán)境,ICP廠家只需要在遠端通過一臺WEB服務器編輯好自己的相關業(yè)務內容通過Internet即可為移動用戶提供服務。真正實現了統(tǒng)一管理,包括接入、內容審核、計費等功能,做到全網用戶一點接入,一點交費。而對于內容提供商同樣做到一點接入、一點帳務結算。
1.3 業(yè)務應用場景
信息服務類
交易應用類
娛樂類
教育類
社區(qū)服務類等
新太科技公司供稿 CTI論壇編輯