首頁(yè)>>>技術(shù)>>>voiceXML  語(yǔ)音信箱產(chǎn)品

 

微軟推出.NET Speech SDK聲音應(yīng)用開(kāi)發(fā)環(huán)境 抗衡VoiceXML

2002/05/16

  美國(guó)當(dāng)?shù)貢r(shí)間2002年5月7日~10日,語(yǔ)音界面開(kāi)發(fā)商會(huì)議“AVIOS (Applied Voice Input Output Society) Speech Expo”在美國(guó)圣諾塞市召開(kāi)。其中最受關(guān)注的是美國(guó)微軟發(fā)布的“.NET Speech SDK version 1.0 beta版(.NET Speech SDK)”。

正在使用.NET Speech SDK來(lái)開(kāi)發(fā)可進(jìn)行語(yǔ)音和鍵盤(pán)輸入的窗體

  .NET Speech SDK是使用融語(yǔ)音及圖像等為一體的界面來(lái)構(gòu)筑Web應(yīng)用的開(kāi)發(fā)環(huán)境。與該公司的開(kāi)發(fā)工具--“Visual Studio .NET”配合使用。據(jù)微軟稱,其特點(diǎn)是即使開(kāi)發(fā)人員不具備語(yǔ)音界面方面的特殊知識(shí)也能使用。比如,上圖就是正在使用.NET Speech SDK開(kāi)發(fā)的可進(jìn)行語(yǔ)音及鍵盤(pán)輸入的窗口。文字輸入框右邊的小框是使用SALT(語(yǔ)音應(yīng)用語(yǔ)言標(biāo)簽)語(yǔ)音相關(guān)命令的標(biāo)記。目前,在支持語(yǔ)音功能的Web應(yīng)用的開(kāi)發(fā)中,必須使用面向圖形和面向語(yǔ)音的兩種開(kāi)發(fā)工具!拔覀兊哪康氖翘峁┮粋(gè)使用一種工具就能開(kāi)發(fā)包括圖形和語(yǔ)音的多種界面的環(huán)境”(該公司負(fù)責(zé).NET Speech技術(shù)的市場(chǎng)營(yíng)銷(xiāo)經(jīng)理James Mastan)。

“不打算支持VoiceXML”

  大多數(shù)WWW語(yǔ)音應(yīng)用此前一直都是使用W3C(WWW聯(lián)盟)制定的名為“VoiceXML”的描述語(yǔ)言進(jìn)行開(kāi)發(fā)的。而.NET Speech SDK則支持微軟和美國(guó)SpeechWorks等正在開(kāi)發(fā)的名為“SALT”的描述語(yǔ)言。微軟表示:“不打算支持VoiceXML”。對(duì)于這樣做的原因,微軟的Mastan是這樣解釋的:“VoiceXML主要是面向使用普通電話的語(yǔ)音應(yīng)用開(kāi)發(fā)的。對(duì)于WWW系統(tǒng)的開(kāi)發(fā)商來(lái)說(shuō)使用起來(lái)并不方便。這也是微軟自身在支持語(yǔ)音的系統(tǒng)開(kāi)發(fā)過(guò)程中所體驗(yàn)到的。我們決定采用SALT的目標(biāo)就是為了使WWW系統(tǒng)開(kāi)發(fā)商能輕松地使用描述語(yǔ)言進(jìn)行開(kāi)發(fā)”。

  但是在此次會(huì)議上也出現(xiàn)了不同的動(dòng)向。美國(guó)IBM展出了依據(jù)“XHTML+Voice Profile 1.0”標(biāo)準(zhǔn)、可在安裝“Pocket PC”的PDA上運(yùn)行的多模型Web應(yīng)用,其中“XHTML+Voice Profile 1.0”采用了部分VoiceXML標(biāo)準(zhǔn)。展示負(fù)責(zé)人再次強(qiáng)調(diào)指出:“IBM只使用業(yè)界標(biāo)準(zhǔn)”。而微軟則表示將于2002年夏季“準(zhǔn)備向某些業(yè)界標(biāo)準(zhǔn)化團(tuán)體遞交SALT提案”。

具有語(yǔ)音識(shí)別功能的、面向Pocket PC的應(yīng)用的演示畫(huà)面

  .NET Speech SDK目前為免費(fèi)提供。其中包括設(shè)置Web應(yīng)用的語(yǔ)音輸入/輸出動(dòng)作的工具、用于根據(jù)不同的應(yīng)用來(lái)限制終端用戶語(yǔ)言的語(yǔ)音語(yǔ)法編輯器、語(yǔ)音即時(shí)編輯器、語(yǔ)音調(diào)試工具以及嵌入到WWW瀏覽器(面向個(gè)人電腦的IE)中的試驗(yàn)用插件等。微軟今后還將繼續(xù)強(qiáng)化其功能,在2003年公布正式版以前,準(zhǔn)備追加使用電話的語(yǔ)音識(shí)別功能、支持用于PDA的“Pocket Internet Explorer”的語(yǔ)音識(shí)別插件,以及在終端和服務(wù)器上負(fù)責(zé)語(yǔ)音處理的分散型語(yǔ)音識(shí)別功能等。上圖顯示了具有語(yǔ)音識(shí)別功能的面向Pocket PC的應(yīng)用的演示畫(huà)面。單擊左測(cè)的麥克風(fēng)形狀的圖標(biāo)后,就可以利用語(yǔ)音操作菜單。另外,.NET Speech SDK 1.0版只有英文版,供貨時(shí)間尚未確定的2.0版據(jù)稱將支持日語(yǔ)和其他語(yǔ)言。

日經(jīng)BP社 2002/05/16



相關(guān)鏈接:
Voxeo攜Prophecy10高度亮相SpeechTEK2009 2009-09-03
Voxeo被評(píng)為世界領(lǐng)先的IVR平臺(tái)供應(yīng)廠商之一 2009-06-11
北電推出Meridian Option 11C最新升級(jí)計(jì)劃 2009-06-01
康維可視語(yǔ)音郵件使手機(jī)消息“即點(diǎn)即聽(tīng)” 2009-04-10
谷歌推網(wǎng)絡(luò)電話服務(wù) 比Skype便宜三分之一 2009-03-12

分類(lèi)信息:  國(guó)外動(dòng)態(tài)_與_語(yǔ)音合成TTS  國(guó)外動(dòng)態(tài)_與_語(yǔ)音識(shí)別ASR  國(guó)外動(dòng)態(tài)_與_voicexml  語(yǔ)音合成TTS_與_語(yǔ)音識(shí)別ASR
           語(yǔ)音合成TTS_與_voicexml  語(yǔ)音識(shí)別ASR_與_voicexml