IBM ViaVoice:軟件革命“說出來”
2001/10/10
科技的使命之一是便利人們的工作、生活。自然語音的機器識別技術正體現(xiàn)了這一點。通俗地說,語音識別就是讓計算機能聽懂人類說話。近年來,語音技術的飛速發(fā)展。人類利用自然語言直接與電腦交流,已經(jīng)成為現(xiàn)實。有了語音識別技術,鍵盤、鼠標離“下崗”的日子也就不遠了。
IBM公司作為語音識別技術的先驅,從事這個領域的研究已經(jīng)有30多年歷史,并獲得了近百項專利,在全球建立了完整的專家隊伍。IBM ViaVoice語音識別軟件是IBM語音識別的旗艦產(chǎn)品之一,它的主要功能有兩個:一是基于句子的文字錄入,二是基于詞匯的命令驅動。利用這兩個基本功能,人們已經(jīng)構造出許多應用。目前我們能夠看到的應用包括:聲控游戲、聲控文字編輯、自動語音查詢、語音輸入網(wǎng)上聊天、語音輔助教學等等。
IBM ViaVoice語音識別軟件最基本的應用,就是讓計算機使用者不必動手就能完成文字輸入和格式編排等工作,輸入速度快,操作簡單,可以直接在Word97中聽寫。并且能用語音控制計算機,無論何種程序動動口,就能關閉程序,改變桌面布局。
在中文語音識別方面,1997年IBM推出了世界上第一個中文連續(xù)語音識別產(chǎn)品——ViaVoice 4.0。該軟件成功突破連續(xù)語音、大詞匯量、非特定識別人的難關,成功解決了漢語同音字多、有聲調(diào)、口音復雜等問題,幫助人們從繁雜的鍵盤輸入中解脫出來,被認為是漢字輸入的重要里程碑。2000年,IBM推出新一代語音識別產(chǎn)品IBMViaVoice7.0(世紀)版,進一步提高了識別的準確性并增強了編輯及語音上網(wǎng)瀏覽的功能,使人們可以用語音命令自然、輕松地控制和操作臺式電腦。
現(xiàn)在,對于日常的句子,IBM ViaVoice的識別率很高,在90%以上,而對于有限個詞匯的識別,甚至可以達到99.9%以上。另外,IBM ViaVoice還有能聽懂多種方言的版本。
隨著Internet與移動計算技術的發(fā)展,語音技術正在被越來越多地應用到Internet和手持設備中。未來的應用設備將越來越小,移動電話、掌上電腦、PDA的發(fā)展更需要語音識別技術的支持。對于機頂盒、車內(nèi)Web應用設備的潛在市場,也將需要大量的語音識別服務軟件。另外,隨著Internet發(fā)展所帶來的多樣化需求,通過語音獲得信息和服務也促進了電子商務未來的發(fā)展。有人預言,語音識別技術將帶來網(wǎng)上業(yè)務方式的革命,并最終產(chǎn)生世界級的電子商務企業(yè)。
IBM供稿 CTI論壇編輯
ViaVoice語音上網(wǎng)新概念 2001-11-14 |
IBM ViaVoice更方便更健康 2001-11-14 |
語音識別重在應用 2001-11-14 |
IBM ViaVoice Telephony——完善的中文電話語音技術 2001-11-14 |
CRM中的IBM語音技術 2001-10-10 |