首頁>>廠商>>語音識別與合成>>Acapela

發(fā)表評論分享按鈕

Acapela:人人能企及 玩轉TTS

2012/02/21

  信息的世界,聲音接收更有效

  信息化的時代拼的是接收信息的效率。為了接收更多的信息,我們開始嘗試各種信息處理的方式,我們開始嘗試創(chuàng)造信息、接受信息和傳遞信息同步。耳朵的功能越來越強大,要歸功于IT技術為我們提供了新的接收信息的方式。而當人們習慣了聽聲音而不是看文字的時候,卻可能意識不到,在我們生活的很多方面都靠的是一個技術——語音合成技術(Text To Speech)

  TTS技術應用之廣泛你或許沒有意識到。但是,當你開啟汽車上的導航,導航中溫柔的女聲為你指路,這就是TTS;當你打開電子詞典按下讀音,詞典用標準的聲音告訴你單詞的發(fā)音,這是TTS;當你在故宮旅游考慮用電子導游為你介紹各個景點,這是TTS;當你要從ATM機里取現(xiàn)金,機器告訴你操作的每一步,這是TTS;還有你大學課堂中的交互式英語,你的寶寶的語音讀物……這么一說,TTS無所不在,生活不自覺地被改變。

  談起TTS對生活的改變, 世界領先的語音專家Acapela的CEO Antoine Kauffeisen頗有感想:“TTS技術在全球范圍內改變著人們的生活,便利生活的方方面面。語音解決方案的廣泛應用也在改變著人們日常生活中獲取信息的方式。語音為我們帶來了更好的溝通,更有效的學習,更大程度上的分享,更便利的駕駛以及對熱點新聞更及時的追蹤。”Acapela是一家20多年來專注于TTS技術的IT公司,致力于創(chuàng)造高質量的語音效果。通常,對于語音的品質好壞的鑒定標準是在于由機器發(fā)出的聲音能不能很好地清楚連貫準確地表達文字所要表達的內容,更有是能不能精確傳達出文字所表現(xiàn)的情緒與情感,通俗來說是指接近人聲的程度。這也是語音技術需要創(chuàng)新突破的關卡。Acapela雖擁有30多種不同語言以及60種不同語音,但仍然不斷在提高語音的質量方面努力創(chuàng)新,通過廣泛多樣的的解決方案,使得語音能夠表達出真情實感,從而產(chǎn)生更加愉悅的語音效果。Acapela 對于每一個字符、每一種口音和發(fā)音的習慣進行研究,創(chuàng)造出的語音能夠從每一點來說都是可識別的。

  認識TTS

  TTS所用的關鍵技術就是語音合成(SpeechSynthesis)。早期的TTS一般采用專用的芯片實現(xiàn)。而現(xiàn)在的TTS一般都用軟件實現(xiàn),主要包括文本分析、語音合成和韻律處理幾部分。文本分析指的是對輸入文本進行語言學分析,包括文本的斷句、字詞切分、多音字的處理、數(shù)字的處理、縮略語的處理等。語音合成是把處理好的文本所對應的單字或短語從語音合成庫中提取,把語言學描述轉化成言語波形。韻律處理旨在提高合成語音的質量,一般從清晰度、自然度和連貫性這幾個維度評估。

  要合成出高質量的語音,采用的計算一定是極其復雜的。 Acapela擁有來自各國的專家和研究人員的研發(fā)團隊,他們與世界各地的大學緊密合作。為了復制出每種語言最自然的聲音,開發(fā)者對每個可能出現(xiàn)的聲音文本(詩歌,政治新聞,體育運動,證券交易所更新等等)做了記錄。這些記錄然后被記錄下來并且被儲存到一個音響數(shù)據(jù)庫。在數(shù)據(jù)庫創(chuàng)建期間,對所有錄制的語音會作以下的劃分:雙連音,音節(jié),語素,詞,短語和句子。為了復制文本的文字,語音合成系統(tǒng)開始開展一個復雜的語言分析,將文本文字轉換成語音文字。根據(jù)語法和句法分析,我們使系統(tǒng)定義如何發(fā)音每個單詞,以重建意義,這是韻律處理,由此給出一個句子的節(jié)奏和語調。最后,系統(tǒng)會產(chǎn)生與信息關聯(lián)的語調和發(fā)音。這就是連鎖分析,總之聲音會在數(shù)據(jù)庫中選擇最佳的發(fā)聲單位來產(chǎn)生的。

  Acapela的研發(fā)人員積極推陳出新,不斷創(chuàng)造出更多帶有感情色彩的聲音,力求能準確表達出自然的聲音和真實的情感。精英團隊出精品,Acapela是唯一一家通過ISO9001:2000認證的語音公司。

  人人能企及,玩轉TTS

  最初開發(fā)語音方案是為了使有視覺障礙人能夠閱讀書面信息,而現(xiàn)在的應用范圍已經(jīng)瘋狂擴大,不僅成為在應用里的一個標準元件,服務于用戶的語音界面,而且廣泛地運用于日常生活的各個方面,改變著我們原本無聲的生活。

  這是科技改變生活的力量,科技雖高,但是也不是不能企及。TTS的技術在娛樂和社交領域也能發(fā)揮作用,讓普通人也能玩轉TTS。Acapela.tv的talking Card就是對TTS技術最簡單最直白的呈現(xiàn)。選定一張賀卡,輸入文本,自動生成的Flash賀卡就是講文字讀出來,發(fā)送給朋友和親人問候,不僅別致,還是我們參與其中的科技成果。Acapela Box 更是人性化的小應用。在對話框里輸入文字,立刻能轉化為音頻輸出,選擇合適的音頻格式導入播放器,就能夠隨時隨地聽。這樣的小應用,改變的是閱讀方式:地鐵上捧著Ipad閱讀電子書的人們已經(jīng)out,播放器里讀出的能讓眼睛得到休息;考試復習來不及,政治資料英語單詞都放入播放器,搶回縫隙里的時間……

  TTS從無到有幾十年的時間,從對企業(yè)的技術支持,到針對個體消費者的娛樂開發(fā),幾乎實現(xiàn)了行業(yè)的全覆蓋,也深入到尋常百姓家?萍挤⻊沼谏,生活又給科技靈感。從TTS的小技術,我們看到了生活因科技變遷的軌跡,也欣慰所謂的“高”科技其實并不高,它就在生活的細節(jié)里,無處不在。

  關于Acapela

  Acapela集團是世界領先的語音專家,創(chuàng)造了文字—語音的解決方案。Acapela為客戶提供多達30種語言的語音,并幫助其客戶建立自身的“語音戰(zhàn)略”,通過添加語音發(fā)聲傳達他們的服務和品牌價值。Acapela Acapela擁有60種高品質標準的聲音,同時也對目標客戶進行個性化聲音合成,推出的語音解決方案能使任何書面文字轉換成自然的語音文件。多年來,Acapela受到全球市場的廣泛認可,創(chuàng)造出強大的品牌知名度。超過1000家來自世界各地的不同領域的公司采用了Acapela高品質的聲音,使用著語音授權的產(chǎn)品和服務。

Open2China



相關閱讀:
科大訊飛推出維吾爾語語音合成模塊XFS5211XJ 2012-02-16
科大訊飛語音合成芯片XFS3031CNP迎新贈送活動 2012-02-01
話時代的產(chǎn)品 iVoka語音云駕駛體驗 2012-01-31
捷通華聲語音合成技術榮獲CTI論壇年度編輯推薦獎 2012-01-04
劉濤:語音云駕駛iVoka兩年內全系普及 2011-12-12

熱點專題:  語音合成TTS 語音識別ASR