一、智能語音客服
目前,通信運(yùn)營商等在客服領(lǐng)域比較先進(jìn)的企業(yè)已經(jīng)實(shí)現(xiàn)了智能文字客服,通過文字識(shí)別技術(shù)和智能匹配算法對通過短信和網(wǎng)站文字客服提出的服務(wù)訴求智能匹配答案,不需人工判斷。要實(shí)現(xiàn)智能語音客服,也要通過識(shí)別和匹配這兩關(guān)。
我們先說說識(shí)別吧。早在Siri之前,就已經(jīng)有很多語音識(shí)別工具問世,最早的基于電子計(jì)算機(jī)的語音識(shí)別系統(tǒng)是由AT&T貝爾實(shí)驗(yàn)室開發(fā)的Audrey語音識(shí)別系統(tǒng),它能夠識(shí)別10個(gè)英文數(shù)字,現(xiàn)在AT&T的語音系統(tǒng)Watson已經(jīng)可以實(shí)現(xiàn)在線德語和英語的實(shí)時(shí)口譯。以現(xiàn)在的技術(shù),語音的識(shí)別依然比較困難,主要面臨的難點(diǎn)有2個(gè):
1.算法
算法是軟件的核心,目前的語音識(shí)別算法使用的語言模型仍是一種概率模型,還未發(fā)展成以語言學(xué)為基礎(chǔ)的文法模型,算法不突破,效果無法取得突飛猛進(jìn)的進(jìn)展。算法的優(yōu)化不是一朝一夕的事情,需要慢慢不斷地進(jìn)行,尤其語音這種非結(jié)構(gòu)化數(shù)據(jù)(不便用數(shù)據(jù)庫二維邏輯表來表現(xiàn)的數(shù)據(jù)),但隨著大數(shù)據(jù)分析技術(shù)(用于非結(jié)構(gòu)化數(shù)據(jù)的管理分析)的發(fā)展,也會(huì)對新算法開發(fā)帶來福音。一些核心算法如特征提取、搜索算法和自適應(yīng)算法也都在一步步改進(jìn),且隨著數(shù)據(jù)源的不斷豐富,算法的識(shí)別效果也就越來越精準(zhǔn)。
2.適應(yīng)性
由于方言、語氣、環(huán)境和音色等因素的影響,限制了語音識(shí)別算法的效果,這就需要語言識(shí)別系統(tǒng)具有一定的自適應(yīng)性,不同口音、方言的識(shí)別都需要以一個(gè)龐大的語音數(shù)據(jù)庫為基礎(chǔ),對這些非結(jié)構(gòu)化數(shù)據(jù)的管理分析就更加指望大數(shù)據(jù)技術(shù)了。至于排除環(huán)境噪音、音色等因素,個(gè)人感覺要依賴半導(dǎo)體傳感技術(shù)的進(jìn)步,留待硬件領(lǐng)域的專家進(jìn)一步探討。
接下來就說到匹配了。目前,匹配的算法已經(jīng)相對比較成熟了,也許和大數(shù)據(jù)技術(shù)沒有直接聯(lián)系,不過其準(zhǔn)確性也有賴于數(shù)據(jù)源的豐富程度,同時(shí)要在不斷產(chǎn)生的“交互數(shù)據(jù)”中動(dòng)態(tài)地調(diào)整匹配結(jié)果。
綜上所訴,隨著數(shù)據(jù)源越來越多,大數(shù)據(jù)技術(shù)的不斷進(jìn)步,語音識(shí)別系統(tǒng)也在持續(xù)地完善之中,說到底,算法依然是核心,而數(shù)據(jù)則是基礎(chǔ),對于這類非結(jié)構(gòu)化數(shù)據(jù),也許傳統(tǒng)的數(shù)據(jù)庫技術(shù)Handle不住,但大數(shù)據(jù)技術(shù)卻大有可為。相信不久,語音識(shí)別的技術(shù)的突破不僅可以實(shí)現(xiàn)智能語音客服,還將變革人與物之間的交互方式。
二、語音文本轉(zhuǎn)換
因?yàn)檫@個(gè)功能的核心也是語音識(shí)別,所以大數(shù)據(jù)技術(shù)對的轉(zhuǎn)換準(zhǔn)確度的保障支撐就不用再說了。之所以單列出來談呢,是因?yàn)槠鋵蛻舴⻊?wù)別有一番作用。
對于呼叫中心而言,客服人員與用戶的通話都是要錄音備份的,這些語音數(shù)據(jù)可真的不小哦,僅以廣東移動(dòng)為例,廣東移動(dòng)客服中心每年就要新增約60T的數(shù)據(jù)存儲(chǔ),這個(gè)體量對于一般的企業(yè)來說已經(jīng)是“大數(shù)據(jù)”了。據(jù)悉,這些數(shù)據(jù)是用磁帶來保存的,而且這些要保存幾十年不能銷毀,想想到時(shí)候光這些磁帶所占用的房間租金就是不少錢啊,更何況是其他成本。而如果能將這些語音準(zhǔn)確地轉(zhuǎn)換成文本之后,文本存儲(chǔ)所占用的空間就小的多(一個(gè)移動(dòng)硬盤都可以存儲(chǔ)一個(gè)圖書館的數(shù)據(jù)量了),存儲(chǔ)成本簡直就是直線下降,不僅實(shí)現(xiàn)了低成本高效,對自然環(huán)境也是一種利好。