語音識別其目標是將人類的語音中的詞匯�(nèi)容轉(zhuǎn)換為計算機可讀的輸�,例如按�、二進制編碼或者字符序�。與說話人識別及說話人確認不�,后者嘗試識別或確認�(fā)出語音的說話人而非其中所包含的詞匯內(nèi)容�
早在計算機發(fā)明之�,自動語音識別的�(shè)想就已經(jīng)被提上了議事日程,早期的聲碼器可被視作語音識別及合成的雛�。�1920年代生產(chǎn)�"Radio Rex"玩具狗可能是最早的語音識別器,當這只狗的名字被呼喚的時�,它能夠從底座上彈出來。最早的基于電子計算機的語音識別系統(tǒng)是由AT&T貝爾實驗室開�(fā)的Audrey語音識別系統(tǒng),它能夠識別10個英文數(shù)字。其識別方法是跟蹤語音中的共振峰。該系統(tǒng)得到�98%的正確率。到1950年代�,倫敦學院(Colledge of London)的Denes已經(jīng)將語法概率加入語音識別中�
1960年代,人工神�(jīng)�(wǎng)�(luò)被引入了語音識別。這一時代的兩大突破是線性預測編碼Linear Predictive Coding (LPC), 及動�(tài)時間彎折Dynamic Time Warp技�(shù)�
語音識別技�(shù)的最重大突破是隱含馬爾科夫模型Hidden Markov Model的應�。從Baum提出相關(guān)�(shù)學推�,經(jīng)過Labiner等人的研�,卡�(nèi)基梅隆大學的李開復最終實�(xiàn)了個基于隱馬爾科夫模型的大詞匯量語音識別系�(tǒng)Sphinx。此后嚴格來說語音識別技�(shù)并沒有脫離HMM框架�
盡管多年來研究人員一直嘗試將“聽寫機”推�,語音識別技�(shù)在目前還無法支持無限�(lǐng)�,無限說話人的聽寫機應用�
作為一種軟件產(chǎn)�,Microsoft已圍繞語音識別技�(shù)進行了長達數(shù)年之久的研發(fā)工作。如需了解更多�(guān)于語言識別�(chǎn)品當前進展情況的信�,請訪問Microsoft .NET語音技�(shù)Web站點�
與此同時,Microsoft將繼�(xù)在語音識別研究領(lǐng)域進行投資。位于雷蒙德和中國的研發(fā)團隊正致力于解決困擾語音識別�(lǐng)域的某些技�(shù)缺陷。其�,一個稱作Dr. Who的研究項目旨在解決噪音問�,力求確保您的計算機能夠在辦公場所以外的嘈雜環(huán)境(例如汽車或人流較多的餐館�(nèi))中識別語音信息�
語音識別技�(shù)的應用包括語音撥�、語音導�、室�(nèi)�(shè)備控制、語音文檔檢�、簡單的聽寫�(shù)�(jù)錄入等。語音識別技�(shù)與其他自然語言處理技�(shù)如機器翻譯及語音合成技�(shù)相結(jié)�,可以構(gòu)建出更加復雜的應�,例如語音到語音的翻��
語音識別技�(shù)所涉及的領(lǐng)域包括:信號處理、模式識�、概率論和信息論、發(fā)聲機理和聽覺機理、人工智能等等�
語音-文本�(zhuǎn)換(voice-to-text)軟件和自動電話服務等應用背后的�(guān)鍵技�(shù)是語音識�。在這些應用中語音識別準確率是至�(guān)重要的,而為了做到這一�,語�-文本�(zhuǎn)換軟件通常要求用戶在安裝過程中對軟件進行“訓練”,軟件本身也要隨著時間的推移慢慢適應用戶的語音模式。需要與多個說話者互動的自動語音服務則不允許存在使用者對軟件進行訓練的環(huán)節(jié),因為它們必須能夠在時間為任何用戶服務。為了解決識別準確率較低的問�,這些系統(tǒng)要么只能處理很小的詞匯量,要么嚴格限制用戶可以使用的字句或模��
自動語音識別的最終目標是提供即買即用、可以自動快速適應任何說話者的語音識別服務,這個系�(tǒng)不需要用戶訓練就可以針對所有用戶和各種條件,良好地�(fā)揮功用�
“這個目標在移動互聯(lián)�(wǎng)時代顯得尤為重要,”俞棟博士表示,“因為語音是智能手機和其他移動設(shè)備必不可缺的接口模式。雖然個人移動�(shè)備是采集和學習用戶語音的理想�(shè)�,但用戶只有在初始體驗,也就是在針對該用戶的模型建立之前的體驗非常良好時,才會繼�(xù)使用語音功能?�?/FONT>
非特定人語音識別技�(shù)對于沒有機會或辦法適應用戶的語音識別系統(tǒng)也非常重�,例如在呼叫中心,來電者身份是未知�,而且通話時間只有幾秒�;又例如用戶可能會因為擔心隱私問題而不愿意在提供“語�-語音(speech-to-speech)”翻譯的�(wǎng)�(luò)服務中留存語音樣本�
更多精彩�(nèi)�,請登入維庫電子通(www.3575.com.cn�
維庫電子�,電子知�,一查百通!
已收錄詞�153979�