

語(yǔ)音識別技術(shù)及應用
- 期刊名字:溫州職業(yè)技術(shù)學(xué)院學(xué)報
- 文件大?。?04kb
- 論文作者:劉向華
- 作者單位:溫州職業(yè)技術(shù)學(xué)院
- 更新時(shí)間:2020-06-12
- 下載次數:次
第6卷第3期溫州職業(yè)技術(shù)學(xué)院學(xué)報Vol 6 No. 32006年9月Journal of wenzhou vocational Technical college語(yǔ)音識別技術(shù)及應用劉向華(溫州職業(yè)技術(shù)學(xué)院計算機系,浙江溫州325035)[摘要]語(yǔ)音識別技術(shù)近年來(lái)得到了飛速的發(fā)展并且在越來(lái)越多的領(lǐng)域得到了廣泛的應用。隱馬爾可夫模型(HM語(yǔ)音識別技術(shù)是一種基于訓練數據提供的概率自動(dòng)構造識別系統的技術(shù),主要用于大量詞匯的語(yǔ)音識別,而且具有良好的識別性能和抗噪性能。因此,一般的語(yǔ)音識別系統都采用基于HM旳識別方法作為其基本算法。本文列舉了語(yǔ)音識別在教學(xué)中的應用示例來(lái)分析其基本算法。[關(guān)鍵詞]語(yǔ)音識別技術(shù);隱馬爾可夫模型(HM;語(yǔ)音模型[中圖分類(lèi)號]TN12.34[文獻標識碼]A[文章編號]1671-4326(2006)03-0033-03Speech Recognition Technology and its applicationLIU Xiang-huaComputer Science Department, Wenzhou Vocational Technical College, Wenzhou, 325035, China)Abstract: The speech recognition technology has boomed in recent years and is widely used in more andmore fields. The speech recognition technology of HMM is the technology that is based on the recognition systerof the auto-construction probability provided by the practical digit. It is mainly used in speech recognition of a largenumber of vocabularies with the fine property of recognition and anti-noise. Therefore, the common speech recog-nition system usually adopts the recognition approach based on HMM as its basic algorithm. This paper, demonKey words: Speech recognition technology; HMM; Language modey ysis on its basic algorithmstrating the application of the speech recognition in teaching, makes an ana0引言語(yǔ)音輸入識別結果特征提取語(yǔ)音識別技術(shù)是2000~2010年間信息技術(shù)領(lǐng)域重要的十大科技發(fā)展技術(shù)之一。語(yǔ)音識別是一門(mén)交叉學(xué)科,正逐步成為信息技術(shù)中人機接口的關(guān)鍵技術(shù)。語(yǔ)圖1語(yǔ)音識別系統的實(shí)現過(guò)程1音識別技術(shù)與語(yǔ)音合成技術(shù)結合使人們能夠甩掉鍵隱馬爾可夫模型( Hi dden mar kov Model s,簡(jiǎn)稱(chēng)盤(pán),通過(guò)語(yǔ)音命令進(jìn)行相應的操作。語(yǔ)音技術(shù)的應用HMM語(yǔ)音識別技術(shù)是一種統計技術(shù),它提供了一種基已經(jīng)成為一個(gè)具有競爭性的新興高技術(shù)產(chǎn)業(yè)。于訓練數據提供的概率自動(dòng)構造識別系統的技術(shù)。這語(yǔ)音識別技術(shù)是 Rabi ner等人在20世紀80年代引入語(yǔ)音識別領(lǐng)域與機器進(jìn)行語(yǔ)音交流,讓機器明白你說(shuō)什么,這的一種語(yǔ)音識別算法。該算法通過(guò)對大量語(yǔ)音數據進(jìn)是人們長(cháng)期以來(lái)夢(mèng)寐以求的事情。近20年來(lái),語(yǔ)音識行數據統計,建立識別條的統計模型,然后從待識別別技術(shù)取得顯著(zhù)進(jìn)步,開(kāi)始從實(shí)驗室走向市場(chǎng)。預計語(yǔ)音中提取特征,與這些模型匹配,通過(guò)比較匹配分在未來(lái)10年內,語(yǔ)音識別技術(shù)將進(jìn)入工業(yè)、家電、通數以獲得識別結果。通過(guò)大量的語(yǔ)音,就能夠荻得信、汽車(chē)電子、醫療、家庭服務(wù)、消費電子產(chǎn)品等各個(gè)穩健的統計模型,能夠適應實(shí)際語(yǔ)音中的各種突發(fā)個(gè)領(lǐng)域。一個(gè)完整的語(yǔ)音識別系統可大致分為三部情況?;贖M的算法23,主要用于大量詞匯的語(yǔ)音分,如圖1所示。識別系統,而且其算法具有良好的識別性能和抗噪性1.1隱馬爾可夫語(yǔ)音識別技術(shù)能,故現在[收稿日期]2006-01-15TH中國煤化工HMM的識CNMHG[作者簡(jiǎn)介劉向華(1977一),女,湖南隆回人,溫州職業(yè)技術(shù)學(xué)院計算機系助教溫州職業(yè)技術(shù)學(xué)院學(xué)報2006年9月別方法作為基本算法。一個(gè)典型的HMM語(yǔ)音識別過(guò)程=argnax[ B()≤i≤T包括以下幾個(gè)方面返回結果(1)利用前向、后向算法計算模型的形成觀(guān)察概S=B.(s-)t=T-1,T-2T-3,…,0率集p(X/中)。其計算方法如下:s=(S。51S2…,S)是最佳序列。初始狀態(tài):a(i)=丌1≤i≤N(4)根據最佳狀態(tài)序列對應的值,給出候選音節%(9.1)ab(x)1t≤1可≤N聲韻母。(5)通過(guò)語(yǔ)言模型形成詞和句子1.2隱馬爾可夫語(yǔ)音識別技術(shù)的改進(jìn)隊x4)=a(i)隨著(zhù)語(yǔ)音識別研究工作的深入開(kāi)展,HMM語(yǔ)音識那么p(x/中)=a(S)(S是最后的狀態(tài))別方法愈來(lái)愈受到人們的重視,基于HMM技術(shù)的識別(2)利用 Baum Wel ch算法求出最優(yōu)解 ar gax{p系統的缺點(diǎn)就在于統計模型的建立需要依賴(lài)一個(gè)較大(X/φ)}。其方法描述如下:的語(yǔ)音庫。這在實(shí)際工作中占有很大的工作量。且模5(i,j)表示t時(shí)狀態(tài)為i以及t+1時(shí)狀態(tài)為j的型所需要的存儲量和匹配計算(包括特征矢量的輸出概率,即i,j)=p(q=,q,,)概率計算)的運算量相對較大,通常需要具有一定容5(1,/D(q=,q,Wλ)量SRAM的DSP才能完成。另外,它的一個(gè)最主要的缺p( A)點(diǎn)是根據詞模型推出的狀態(tài)段長(cháng)分布是指數分布,這q()a1b(0)(j)不符合語(yǔ)音的本質(zhì)屬性,因此,現在推出了一種非齊p(dλ)次的HM晤音識別模型( Dur at i on d stri but i on BasedHi dden№ br kov model,簡(jiǎn)稱(chēng)DDBH№M。在此模型中用q(1)ab(0-)9.(j)狀態(tài)的段長(cháng)分布函數替代了齊次HMM中的狀態(tài)轉移矩點(diǎn)q()a(0,),)陣,徹底拋棄了“平穩的假設”,而從非平穩的角度考慮問(wèn)題,使模型成為一種基于狀態(tài)段長(cháng)分布的隱含Y()+i,)表示t時(shí)狀態(tài)為的概率,元= Mar kov模型。段長(cháng)分布函數的引入澄清了經(jīng)典HM語(yǔ)(i)表示時(shí)刻1經(jīng)過(guò)狀態(tài)ⅰ次數,a表示在時(shí)刻T內,音識別模型的許多矛盾, DB BHM比國際上流行的HMM狀態(tài)ⅰ轉移到狀態(tài)j的總次數,除以在時(shí)刻T內,狀語(yǔ)音識別模型有更好的識別性能和更低的計算復雜度態(tài)i被經(jīng)過(guò)的總次數,其公式如下(訓練算法比流行的Baum算法復雜度低兩個(gè)數量級)由于該模型解除了對語(yǔ)音信號狀態(tài)的齊次性和對語(yǔ)音白(1,j)a, i特征的非相關(guān)性的限制,因此,為語(yǔ)音識別研究的深入發(fā)展提供了一個(gè)和諧的框架。1.3語(yǔ)音識別在教學(xué)中的應用示例5(k)表示在時(shí)刻T內,經(jīng)過(guò)狀態(tài)j,并且狀態(tài)j對假設要為學(xué)校課件資源庫設立一個(gè)門(mén)衛,對要進(jìn)應的觀(guān)測事件為vx的總數除以時(shí)刻T內,經(jīng)過(guò)狀態(tài)入課件資源庫者進(jìn)行口令驗證,當學(xué)生對麥克風(fēng)發(fā)出的總數,其公式如下:“主人,請開(kāi)門(mén)吧!”聲音時(shí),打開(kāi)課件資源庫,為用戶(hù)提供可利用的課件資源,否則在屏幕上顯示“口令不正確,請重輸?!钡木嫣崾?。而當連續3次發(fā)出錯(誤口令時(shí),則提示“您已3次輸入錯誤口令,謝絕訪(fǎng)問(wèn)!”,關(guān)閉系統結束運行。利用ⅤB開(kāi)發(fā)的門(mén)衛模塊(3)利用 Vi ter bi算法解出最佳狀態(tài)轉移序列。其如下:界面為課件資源庫背景;主要對象為 Direct方法描述如下Speech Recogni ti on,其№ne屬性設為 Direct sr;V(i)=n≤i≤ N Comand1按鈕,其 Pi ctur e屬性設為人耳圖片,用于B(0激活口令監聽(tīng); Text boⅹ,其Text屬性設為空,用于V, (j)=xlv.1(i)a,b, (X )顯示語(yǔ)音命令短語(yǔ)。(1≤t≤;1≤j≤N其語(yǔ)音識別程序如下B()=ar gnax[,(i)a, b, (Y)mret vallo凵中國煤化工(1≤t≤T;1≤j≤NPri vate sCNMHG最佳記錄=ax[v,(i)]1≤i≤TDirect SR ur anar UI IIDL 1 I ng i Gr ammar第6卷第3期劉向華:語(yǔ)音識別技術(shù)及應用35+vbNewli ne查統計表明,多達85%以上的人對語(yǔ)音識別的信息查+"type=cgf"vb№ WLi ne+"[< star t丬]"+vb№ elI ne詢(xún)服務(wù)系統的性能表示滿(mǎn)意??梢灶A測,在近5~10+"< star t>=主人,請開(kāi)門(mén)吧!"+ vbNewli ne年內,語(yǔ)音識別系統的應用將更加廣泛,各種各樣的End Sub語(yǔ)音識別系統產(chǎn)品將不斷出現在市場(chǎng)上。語(yǔ)音識別技Conmand1. Cl i cko術(shù)在人工郵件分揀中的作用也日益顯現,發(fā)展前景誘I=I+1人。一些發(fā)達國家的郵政部門(mén)已經(jīng)使用了這一系統,D rect sR Acti vat e語(yǔ)音識別技術(shù)逐漸成為郵件分揀的新技術(shù)。它可以克End sub服手工分揀單純依靠分揀員記憶力的不足,解決人員Pri vate Sub di rect sr phr asefi ni sh( Byval科lags成本過(guò)高的問(wèn)題,提高郵件處理的效率和效益。就教As Long, Byval begi nhi As Long, Byval begi nl o As育領(lǐng)域來(lái)講,語(yǔ)音識別技術(shù)的最直接的應用就是幫助ong, Byval enshi As Long, Byval endl o As Long,用戶(hù)更好地練習語(yǔ)言技巧。如一家美國公司開(kāi)發(fā)了一Byval Phrase As String, Byval parsed As String, Byal套《Ta|ktoM》,當用戶(hù)跟著(zhù)計算機說(shuō)完一句話(huà)后resul ts As Long計算機會(huì )同時(shí)顯示標準發(fā)音和用戶(hù)發(fā)音的波形比照Txt Command. t ext=phr ase圖,并給出分數。用戶(hù)可以反復對比傾聽(tīng)來(lái)體會(huì )這種Sel ect Case phr ase差異。不難想象,將語(yǔ)音技術(shù)應用于教育方面的空間Case i主人,請開(kāi)門(mén)吧!是極其巨大的。就娛樂(lè )方面來(lái)講,也可以激發(fā)出許多Ret val Shel I ("C: \sour ce\ sour ce. exe", 1)的新應用。如通過(guò)電話(huà)進(jìn)行電視MV點(diǎn)播時(shí),可以直Case El se接說(shuō)出哪個(gè)歌手的哪首歌,電視臺就接受語(yǔ)音輸入而IfI>=3 Then txt command.text="您已3次輸入播放相應的曲目。隨著(zhù)網(wǎng)絡(luò )技術(shù)的進(jìn)一步發(fā)展,電子錯誤口令,謝絕訪(fǎng)問(wèn)!":End商務(wù)也正在日漸流行。語(yǔ)音識別技術(shù)和電子商務(wù)的結Txt Corand.text="口令不正確,請重輸。合,將創(chuàng )造一種全新的交易方式,我們可以做到足不End Sel ect出戶(hù)就能夠“逛”商場(chǎng),購買(mǎi)到我們所需要的東西。而End Sub且,這種語(yǔ)音交流的方式比起網(wǎng)上購物更具有親和2語(yǔ)音識別技術(shù)的應用前景力,同時(shí)也為人類(lèi)的工作和生活帶來(lái)極大的便利語(yǔ)音識別技術(shù)發(fā)展到今天,特別是中小詞匯量非3結束語(yǔ)特定人語(yǔ)音識別系統識別精度已經(jīng)大于98%,對特定語(yǔ)音識別技術(shù)在現代社會(huì )中已經(jīng)得到了廣泛的應人語(yǔ)音識別系統的識別精度就更高。這些技術(shù)已經(jīng)能用,幾乎可以延伸到各個(gè)領(lǐng)域。隨著(zhù)研究的深入,會(huì )夠滿(mǎn)足通常應用的要求。由于大規模集成電路技術(shù)的有更多的服務(wù)、設備等與此項技術(shù)相結合,人們將不發(fā)展,這些復雜的語(yǔ)音識別系統也已經(jīng)完全可以制成必再通過(guò)按鍵來(lái)輸入,也不必使用鼠標和鍵盤(pán),只需專(zhuān)用芯片,大量生產(chǎn)。在西方經(jīng)濟發(fā)達國家,大量的要我們開(kāi)口說(shuō)話(huà)。與人類(lèi)進(jìn)步過(guò)程中其他任何一種技語(yǔ)音識別產(chǎn)品已經(jīng)進(jìn)入市場(chǎng)和服務(wù)領(lǐng)域。一些用戶(hù)交術(shù)的發(fā)展歷程一樣,語(yǔ)音和語(yǔ)言處理技術(shù)在不同的成換機、電話(huà)機、手機已經(jīng)包含了語(yǔ)音識別撥號功能、語(yǔ)熟階段都有一個(gè)不同的應用形式和不同的市場(chǎng)定位音記事本、語(yǔ)音智能玩具等產(chǎn)品,同時(shí)也包括語(yǔ)音識在經(jīng)歷從技術(shù)到市場(chǎng)、再從市場(chǎng)到技術(shù)的螺旋式上升別與語(yǔ)音合成功能。人們可以通過(guò)電話(huà)網(wǎng)絡(luò )用語(yǔ)音識的過(guò)程中,這種技術(shù)將變得越來(lái)越成熟,市場(chǎng)也將越別口語(yǔ)對話(huà)系統查詢(xún)有關(guān)的機票、旅游、銀行信息。調來(lái)越廣。[參考文獻[1]D G St or k and ME. Hennecke, edi t or s, Speeng by Hunans and Machi nes[ M. BerI i n: Comput er and Syst erms Sci ences, 1996. 331-3502] Zhan Puni ng, Wang Zuoyi ng. I mpr ovement ofMarkow nodel for speech recogni ti on[J] Act a El ectroni ca Si ni ca, 1994, (1):9-15.[3]P. L. Si l sbee and A. C. Bovi k, Comput er I i pr eadi ng for i mpr oved accur acy i n aut omat ic speech recogni ti on[J]. I EEE Trans acti ons on Speech and Audi o Pr ocessi ng, 1996, 4(5): 337-3514]何好義,計算機語(yǔ)音識別技術(shù)及其應用[].大眾科技,2005,(6)5]譚保華,熊健民,劉么和,湖北工學(xué)院招生語(yǔ)音應答系統[J].湖北工學(xué)院學(xué)報,2003,(5)6]朱民雄,聞新,黃健群,等,計箅機語(yǔ)音技術(shù)[M.北京:北京航空航天大學(xué)出版社,2002YH化號
-
C4烯烴制丙烯催化劑 2020-06-12
-
煤基聚乙醇酸技術(shù)進(jìn)展 2020-06-12
-
生物質(zhì)能的應用工程 2020-06-12
-
我國甲醇工業(yè)現狀 2020-06-12
-
JB/T 11699-2013 高處作業(yè)吊籃安裝、拆卸、使用技術(shù)規程 2020-06-12
-
石油化工設備腐蝕與防護參考書(shū)十本免費下載,絕版珍藏 2020-06-12
-
四噴嘴水煤漿氣化爐工業(yè)應用情況簡(jiǎn)介 2020-06-12
-
Lurgi和ICI低壓甲醇合成工藝比較 2020-06-12
-
甲醇制芳烴研究進(jìn)展 2020-06-12
-
精甲醇及MTO級甲醇精餾工藝技術(shù)進(jìn)展 2020-06-12