聲紋鑒別及其應用 聲紋鑒別及其應用

聲紋鑒別及其應用

  • 期刊名字:武警學(xué)院學(xué)報
  • 文件大?。?03kb
  • 論文作者:侯遵澤
  • 作者單位:武警學(xué)院
  • 更新時(shí)間:2020-06-12
  • 下載次數:次
論文簡(jiǎn)介

2002年12月武警學(xué)院學(xué)報Dec.2002第18卷第6期JOURNAL OF THE CHINESE PEOPLE S ARMED POLICE FORCE ACADEMYVol 18 No 6聲紋鑒別及其應用●侯遵澤(武警學(xué)院訓練部,河北廊坊065000)【摘要】聲紋是人說(shuō)話(huà)聲音的頻譜圖,由于人的個(gè)性,決定了不同人聲紋的差異性,因此,聲紋識別或聲紋鑒定能夠確定說(shuō)話(huà)人的身份。聲紋鑒別在很多領(lǐng)域有著(zhù)廣泛的應用價(jià)值和前景,這里,簡(jiǎn)單介紹聲紋和聲紋鑒定與識別的概念及其應用的歷史與現狀,探討聲紋鑒別的方法原理和步驟,討論聲紋鑒別在個(gè)人身份證明、刑事偵察、軍事、通信、防偽等領(lǐng)域的應用,展望聲紋鑒別的應用前景?!娟P(guān)鍵詞】聲紋;聲紋鑒定;聲紋識別;濾波;特征提取;模式匹配中圖分類(lèi)號:TN912.34文獻標識碼:A文章編號:1008-2077(2002)06-0087-031引言形中反映說(shuō)話(huà)人生理和行為特征的語(yǔ)音參數,自動(dòng)識別說(shuō)話(huà)人身份的技術(shù)。它的基本原理是通過(guò)分析人的發(fā)聲和聽(tīng)覺(jué)當一起刑事案件發(fā)生后,偵察人員極有可能利用從案發(fā)為每個(gè)人構造一個(gè)獨一無(wú)二的數學(xué)模型,由計算機對模型和現場(chǎng)獲得的一段錄音得到有價(jià)值的破案證據;當空難發(fā)生后,實(shí)際輸人的語(yǔ)音進(jìn)行精確匹配,根據匹配結果辨認出說(shuō)話(huà)人從找到的“黑匣子”里,可以通過(guò)聲音的記錄,解開(kāi)事故原因是誰(shuí)。首先是對鑒別對象的聲音進(jìn)行采樣,即輸入語(yǔ)音信號之謎;當一個(gè)要挾電話(huà)打來(lái)之后,經(jīng)過(guò)對電話(huà)錄音進(jìn)行處理,再對采樣數據進(jìn)行濾波等處理,而在聲紋鑒別過(guò)程中最主要就可以確定來(lái)電人是誰(shuí)。這些都是聲紋鑒定或聲紋鑒別技術(shù)的兩部分內容是特征提取和模式匹配。特征提取,就是從聲的應用實(shí)例。音中選取唯一表現說(shuō)話(huà)人身份的有效且穩定可靠的特征;模聲紋( voIce pant)是指借助一定的儀器描繪出來(lái)的人說(shuō)式匹配就是對訓練和鑒別時(shí)的特征模式做相似性匹配。聲紋話(huà)聲音的圖像,即人的聲音的頻譜圖。雖然人的發(fā)音器官生鑒別過(guò)程示意于圖1。理構造總的是相同的,但人的語(yǔ)言產(chǎn)生是人體語(yǔ)言中樞與發(fā)音器官之間一個(gè)復雜的生理物理過(guò)程,人在講話(huà)時(shí)使用的器官——舌、牙齒、喉頭、肺、鼻腔在尺寸和形態(tài)等方面,每?jì)蓚€(gè)信號處理特征」模式識別提取匹配結果人之間的差異會(huì )很大,所以任何兩個(gè)人的聲紋圖譜都有差異,而對于每個(gè)人而言,從十幾歲發(fā)育變聲后直到五十多歲,其聲紋基本保持不變。利用聲紋的這些特點(diǎn),就可以通過(guò)聲紋鑒圖1聲紋鑒別過(guò)程示意圖別進(jìn)行個(gè)人身份識別,從而達到司法鑒定的目的。聲紋鑒定,就是通過(guò)對所記錄的語(yǔ)音與被鑒人聲紋的比限于篇幅,這里僅簡(jiǎn)要討論特征提取和模式匹配兩部分較確定二者是否為同一人的一種技術(shù)手段。聲紋鑒定技術(shù)內容,然后簡(jiǎn)要介紹聲紋技術(shù)在刑事案件偵破過(guò)程中應用的適用于刑事偵察和司法鑒定領(lǐng)域,能起到提供線(xiàn)索和審判證方法步驟。據的作用。利用聲紋鑒定技術(shù)可鑒別錄音語(yǔ)聲的真偽;可以2.1特征提取提供線(xiàn)索;可以提供證據。從20世紀60年代開(kāi)始,聲紋鑒別聲紋鑒別系統中的特征檢測即提取語(yǔ)音信號中表征人的技術(shù)被廣泛地應用到了電話(huà)查詢(xún)、電話(huà)交易、個(gè)人身份證明、基本特征,此特征應能有效地區分不同的說(shuō)話(huà)人,且對同一說(shuō)偵察技術(shù)、防偽技術(shù)等諸多領(lǐng)域話(huà)人的變化保持相對穩定??紤]到特征的可量化性、訓練樣2聲紋鑒別方法本的數量依靠聲紋識別屬于生物識別技術(shù)的一種,是一項根據語(yǔ)音波(1)譜Vu#的評價(jià)問(wèn)題,目前的聲紋鑒別系統主要中國煤化工。聲紋特征大體分為:CNMHG組輸出,以合適的速率收稿日期:2002-09-12作者簡(jiǎn)介:侯遵澤(1956-),男,山東平度人,武警學(xué)院訓練部科研所副所長(cháng),教授博士?!段渚瘜W(xué)院學(xué)報》2002年第6期(總第97期)基礎科研對濾波器輸出抽樣,并將它們作為聲紋鑒別特征;(2)基音輪紋鑒別的性能。廓、共振峰頻率帶寬及其軌跡,這類(lèi)特征是基于發(fā)聲器官如聲2.3聲紋刑事案件偵破方法步驟門(mén)、聲道和鼻腔的生理結構而提取的參數;(3)線(xiàn)性預測系在刑偵方面,聲紋鑒別技術(shù)可以在一段錄音中查找出嫌數,即以線(xiàn)性預測導出的各種參數,如線(xiàn)性預測系數、自相關(guān)疑人。通過(guò)辨析、頻譜分析、提取特征和進(jìn)行模式匹配等方法系數、反射系數、對數面積比線(xiàn)性預測殘差及其組合等參數,步驟,進(jìn)行聲紋鑒定,從而偵破案件作為鑒別特征,可以得到較好的效果。主要原因是線(xiàn)性預測首先辨析樣本語(yǔ)音材料,對有關(guān)方言、語(yǔ)音速度、言語(yǔ)習與聲道參數模型是相符合的(4)反映聽(tīng)覺(jué)特性的參數模擬慣鼻音輕重音高變音變調、節奏聲源譜特性(聲音的厚人耳對聲音頻率感知的特性而提出了多種參數,如美倒譜系薄,余音的強弱)、清晰度、流暢度、口頭語(yǔ)贊語(yǔ)、虛詞、言語(yǔ)數、感知線(xiàn)性預測等。此外,人們還通過(guò)對不同特征參量的組缺陷以及是否偽裝等進(jìn)行辨別。另外,還要聽(tīng)辨語(yǔ)義、詞匯合來(lái)提高實(shí)際系統的性能,當各組合參量間相關(guān)性不大時(shí),會(huì )語(yǔ)法及其表達方式的異同,最后得出相似或差異程度的評價(jià)。有較好的效果。在對樣本語(yǔ)音材料辨析的基礎上,進(jìn)行頻譜分析,求出多2.2模式匹配種聲學(xué)特征圖譜,這些圖譜反映的是多種多樣的聲紋形態(tài),它2.2.1概率統計方法們有帶狀(寬帶、窄帶)譜、曲線(xiàn)譜線(xiàn)狀譜和連續譜等,聲紋語(yǔ)音中說(shuō)話(huà)人信息在短時(shí)內較為平穩,通過(guò)對穩態(tài)特征鑒定一般至少要進(jìn)行觀(guān)察和定量檢測的圖譜有:(1)波形圖如基音、聲門(mén)增益、低階反射系數的統計分析,可以利用均值、即聲波的圖形,它表征振幅隨時(shí)間的動(dòng)態(tài)變化;(2)振幅曲方差等統計量和概率密度函數進(jìn)行分類(lèi)判決。線(xiàn),是語(yǔ)音波的振幅包,是一條高低起伏的曲線(xiàn),表示語(yǔ)音強2.2.2動(dòng)態(tài)時(shí)間規整方法弱;(3)基頻曲線(xiàn),是表征聲音的基礎頻率隨時(shí)間變化的動(dòng)態(tài)說(shuō)話(huà)人信息不僅有穩定因素(發(fā)聲器官的結構和發(fā)聲習曲線(xiàn),又稱(chēng)聲調曲線(xiàn);(4)三維聲譜,表征聲音的頻率、強度和慣),而且有時(shí)變因素(語(yǔ)速、語(yǔ)調、重音和韻律)。將識別模時(shí)間的關(guān)系的曲線(xiàn),它又包括兩種形式:寬帶語(yǔ)譜,其特點(diǎn)是板與參考模板進(jìn)行時(shí)間對比,按照某種距離測定得出兩模板時(shí)間分辨能力較強、但頻率分辨能力較弱;窄帶語(yǔ)譜,其特點(diǎn)間的相似程度。常用的方法是基于最近鄰原則的動(dòng)態(tài)時(shí)間規與前者相反;(5)過(guò)零率曲線(xiàn),表征聲音波形通過(guò)橫坐標的比整DTW。率與時(shí)間的關(guān)系,用于分析某個(gè)音是嗓音還是噪音,或者是輔2.2.3矢量量化方法音的濁化現象;(6)二維聲譜,是聲音的振幅隨時(shí)間變化形成矢量量化最早是基于聚類(lèi)分析的數據壓縮編碼技術(shù)。的,包括瞬時(shí)頻譜、光標間功率譜、長(cháng)時(shí)平均功率譜三種頻譜Helms首次將其用于聲紋識別,把每個(gè)人的特定文本編成碼在提取特征的基礎上,對檢材和樣本的相同語(yǔ)音材料的本,識別時(shí)將測試文本按此碼本進(jìn)行編碼,以量化產(chǎn)生的失真主要聲學(xué)特征參量的數值,包括共振參量、振幅曲線(xiàn)參量、基度作為判決標準。Bel實(shí)驗室的 rosenberg和 Soong用VQ進(jìn)頻曲線(xiàn)參量、音節時(shí)長(cháng)、長(cháng)時(shí)平均功率譜參量、長(cháng)時(shí)平均聲調行了孤立數字文本的聲紋識別研究。這種方法的識別精度參量等進(jìn)行匹配對比,得出是否同一的定量評價(jià)。高,判斷速度快。224隱馬爾可夫模型方法3聲紋鑒別的應用隱馬爾可夫模型是一種基于轉移概率和傳輸概率的隨機聲紋鑒別技術(shù)有著(zhù)十分廣闊的應用前景,在世界范圍內,模型,最早在CMU和IBM被用于語(yǔ)音識別。它把語(yǔ)音看成聲紋鑒別技術(shù)正廣泛應用于諸多領(lǐng)域。目前,我國市場(chǎng)尚屬由可觀(guān)察到的符號序列組成的隨機過(guò)程,符號序列則是發(fā)聲啟動(dòng)階段,其發(fā)展空間更為廣闊在金融、證券、社保公安、軍系統狀態(tài)序列的輸出。在使用HMM識別時(shí),為每個(gè)說(shuō)話(huà)人隊及其他民用安全認證等行業(yè)和部門(mén)有著(zhù)廣泛的需求。建立發(fā)聲模型,通過(guò)訓練得到狀態(tài)轉移概率矩陣和符號輸出有資料介紹,世界上最早用聲紋破案的是于1963年4月概率矩陣。識別時(shí)計算未知語(yǔ)音在狀態(tài)轉移過(guò)程中的最大概發(fā)生的東京下谷的“吉展幼兒拐賣(mài)案”。臺灣華航“5·25”空率根據最大概率對應的模型進(jìn)行判決。HMM不需要時(shí)間規難事件調查中,聲紋也起到了一定的作用。聲紋鑒別也曾有整,可節約判決時(shí)的計算時(shí)間和存儲量,在目前被廣泛應用。效地應用于海下探測。例如,一艘艦艇的聲納接收到了250m缺點(diǎn)是訓練時(shí)計算量較大水下的一個(gè)奇怪的聲音,似乎這是一艘潛艇。經(jīng)過(guò)與計算機2.2.5人工神經(jīng)網(wǎng)絡(luò )方法資料中的各種艦艇聲紋對比,得出了初步結論:“這可能是美人工神經(jīng)網(wǎng)絡(luò )在某種程度上模擬了生物的感知特性,它國派來(lái)的弗吉尼亞號核潛艇?!笔且环N分布式并行處理結構的網(wǎng)絡(luò )模型,具有自組織和自學(xué)聲紋鑒別在司法鑒定中也有成功的范例。有一起指使謀習能力、很強的復雜分類(lèi)邊界區分能力以及對不完全信息的殺案,偵察人員采用聲紋技術(shù),取得了成功。首先,偵察人員魯棒性,其性能近似理想的分類(lèi)器。其缺點(diǎn)是訓練時(shí)間長(cháng),動(dòng)通過(guò)磁帶的語(yǔ)音是否連續,背景噪聲是否連貫,還有一些信號態(tài)時(shí)間規整能力弱,網(wǎng)絡(luò )規模隨說(shuō)話(huà)人數目增加時(shí)可能大到的波中國煤化工是否經(jīng)過(guò)剪輯;接著(zhù)偵察難以訓練的程度。小波變換方法具有多分辨分析功能,可以人員CNMH低它的噪聲,突出增強它有效地進(jìn)行頻譜分析,利用小波變換的方法,可以將聲音信號語(yǔ)音y。察入貝付犯非現場(chǎng)留下的犯罪分子的聲分解成各種不同音頻頻段的譜,從而得到高質(zhì)量的聲紋頻譜音與在看守所提取的犯罪嫌疑人的聲音轉化為聲紋后,比較它們的異同發(fā)現其聲紋的很多地方的共同點(diǎn),通過(guò)相同的方把以上各類(lèi)方法與不同特征進(jìn)行有機組合可顯著(zhù)提高聲法,偵察人員又找到大量相同語(yǔ)句的聲紋是一致的,說(shuō)明磁帶88·侯遵澤:聲紋鑒別及其應用中嫌疑人的聲音就是被鑒定人的,最終偵破了此案。大大地提高電話(huà)訂購商品的效率推動(dòng)電話(huà)商務(wù)的發(fā)展。在信息查詢(xún)領(lǐng)域中,呼叫中心為了向用戶(hù)提供個(gè)性化服在PC機及手持式設備上,也需要進(jìn)行用戶(hù)身份的識別,務(wù),并提高坐席的工作效率,在坐席的電腦端采用了“ Screen從而允許或拒絕用戶(hù)登陸電腦或者使用某些資源,或者進(jìn)入Pop”技術(shù)。電話(huà)撥打進(jìn)入呼叫中心后,系統通過(guò)識別撥打者特定用戶(hù)的使用界面。同樣采用傳統的用戶(hù)名加密碼的保護的電話(huà)號碼來(lái)進(jìn)行用戶(hù)識別,并從數據庫里調出該用戶(hù)的個(gè)機制存在著(zhù)用戶(hù)名和密碼泄密、被竊取、容易遺忘等問(wèn)題人及歷史交易信息從而能夠提高人工坐席的工作效率并向聲紋鑒別技術(shù)應用到PC機以及手持式設備上面,可以無(wú)須用戶(hù)提供更具針對性的信息服務(wù)。但通過(guò)電話(huà)號碼來(lái)進(jìn)行用記憶密碼,保護個(gè)人信息安全,大大提高系統的安全性,方便戶(hù)身份識別的缺陷是顯而易見(jiàn)的。而聲紋鑒別技術(shù)就可以很用戶(hù)使用。好的解決這些缺陷?;诿總€(gè)人的聲音特征都是唯一而且幾在保安系統以及證件防偽的應用中,聲紋鑒別系統可用乎很少會(huì )發(fā)生變化的特性可以很好地通過(guò)聲紋鑒別技術(shù)進(jìn)于信用卡銀行自動(dòng)取款機、門(mén)車(chē)的鑰匙卡、授權使用的電行用戶(hù)身份鑒別從而提高呼叫中心的工作有效性,尤其在更腦、聲紋鎖以及特殊通道口的身份卡等。在卡上事先存儲了加需要人性化服務(wù)的醫療、教育投資、票務(wù)、旅游等方面,聲持卡者的聲音特征碼需要時(shí)持卡者只要將卡插入專(zhuān)用機的紋鑒別顯得尤其重要插口上,通過(guò)一個(gè)傳聲器讀出事先已儲存的暗碼,同時(shí)儀器接在通過(guò)電話(huà)進(jìn)行交易的系統中,如電話(huà)銀行系統商品電收持卡者發(fā)出的聲音,然后進(jìn)行分析比較,從而完成身份確話(huà)交易系統證券交易電話(huà)委托系統交易系統的安全性是最認。同樣可以把含有某人聲紋特征的芯片嵌入到證件之中,重要的,也是系統設計者所要重點(diǎn)考慮的內容。傳統的電話(huà)通過(guò)上面所述的過(guò)程完成證件防偽交易系統采取“用戶(hù)名+密碼”的控制機制,以確認用戶(hù)的身與二維條碼技術(shù)相結合的防偽應用。PDF417二維條碼份并確保交易的安全性,然而這種控制機制缺點(diǎn)明顯。若在是一種高密度高信息含量的便攜式數據文件,PDF417二維電話(huà)交易系統內采用聲紋鑒別技術(shù)來(lái)進(jìn)行交易者身份識別與條碼及其系統的開(kāi)發(fā)應用范圍極廣,在國外已廣泛應用在國確認,不僅提高了交易的安全性,大大降低了用戶(hù)名和密碼被防、公安交通運輸、醫療保健、工業(yè)、商業(yè)、金融、海關(guān)及政府猜中或者竊取的可能性而且對交易系統的用戶(hù)來(lái)說(shuō),交易過(guò)管理等領(lǐng)域。其典型優(yōu)點(diǎn)為:可容納約1000個(gè)漢字信息,比程更加簡(jiǎn)單和人性化。若與電話(huà)自動(dòng)語(yǔ)音識別技術(shù)相結合,普通條碼信息容量高幾十倍,可將照片、指紋、掌紋、聲音、簽通過(guò)語(yǔ)音下達交易指令,則更能提高交易的快捷性,縮短撥打字、文字等凡可數字化的信息進(jìn)行編碼,糾錯能力強,可靠性用戶(hù)的撥打時(shí)間降低電話(huà)交易難度。準確的用戶(hù)身份識別,高容易制作且成本低廉。利用現有的點(diǎn)陣激光、噴墨、熱可通過(guò)用戶(hù)信息數據庫和歷史交易數據庫,為提供真正的敏/熱轉印制卡機等打印技術(shù),可在紙張、PVC、甚至金屬表One-to-One個(gè)性服務(wù)打下基礎,降低交易系統費用,提高面上印出PDF417二維條碼,采用聲紋鑒別的方法對重要的效率。由于縮短了撥打用戶(hù)的撥打時(shí)間,從而會(huì )減少I(mǎi)VR硬證件、文件、單據進(jìn)行防偽。在需要進(jìn)行證件確認時(shí),通過(guò)件系統的通道需求數量,降低欺詐的可能性。商家可以根據維條碼識別出用戶(hù)的聲紋特征并輸入到聲紋確認儀器中,同有關(guān)的聲紋鑒別技術(shù),判斷這些信息的可信度,并據此決定是時(shí)與持證人的聲音進(jìn)行對比,從而完成證件和身份確認。否送貨等,并可從數據庫內查看撥打者的信用狀況,由此可以Voice discrimination and its applicationHoU Zun-zeStaff office, The Academy, Lang Fang 065000, China)Abstract] Voice print is a frequency map of a mans voice. Because of the character of person, the discrepancyof any two mens voice and the speaker can be determined with their voice print. Voice discrimination has widely ap-plications in many domains. In this paper, the concept, history and actuality of voice print and its application wereintroduced and the methods, principle, discriminating steps and application to person identification, penal recon-naissance, military affairs, communications, defending false, etc are studiedI Key words] voice print; identifying the voice; speaker recognition; filter; pick up the character; matching the中國煤化工(本欄責任編輯、校對CNMHG89

論文截圖
版權:如無(wú)特殊注明,文章轉載自網(wǎng)絡(luò ),侵權請聯(lián)系cnmhg168#163.com刪除!文件均為網(wǎng)友上傳,僅供研究和學(xué)習使用,務(wù)必24小時(shí)內刪除。
欧美AAAAAA级午夜福利_国产福利写真片视频在线_91香蕉国产观看免费人人_莉莉精品国产免费手机影院