聲紋識別,也稱說話人識別,就是根據人的聲音特征,識別出某段語音是誰說的。聲紋識別分為話者辨認和確認。辨認是從有限的話者集合中分辨不同的人,系統性能隨著話者集合增大而降低;確認是系統只給出接受或拒絕兩種選擇。從電視講話判定說話人,如是否是其本人,就屬于確認的過程,它的難度往往更大一些。前面的一些文章中我們介紹了指紋門禁一體機,指紋門禁讀頭,指紋門禁考勤一體機的工作過程中的指紋匹配的過程,下面我們介紹一下生物識別技術的模式匹配過程。
(1)矢量量化。指紋門禁一體機,指紋門禁讀頭,指紋門禁考勤一體機嵌入了聲紋識別技術,驗證準確度將大大提升。
通過把每個人的特定文本編成碼本,識別時將測試文本按此碼本進行編碼,以量化產生的失真度作為標準。其識別精度較高,判斷速度較快。
(2)概率統計。
考慮到短時間聲音信息相對平穩,通過對穩態特征如基音、聲門增益、低對反射系數的統計分析,利用均值、方差等統計量和概率密度函數進行。其優點是不用對特征參量在時域上進行規整,適合文本無關的說話人識別。
(3)動態時間規整。
說話人聲音信息既有穩定的因素如發聲習慣、發聲器官結構,又有時變的因素如請速、語調、重音、韻律等。將識別模板與參考模板進行時間對比,并按照某種距離測定得出兩模板間的相似程度。
(4)人工神經網絡。
這種分布式并行處理結構的網絡模型在某種程度上模擬生物感知特性,具有自組織和自學習能力、很強的復雜分類邊界區分能力,及對不*信息的魯棒性,其性能近似理想的分類器。缺點是訓練時間長、動態時間規整能力弱,并且網絡規模可能隨說話人數目增加到難以訓練的程度。
(5)隱馬爾可夫模型。
這種基于轉移概率和傳輸概率的隨機模型,被美國的IBM公司用于聲音識別。它把聲音看成由可觀察到的符號序列組成的隨機過程,該序列是發聲系統狀戀序列的輸出。識別時,為每個說話人建立發聲模型.通過訓練得到狀態轉移概率矩陣和符號輸出概率矩陣。具體應用時,計算未知聲音在狀態轉移過程中概率,根據概率對應的模型進行。它不需時間規整,可節約的計算時間和存儲量。這是目前廣泛采用的一種技術,其缺點是訓練時的計算量較大。
上一篇:什么是船用電纜
全年征稿/資訊合作
聯系郵箱:[email protected]
免責聲明
- 凡本網注明"來源:智能制造網"的所有作品,版權均屬于智能制造網,轉載請必須注明智能制造網,http://m.lfljgfsj.com。違反者本網將追究相關法律責任。
- 企業發布的公司新聞、技術文章、資料下載等內容,如涉及侵權、違規遭投訴的,一律由發布企業自行承擔責任,本網有權刪除內容并追溯責任。
- 本網轉載并注明自其它來源的作品,目的在于傳遞更多信息,并不代表本網贊同其觀點或證實其內容的真實性,不承擔此類作品侵權行為的直接責任及連帶責任。其他媒體、網站或個人從本網轉載時,必須保留本網注明的作品來源,并自負版權等法律責任。
- 如涉及作品內容、版權等問題,請在作品發表之日起一周內與本網聯系,否則視為放棄相關權利。
2025第十一屆中國國際機電產品交易會 暨先進制造業博覽會
展會城市:合肥市展會時間:2025-09-20