資訊工程學系

Permanent URI for this communityhttp://rportal.lib.ntnu.edu.tw/handle/20.500.12235/60

本系前身「資訊教育學系」成立於民國七十四年,首先招收大學部學生,民國九十年成立資訊工程研究所碩士班,而後於民國九十五年進行系、所調整合併為「資訊工程學系」;並於九十六年成立博士班。本系目前每年約招收大學部四十餘人,碩士班六十餘人,博士班約五人,截至民國一百零四年十一月止,總計現有大學部一百九十多人,碩士班一百二十多人,博士班二十三人,合計學生人數約為三百三十多位。

News

Browse

Search Results

Now showing 1 - 2 of 2
  • Item
    運用調變頻譜分解技術於強健語音特徵擷取之研究
    (2014) 汪逸婷
    近年來,語音特徵調變頻譜的研究,由於其簡單又能針對語音特徵提供整體變化分析的特性,在強健性自動語音辨識的領域獲得了廣大的迴響;本論文著重於二個部分:其一為非負矩陣分解法之延伸,非負矩陣分解法由於能有效擷取調變頻譜中關鍵且不受雜訊影響的資訊,而得到許多關注,本論文將延續這個領域的研究,提出對語音進行分群處理的分群式非負矩陣分解法,以及加上稀疏性之條件的稀疏化非負矩陣分解法。其二為壓縮感知法之延伸,壓縮感知法為一種用較相關之資訊以較精簡的方式來還原訊號,本論文提出一個展新的想法,將壓縮感知法應用在語音特徵調變頻譜。分群式非負矩陣分解法為運用分群處理的技術將不同特性的語句分開處理,使非負矩陣分解法能夠更精準地擷取語音中的重要資訊,而不受語句之間的變異性干擾;稀疏化非負矩陣分解法為探索非負矩陣分解法中稀疏性帶來的影響,以期取得較集中且不重覆的基底調變頻譜。本論文所有的實驗皆使用常見的Aurora-2語料庫進行驗證,並進一步在大詞彙語料庫Aurora-4進行驗證。實驗的結果說明了:本論文所提出的兩種延伸方法,確實能在改進語音辨識的強健性上發揮其效力,並得到比其他調變頻譜應用技術更佳的辨識正確率。
  • Item
    調變頻譜分解之改良於強健性語音辨識
    (2015) 張庭豪; Chang, Ting-Hao
    自動語音辨識(Automatic Speech Recognition, ASR)系統常因環境變異而導致效能嚴重地受影響;所以長久以來語音強健(Robustness)技術的發展是一個極為重要且熱門的研究領域。本論文旨在探究語音強健性技術,希望能透過有效的語音特徵調變頻譜處理來求取較具強健性的語音特徵。為此,我們使用非負矩陣分解(Nonnegative Matrix Factorization, NMF)以及一些改進方法來分解調變頻譜強度成分,以獲得較具強健性的語音特徵。本論文有下列幾項貢獻。首先,結合稀疏性的概念,期望能夠求取到具調變頻譜局部性的資訊以及重疊較少的NMF基底向量表示。其次,基於局部不變性的概念,希望發音內容相似的語句之調變頻譜強度成分,在NMF空間有越相近的向量表示以維持語句間的關連程度。再者,在測試階段經由正規化NMF之編碼向量,更進一步提升語音特徵之強健性。最後,我們也結合上述NMF的改進方法。本論文的所有實驗皆於國際通用的Aurora-2連續數字資料庫進行;實驗結果顯示相較於僅使用梅爾倒頻譜特徵之基礎實驗,我們所提出的改進方法皆能顯著地降低語音辨識錯誤率。此外,也嘗試將我們所提出的改進方法與一些知名的特徵強健技術做比較和結合,以驗證這些改進方法之實用性。實驗平台使用HTK與KALDI兩種語音辨識系統。前者用來實驗上述所提出NMF改良之效能;後者用來實驗類神經網路(Neural Network)技術於語音辨識之聲學模型的效能,並探討調變頻譜正規化法與其結合之效果。