資訊工程學系

Permanent URI for this communityhttp://rportal.lib.ntnu.edu.tw/handle/20.500.12235/60

本系前身「資訊教育學系」成立於民國七十四年,首先招收大學部學生,民國九十年成立資訊工程研究所碩士班,而後於民國九十五年進行系、所調整合併為「資訊工程學系」;並於九十六年成立博士班。本系目前每年約招收大學部四十餘人,碩士班六十餘人,博士班約五人,截至民國一百零四年十一月止,總計現有大學部一百九十多人,碩士班一百二十多人,博士班二十三人,合計學生人數約為三百三十多位。

News

Browse

Search Results

Now showing 1 - 1 of 1
  • Item
    強健性和鑑別力語音特徵擷取技術於大詞彙連續語音辨識之研究
    (2005) 張志豪
    語音是人類主要且最方便的溝通方式之一。現今由於小型電子產品的成功發展,如手機、個人數位代理(PDA)等,再加上無線通訊和無線網路的普及,一般都認為在不久的未來,語音將扮演舉足輕重的角色,且將擔任人類與各種不同智慧型產品溝通的主要人機介面。因此,自動語音辨識(Automatic Speech Recognition, ASR)的研究也變得日益受重視。其中,為了能讓自動語音辨識在真實且多變的環境下也可以適用,許多鑑別性(Discriminative)和強健性(Robust)的特徵擷取(Feature Extraction)技術在近二十年來也陸續被提出。 根據上述的觀察,在本論文裡我們研究基於聽覺知覺特性(Auditory-perception-based)的特徵擷取技術和資料相關(Data-driven)的線性特徵轉換(Linear Feature Transformation)技術,以達到強健性語音辨識的目的。對於基於聽覺知覺特性的特徵擷取技術,我們廣泛地比較常見的梅爾倒頻譜係數(Mel-frequency Cepstral Coefficients, MFCC)與感知線性預測係數(Perceptual Linear Prediction Coefficients, PLPC),並且比較用來取得與結合時域軌跡(Time Trajectory)資訊的各種方法。在資料相關線性特徵轉換這方面,首先我們嘗試驗證,線性鑑別分析(Linear Discriminant Analysis, LDA)在語音辨識的特徵空間轉換上的表現的確優於主成份分析(Principal Component Analysis, PCA)。然後我們研究幾種線性鑑別分析的改進方法,像是異質性線性鑑別分析(Heteroscedastic Linear Discriminant Analysis, HLDA)和異質性鑑別分析(Heteroscedastic Discriminant Analysis, HDA)等,這些方法在求取線性鑑別分析過程中,並未如傳統的線性鑑別分析般需假設每個類別分佈會有相同變異量(Variation)。此外,我們提出分別利用最小分類錯誤(Minimum Classification Error, MCE)和最大交互訊息(Maximum Mutual Information, MMI)等估測法來最佳化線性轉換矩陣,並與傳統最大相似度(Maximum Likelihood, ML)估測法作比較。最後,我們也進一步地結合最大相似度線性轉換(Maximum Likelihood Linear Transformation, MLLT)與其他強健性技術諸如特徵平均消去法(Feature Mean Subtraction)、特徵正規化法(Feature Normalization)等。本論文裡所有實驗皆使用中文廣播新聞為語料庫(Mandarin broadcast news corpus, MATBN)。實驗內容包括了中文自由音節辨識(Free Syllable Decoding),與大詞彙連續語音辨識(Large Vocabulary Continuous Speech Recognition, LVCSR)上。初步的實驗結果顯示出本論文所提出的作法對於語音辨識率有相當顯著的提昇。