資訊工程學系

Permanent URI for this communityhttp://rportal.lib.ntnu.edu.tw/handle/20.500.12235/60

本系前身「資訊教育學系」成立於民國七十四年,首先招收大學部學生,民國九十年成立資訊工程研究所碩士班,而後於民國九十五年進行系、所調整合併為「資訊工程學系」;並於九十六年成立博士班。本系目前每年約招收大學部四十餘人,碩士班六十餘人,博士班約五人,截至民國一百零四年十一月止,總計現有大學部一百九十多人,碩士班一百二十多人,博士班二十三人,合計學生人數約為三百三十多位。

News

Browse

Search Results

Now showing 1 - 1 of 1
  • Item
    適用於改善語音辨識的新穎調適方法與後處理模型
    (2023) 王馨偉; Wang, Hsin-Wei
    得益於神經模型架構和訓練算法的協同突破,自動語音識別(ASR)最近取得了巨大的成功並達到了人類的水平。然而,ASR 在許多現實用例中的性能仍遠未達到完美。人們對設計和開發可行的後處理模組以通過細修 ASR 輸出句子來提高識別性能的研究興趣激增,這些模組大致分為兩類。 第一類方法是 ASR 前 N 個最佳假設重新排序。ASR 前 N 個最佳假設重新排序旨在從給定的 N 個假設列表中找到單詞錯誤率最低的假設。另一類方法的靈感來自中文拼寫校正 (CSC) 或英文拼寫校正 (ESC)等,旨在檢測和校正 ASR 輸出句子的文本級錯誤。在本文中,我們嘗試將上述兩種方法整合到ASR糾錯(AEC)模組中,並探討不同類型的特徵對AEC的影響。我們提出的方法名為REDECORATE,適用於校正從現成語音服務獲得的純文本轉錄。在大多數情況下,目標域的相關純文本數據相對更容易獲得。因此,使用從此類數據中收集的知識可以更有效地將通用域 ASR 模型導向目標域。鑑於此,我們提出了另一種基於領域自適應數據構建的單詞共現圖的新穎的糾錯方法。 給定的神經 ASR 模型可以通過即插即用的方式輕鬆訪問有關語音話語語義上下文的知識,而無需引入額外的參數。該方法名為GRACE,可以隨插即用適用於客製化訓練的ASR模型的模型調適或是直接校正ASR轉錄結果。在 AISHELL-1 基準數據集上進行的一系列實驗表明,所提出的方法可以在強大的 ASR 基線上顯著降低字符錯誤率 (CER)。