學位論文
Permanent URI for this collectionhttp://rportal.lib.ntnu.edu.tw/handle/20.500.12235/73912
Browse
2 results
Search Results
Item 多口音英語語音辨識(2024) 鄭皓天; Cheng, Hao-Tien隨著全球化的趨勢,英語作為國際通用語言的角色日益重要。然而,由於母語背景、地區和文化差異的影響,英語口音的多樣性也相應增加。這使得語音辨識系統在識別各種口音的英語時面臨著挑戰。本論文探討針對在有限口音語料的狀況下如何通過增加口音鑑別力來改進Conformer模型對於多口音英語語音的辨識效果。本論文提出了一種方法將口音分類任務加入語音辨識模型中,旨在提高模型對於不同口音的敏感性和鑑別能力。實驗結果顯示,與傳統的語音辨識方法相比,此方法在口音英語語音辨識的詞錯率有下降,並且也將模型編碼器中不同層的口音特徵視覺化來進行分析,探討模型在不同層的特徵所代表的訊息。另外,本論也探討了利用大量資料訓練的Whisper模型在英語版、多語言版本以及不同模型大小的設定下對於多口音英語語音辨識任務的效果,也比較了使用LoRA的方式來訓練模型與全面微調方式的差異,為模型的選擇提供了一個更明確的參考。Item 基於面向學習之商品評分預測與解釋文本生成模型(2022) 簡子芸; Chien, Tzu-Yun本論文提出一個基於面向學習概念的模型,用來進行商品評分預測及對評分的解釋文本生成,稱為LARGE (Learning Aspects-representation for Rating and Generating Explanation)模型。在模型的編碼器中我們設計可學習多面向特徵空間的神經層,由商品評論文內容及使用者嵌入向量學習出對應的面向特徵向量,除了用以提供評分預測,並將商品的面向特徵向量融入每次的解碼狀態,引導生成的評分解釋文本能聚焦於商品所具有的面向。LARGE模型採多任務學習方式進行訓練,透過結合兩個不同目標任務的損失函數進行整體參數優化,且在評分預測的損失函數,加入權重調整策略,以降低推薦系統中評分資料分布不均對預測效能的影響。本論文採用亞馬遜資料集中三個不同商品類別的資料進行測試,實驗結果顯示,LARGE模型比相關研究所提出的代表性模型NRT,有效提升在評分預測及文本解釋生成的效能。此外,LARGE在解釋文本敘述中的類別型面向詞涵蓋率,比需輸入指定面向詞的NRT擴展模型有更高的涵蓋率。