學位論文

Permanent URI for this collectionhttp://rportal.lib.ntnu.edu.tw/handle/20.500.12235/73912

Browse

Search Results

Now showing 1 - 1 of 1
  • Item
    中文語音資訊摘要-模型與特徵之改進
    (2007) 陳怡婷
    大量包含聲音與影像的多媒體內容持續增加,並且遍佈於網際網路與我們的日常生活中,如何有系統化及自動化地處理與統整,已成為當前重要的課題之一。其中,語音為多媒體內容中最具有語意的主要內涵之一,通常可用來表示多媒體檔案的主題與概念。近幾年來,有許多學者已投入多媒體內容組織與理解的相關研究,並有豐碩的成果與貢獻,例如語音文件的轉譯、檢索與摘要。 文件摘要可分為摘錄式(Extractive)與非摘錄式(Non-extractive or Abstract)摘要,摘錄式摘要依特定摘要比例,從原文件中選出重要的文句、段落或章節來組成摘要;非摘錄式摘要是直接根據文件內容的主題或概念所產生的摘要內容。由於非摘錄式摘要仍具相當的困難度,故目前自動語音文件摘要的相關研究大多以摘錄式摘要為主。本論文主要探討摘錄式中文廣播新聞語音文件摘要方法。我們提出一個機率生成架構,它能將文句生成模型與文句事前機率緊密地耦合,用於摘錄式摘要之重要文句選取。待摘要文件中每一文句被視為一個機率生成式模型,藉以預測文件生成的機率。我們提出二種機率生成模型:隱藏式馬可夫模型(Hidden Markov Model, HMM)與關聯性模型(Relevance Model, RM)的結合,以及詞層次混合模型(Word Topical Mixture Model, wTMM)。同時,我們亦初步將辨識信心度與一些語音聲韻特徵用來作為文句事前機率的估測。我們於中文廣播新聞語料上進行實驗與分析,經由初步的結果證明所提出的方法較其它常見方法可達到更好的摘要結果。