學位論文
Permanent URI for this collectionhttp://rportal.lib.ntnu.edu.tw/handle/20.500.12235/73912
Browse
2 results
Search Results
Item 中文語音資訊摘要-模型與特徵之改進(2007) 陳怡婷大量包含聲音與影像的多媒體內容持續增加,並且遍佈於網際網路與我們的日常生活中,如何有系統化及自動化地處理與統整,已成為當前重要的課題之一。其中,語音為多媒體內容中最具有語意的主要內涵之一,通常可用來表示多媒體檔案的主題與概念。近幾年來,有許多學者已投入多媒體內容組織與理解的相關研究,並有豐碩的成果與貢獻,例如語音文件的轉譯、檢索與摘要。 文件摘要可分為摘錄式(Extractive)與非摘錄式(Non-extractive or Abstract)摘要,摘錄式摘要依特定摘要比例,從原文件中選出重要的文句、段落或章節來組成摘要;非摘錄式摘要是直接根據文件內容的主題或概念所產生的摘要內容。由於非摘錄式摘要仍具相當的困難度,故目前自動語音文件摘要的相關研究大多以摘錄式摘要為主。本論文主要探討摘錄式中文廣播新聞語音文件摘要方法。我們提出一個機率生成架構,它能將文句生成模型與文句事前機率緊密地耦合,用於摘錄式摘要之重要文句選取。待摘要文件中每一文句被視為一個機率生成式模型,藉以預測文件生成的機率。我們提出二種機率生成模型:隱藏式馬可夫模型(Hidden Markov Model, HMM)與關聯性模型(Relevance Model, RM)的結合,以及詞層次混合模型(Word Topical Mixture Model, wTMM)。同時,我們亦初步將辨識信心度與一些語音聲韻特徵用來作為文句事前機率的估測。我們於中文廣播新聞語料上進行實驗與分析,經由初步的結果證明所提出的方法較其它常見方法可達到更好的摘要結果。Item 表示法學習技術於節錄式語音文件摘要之研究(2015) 施凱文; Shih, Kai-Wun在現今日常生活裡,大量的多媒體內容與日俱增促使自動語音文件摘要成為一項重要的研究議題。當中最為廣泛地被探究的是節錄式語音文件摘要(Extractive Spoken Document Summarization):其目的是根據事先定義的摘要比例,從語音文件中選取一些重要的語句,用以代表原始語音文件的主旨或主題。另一方面,表示法學習(Representation Learning)是近期相當熱門的一個研究議題,多數的研究成果也證明了這項技術在許多自然語言處理(Natural Language Proceeding, NLP)的相關任務上,可以獲得優良的成效。有鑑於此,本論文主要探討使用詞表示法(Word Representations)及語句表示法(Sentence Representations)於節錄式語音文件摘要任務上。基於詞表示法及語句表示法,本論文提出三種新穎且有效的排序模型(Ranking Models)。除了文件中的文字資訊外,本論文更進一步地結合語音文件上的各式聲學特徵,如韻律特徵(Prosodic Features)等,以期望可獲得更好的摘要成效。本論文的語音文件摘要實驗語料是採用公視廣播新聞(MATBN);實驗結果顯示,相較於其它現有的摘要方法,我們所發展的新穎式摘要方法能夠提供顯著的效能改善。