學位論文

Permanent URI for this collectionhttp://rportal.lib.ntnu.edu.tw/handle/20.500.12235/73912

Browse

Search Results

Now showing 1 - 2 of 2
  • Item
    探索虛擬關聯回饋技術和鄰近資訊於語音文件檢索與辨識之改進
    (2013) 陳憶文
    虛擬文件檢索(Pseudo-Relevance Feedback)為目前最常見的查詢重建(Query Reformulation)典範。它假設預檢索(Initial-round of Retrieval)排名前端的文件都是相關的,所以可全用於查詢擴展(Query Expansion)。然而,預檢索所獲得的文件中,極可能同時包含重複性資訊(Redundant)和非關聯(Non-relevant)資訊,使得重新建立的查詢不能有良好檢索效能。有鑑於此,本論文探討運用不同資訊以在預檢索獲得的語音文件中挑選適當的關聯文件來建立查詢表示,讓語音文件檢索結果可以更準確。另一方面,關聯模型(Relevance Model )雖然可藉由詞袋(Bag-of-words)假設來簡化模型推導和估測,卻可能因此過度簡化問題,特別是用於語音辨識的語言模型。為了調適關聯模型,本論文有兩個貢獻。其一,本論文提出詞鄰近資訊使用於關聯模型以改善詞袋(Bag-of-words)假設於語音辨識的不適。其二,本論文也進一步探討主題鄰近資訊以強化鄰近關聯模型的架構。實驗結果證明本論文所提出之方法,不論在語音文件檢索還是語音辨識方面皆可有效改善現有方法的效能。
  • Item
    查詢模型化於語音文件檢索之研究
    (2011) 陳珮寧
    語音文件檢索(Spoken Document Retrieval)在語音處理研究領域一直是令人感興趣的研究題目。語音文件檢索的研究常面臨的問題可歸納成三大層面:(1)通常查詢(Query)傴是使用者資訊需求(Information Need)的一種用較含糊的表達方式,並不能完整代表使用者資訊需求所欲表達的語意;(2)在語音文件與使用者查詢中常會使用不同的詞彙來表相同的主題或概念(Topic or Concept);(3)語音文件經自動語音辨識(Automatic Speech Recognition, ASR)轉寫成文字時,常受限於語音辨識之正確率,而導致資訊檢索效能的降低。基於上述觀察,本論文提出許多查詢模型化(Query Modeling)改進方式,用以減輕語音文件檢索面臨的問題。未達此目的,吾人嘗詴探索關聯性語言模型(Relevance Language Model)於語音文件檢 索之使用;同時, 吾人在此模型架構中融入了文件層次主題資訊(Topic Information)與查詢非相關資訊(Non-relevance Information),以期增進查詢模型化之效果。本論文的實驗是進行在國際廣泛使用的Topic Detection and Tracking(TDT)語料庫;實驗結果顯示吾人所提出之檢索方法,相較於一些現有檢索方法,能達到更好的檢索效能。