學位論文

Permanent URI for this collectionhttp://rportal.lib.ntnu.edu.tw/handle/20.500.12235/73912

Browse

Search Results

Now showing 1 - 2 of 2
  • Item
    網頁搜尋結果重要面向事實內容自動擷取之研究
    (2014) 葉懿萱
    本論文的主要研究目的為,透過使用者給定的查詢字以及指定面向關鍵字,從大量的查詢回傳結果中,自動摘要出重要的面向資訊提供給使用者,讓使用者能快速得到所需的面向資訊。為了避免下載所有查詢結果文件並處理需花費相當多的時間,因此本論文採用查詢結果回傳的文件片段內容(snippets),作為探勘查詢字相關資訊的資料來源。本研究提出一個稱為SR-Summarization的方法,利用字詞在各面向查詢回傳結果中的分佈特性,提出評估字詞與查詢關鍵字的一般面向分數以及面向代表性分數的計算公式,進而評估一個句子的一般面向及面向代表性分數。此外,方法中也提出評估句子事實資訊性的計算公式,採用機器學習方法評估句子的品質好壞。最後,採用結合摘要內容的資訊量及內容多樣性為機制的句子挑選依據,產生"查詢字一般面向資訊”摘要,以及指定面向之”面向事實資訊”摘要。實驗結果顯示,本研究之方法能夠有效擷取出網頁搜尋結果中的重要面向事實內容,透過使用者問卷調查顯示,相較於相關研究的方法,使用者對於本研究方法找出的摘要結果有更高的滿意度。
  • Item
    流行疾病中文新聞面向事實自動擷取之研究
    (2017) 許宸瑋; HSU, CHEN-WEI
    當流行疾病發生時,使用者通常希望獲得更多有關於流行疾病的面向事實。本論文以中文流行疾病網路新聞為資料來源,研究如何從流行疾病新聞中自動擷取出疫情、症狀面向事實句,並從面向事實句中擷取出語意三元詞組進行結構化表示,以幫助有效率地查詢流行疾病的疫情發展狀況及症狀演變,並可作為建立知識庫的基礎。本論文提出的方法,對疫情及症狀面向事實句各建立一個分類模型,用來預測擷取新聞中對應的面向事實句。為了達到有效分類,本論文從已標示的面向事實句及非面向事實句中,以統計分析擷取出對分類較有效果的面向關鍵字,以這些關鍵字為基礎來建立每個句子的面向句分類特徵值。此外,由於不同流行病皆需給定訓練資料,本論文提出一個面向事實句自動標示的方法,可減少人工標示訓練資料的成本。此外,根據句子中詞彙的語法出現相依性分析,本論文方法可取出面向事實句的語意三元詞組及時間地點等屬性,建立面向事實的結構化表示。實驗結果顯示本論文提供的方法在面向事實句的選取、語意三元詞組的擷取都達到良好的效果。