資訊工程學系

Permanent URI for this communityhttp://rportal.lib.ntnu.edu.tw/handle/20.500.12235/60

本系前身「資訊教育學系」成立於民國七十四年,首先招收大學部學生,民國九十年成立資訊工程研究所碩士班,而後於民國九十五年進行系、所調整合併為「資訊工程學系」;並於九十六年成立博士班。本系目前每年約招收大學部四十餘人,碩士班六十餘人,博士班約五人,截至民國一百零四年十一月止,總計現有大學部一百九十多人,碩士班一百二十多人,博士班二十三人,合計學生人數約為三百三十多位。

News

Browse

Search Results

Now showing 1 - 2 of 2
  • Item
    應用摘要系統與資訊距離方法於生醫問答系統之研究
    (2014) 尚宗承; Shang, Tsung-Cheng
      本論文以阿茲海默症為主題,探討生醫相關之問答系統。目的在於將摘要系統特性以及資訊距離方法運用在問答系統的研究上,希望藉由機器學習的能力以及現有的相關文獻與背景知識庫的支援,找出此類問題的正確答案。   測試資料共包含四個與阿茲海默症相關的測試資料集,每個測試集包含一篇測試文章、10個與該文章相關的測試問題,每個問題都有五個選項,問題題型皆為單選題。另外使用到背景知識庫,資料來源包含從Pubmed Central得到關於阿茲海默症的醫學文獻資料庫(Medical Literature Analysis and Retrieval System Online, Medline)的文章,以及美國麻薩諸塞州的阿茲海默症研究中心(Massachusetts Alzheimer’s Disease Research Center)所提供關於阿茲海默症的生物文章及摘要。   在研究過程中根據不同的架構方法進行不同的研究,研究方法一為利用蔡秉翰於2013年所提出的生醫相關問答系統為基礎,結合摘要系統,對測試文章或背景知識庫做摘要,希望能夠藉由摘要系統的特性,將文章中重要的資訊擷取出來。而在研究方法二中的概念是認為問題與正確答案之間的資訊距離應小於問題與其他候選答案之間的資訊距離,因此將資訊距離方法針對QA4MRE的資料特性加以改良,並加入TFIDF計算方法及擴充詞語的技術。   最後,分別對這兩種研究方法進行實驗。在研究方法一的實驗中發現,因為背景知識庫中的文獻與對應測試集的問題主題關聯性較低,代表文章中之資訊大多為不重要的資訊,所以若對背景知識庫做摘要,可以有效的將重要之資訊擷取出來。而在研究方法二的實驗中發現,對資訊距離方法而言,採取增加Question Focus數量的方式能夠有效的使準確率提升。   經由實驗,本研究在探討將摘要系統與資訊距離方法應用於生醫問答系統的過程中發現,對背景知識庫中的文獻做摘要以及應用資訊距離的權重計算方法皆可以得到不錯的結果。
  • Item
    以答案驗證方法為基礎之生醫相關問答系統
    (2013) 蔡秉翰; CAI,Bing-Han
    本論文的研究,是以阿茲海默症為主題,實現一個問答系統來回答問題。目的在於能夠讀取一篇測試文章,回答相關文章的問題,正確理解測試問題的涵意,並擷取文章中相關字句資訊作評分計算,從中得到正確的答案,達成一個高精準度的問答系統。 本論文的測試資料共包含了四個主題為阿茲海默症的測試資料集,每個測試集包含一篇測試文章、10個關於該文章的測試問題,每個問題都有五個選項供選擇,問題答案皆為單選題。另外使用到背景知識庫,資料來源包含從Pubmed Central得到關於阿茲海默症的醫學文獻資料庫(Medical Literature Analysis and Retrieval System Online, Medline)的文章,以及美國麻薩諸塞州的阿茲海默症研究中心(Massachusetts Alzheimer’s Disease Research Center)所提供關於阿茲海默症的生物文章及摘要。我們也從線上人類孟德爾遺傳學(Online Mendelian Inheritance in Man, OMIM)的網站針對阿茲海默症作為關鍵字,擷取此疾病的相對應基因名稱,再利用連結內文來建立基因關係。 此研究首先以人類回答選擇題時最常使用的方式為模式:當接收到一個問題,會先閱讀並搜尋文章中與問題相關的句子尋求解答,接著再觀察答案選項與這些句子何者最相似、相關,最後回答覺得最可信的答案。再來我們嘗試答案驗證的方法,將問題與該問題對應可能的答案選項預先結合產生出假設(Hypothesis),再利用這些假設到文章裡閱讀並搜尋相關的句子尋求解答,相關的句子根據假設中相符的字來找尋並且用TFIDF的方法給予評分。而根據假設得到分數越高的句子就代表與該篇測試文章的主題內容越相符。最後再根據這些句子的分數給予每個假設評分,最高分的假設代表該假設所包含的答案選項為最後回答中覺得最可信的答案。在研究中分為以字為單位以及以詞彙為單位來進行實驗。此外,研究中另外使用背景知識庫以及OMIM網站取得的資源來達成詞語擴充的方法。 最後,我們將所有方法的組合進行23種實驗,前幾個實驗方法因為忽略答案選項中重要的資訊而使準確率大約只有一到兩成。再來我們改以答案驗證方法實驗,準確率就得到了高度的提升。之後加上詞彙的輔助、重要語句挑選以及字詞擴充,並分析評估這些方法如何使用及其影響,慢慢就達成準確率的上升,最後甚至能夠提升到五成左右,與使用相同測試資料的眾多研究相比較,此結果為不錯的成果。