資訊工程學系

Permanent URI for this communityhttp://rportal.lib.ntnu.edu.tw/handle/20.500.12235/60

本系前身「資訊教育學系」成立於民國七十四年,首先招收大學部學生,民國九十年成立資訊工程研究所碩士班,而後於民國九十五年進行系、所調整合併為「資訊工程學系」;並於九十六年成立博士班。本系目前每年約招收大學部四十餘人,碩士班六十餘人,博士班約五人,截至民國一百零四年十一月止,總計現有大學部一百九十多人,碩士班一百二十多人,博士班二十三人,合計學生人數約為三百三十多位。

News

Browse

Search Results

Now showing 1 - 2 of 2
  • Item
    生物資訊文獻中人類遺傳疾病與基因關聯度之研究
    (2011) 陳立哲; Li-Che Chen
    本論文之研究,是在探討文獻中人類遺傳疾病與基因的關聯度,希望從中得到一些人類遺傳疾病與基因這兩者之間的關係,其目的在於希望在往後的生物資訊文獻上,可以快速的得知文獻上出現的人類遺傳疾病是否與文獻上出現的基因相關聯。 本論文所使用的相關資料包含了醫學文獻資料庫(Medical Literature Analysis and Retrieval System Online, Medline),從中擷取出所需要使用的資訊,包括PMID、TI以及AB,其中PMID為該篇的ID number,TI為標題,而AB即為內文。接著,利用Geniatagger來標記AB上出現的基因。再來,利用線上人類孟德爾遺傳學(Online Mendelian Inheritance in Man, OMIM)的網站,下載人類遺傳疾病與相關基因的資料,再利用這兩者去標記AB上出現的疾病與基因。 針對此研究,提出了兩類運算的方法,其中第二類方法會再加以變化,衍生出新的運算方法。第一類的方法分為五種,第一種方法是運用密度的計算公式,第二種是運用重力公式,此公式有四種變化。第二類的方法就是自然語言常用的Dice,在此,以此公式為基本架構,再加以調整延伸公式,和一般的比例公式以及一般比例公式延伸變化。 II 最後求出的結果,前兩者的準確率最高是在一成左右,屬於偏低的準確率,其原因是,他們只有運用到位置與TFIDFT(Term Frequency Inverse Document Frequency(Term))的變數去計算他們的值,忽略了一些疾病與基因的特性,所以分數才會如此的不顯著。再來,運用以Dice為主要架構的變化公式,這方法考慮到Gene Ontology,對此實驗來說,考慮的要素正好符合實驗的精神,所以計算出的分數,才會越高而越接近實驗的正確配對,當過一個門檻值之後,準確率就會達到100%。
  • Item
    以答案驗證方法為基礎之生醫相關問答系統
    (2013) 蔡秉翰; CAI,Bing-Han
    本論文的研究,是以阿茲海默症為主題,實現一個問答系統來回答問題。目的在於能夠讀取一篇測試文章,回答相關文章的問題,正確理解測試問題的涵意,並擷取文章中相關字句資訊作評分計算,從中得到正確的答案,達成一個高精準度的問答系統。 本論文的測試資料共包含了四個主題為阿茲海默症的測試資料集,每個測試集包含一篇測試文章、10個關於該文章的測試問題,每個問題都有五個選項供選擇,問題答案皆為單選題。另外使用到背景知識庫,資料來源包含從Pubmed Central得到關於阿茲海默症的醫學文獻資料庫(Medical Literature Analysis and Retrieval System Online, Medline)的文章,以及美國麻薩諸塞州的阿茲海默症研究中心(Massachusetts Alzheimer’s Disease Research Center)所提供關於阿茲海默症的生物文章及摘要。我們也從線上人類孟德爾遺傳學(Online Mendelian Inheritance in Man, OMIM)的網站針對阿茲海默症作為關鍵字,擷取此疾病的相對應基因名稱,再利用連結內文來建立基因關係。 此研究首先以人類回答選擇題時最常使用的方式為模式:當接收到一個問題,會先閱讀並搜尋文章中與問題相關的句子尋求解答,接著再觀察答案選項與這些句子何者最相似、相關,最後回答覺得最可信的答案。再來我們嘗試答案驗證的方法,將問題與該問題對應可能的答案選項預先結合產生出假設(Hypothesis),再利用這些假設到文章裡閱讀並搜尋相關的句子尋求解答,相關的句子根據假設中相符的字來找尋並且用TFIDF的方法給予評分。而根據假設得到分數越高的句子就代表與該篇測試文章的主題內容越相符。最後再根據這些句子的分數給予每個假設評分,最高分的假設代表該假設所包含的答案選項為最後回答中覺得最可信的答案。在研究中分為以字為單位以及以詞彙為單位來進行實驗。此外,研究中另外使用背景知識庫以及OMIM網站取得的資源來達成詞語擴充的方法。 最後,我們將所有方法的組合進行23種實驗,前幾個實驗方法因為忽略答案選項中重要的資訊而使準確率大約只有一到兩成。再來我們改以答案驗證方法實驗,準確率就得到了高度的提升。之後加上詞彙的輔助、重要語句挑選以及字詞擴充,並分析評估這些方法如何使用及其影響,慢慢就達成準確率的上升,最後甚至能夠提升到五成左右,與使用相同測試資料的眾多研究相比較,此結果為不錯的成果。