學位論文
Permanent URI for this collectionhttp://rportal.lib.ntnu.edu.tw/handle/20.500.12235/73912
Browse
1 results
Search Results
Item 生醫文獻中特定關係組合之自動化擷取(2018) 陳弘奇; Chen, Hung-Chi本研究目的為擷取自然語句中指定名詞間的關係判定,並應用在生醫文獻內,以便快速地找出文獻中有用途的關係。雖然本研究是透過生醫文獻為基礎,但是對於各個領域的研究人員在探討自己領域的相關文獻資料時,也可以透過此方法更快速且正確的篩選到自己需要的文獻及資料。 本研究所使用的資料集分成兩組,並在實驗上兩組資料個別獨立。一組為參考Clinical trials (https://clinicaltrials.gov)網站中提供美國官方已完成的疾病研究和藥物的配對為基礎,並透過PubMed資料庫(https://www.ncbi.nlm.nih.gov/pubmed)搜尋目標疾病藥物對的生醫文獻摘要。其資料分成兩類:從PubMed文章摘要找出含有Clinical trials所提及到的疾病可被藥物治療之句子,視為正向的句子;以及相同疾病不能被藥物治療或是疾病與藥物無任何關聯之句子,視為負向的句子。 另一組為SemEval 2013 Task 9所提供,內容為MedLine的摘要以及DrugBank的資料庫構成的語料庫,SemEval 2013 Task 9為從生醫文獻中擷取藥物間交互作用的競賽(SemEval 2013 Task 9:Extraction of Drug-Drug Interactions from Biomedical Texts),該競賽將藥物間的交互作用分成五類:Advice(建議)、Effect(影響)、Mechanism(機制)、Int(交互作用)和False(無交互作用)。 本研究為透過多層次的機器學習方法搭配基本字詞轉換與自然語言句子分析作為特徵擷取。本研究在藥物—疾病關係辨識實驗最佳結果Accuracy為75.7%、Precision為76.3%、Recall為74.6%以及F-score為75.5%;在藥物—藥物關係辨識實驗最佳結果Precision為47.8%、Recall為72.4%以及F-score為57.6%。