資訊工程學系
Permanent URI for this communityhttp://rportal.lib.ntnu.edu.tw/handle/20.500.12235/60
本系前身「資訊教育學系」成立於民國七十四年,首先招收大學部學生,民國九十年成立資訊工程研究所碩士班,而後於民國九十五年進行系、所調整合併為「資訊工程學系」;並於九十六年成立博士班。本系目前每年約招收大學部四十餘人,碩士班六十餘人,博士班約五人,截至民國一百零四年十一月止,總計現有大學部一百九十多人,碩士班一百二十多人,博士班二十三人,合計學生人數約為三百三十多位。
News
Browse
4 results
Search Results
Item 中文文法剖析應用於電影評論之意見情感分類(2012) 張莊平; Chang, Chuang-ping在網路發達的現今社會,各種領域的評論資訊觸手可及,人們也習慣於收集產品的網路評論作為消費前的參考。尤其在電影產品上,除了從片商釋出預告片裡的片段內容外,事前無法試看,事後也無法退費。因此在前往電影院購票前,人們會更加重視網路上的評論心得。 在本篇論文中,收集來自電影評論網當中觀影民眾的評論文章,希望透過自然語言的分析技術,總結出一個電影整體的推薦分數以及數個電影元素(如劇情、演員、特效等)的高頻率意見詞,提供使用者選擇適合自己的電影觀賞。 在研究方法上,選擇以中文電影的評論文章為主,在傳統的電影評論意見分類步驟中引入中央研究院的中文剖析器,發展一套根據文法關係圖判斷意見詞與屬性詞配對的程式流程,以便針對大量字數的評論文章獲得更準確的分析及評分結果,最後再以五等第制的方式呈現。 實驗的結果證明本論文所提出系統的評分結果在誤差一分的情況下有70.7%的準確率,整體的MRR值為0.61;將五等第化為推薦與不推薦的結論時,也分別獲得了F-score 74.3%與51.4%的成果。這表示本實驗系統在透過大量收集網路評論文章來幫助使用者判斷電影的推薦程度上,確實達到預期的效果。Item 產品評論特徵自動擷取之研究(2011) 徐毓雯; Hsu,Yu-wen現今大多數意見探勘研究中,對於產品特徵字詞的挑選大多由人工給定或是依據詞頻的高低來決定,對不同種類的產品則需要重新給定產品特徵字詞,因此我們希望透過自動擷取產品特徵字詞,降低在產品特徵挑選所花費的人力成本。本論文運用不同的字詞重要性評估方式,探討如何有效地自動從論壇文章中擷取出產品特徵字詞。我們以名詞為候選特徵字詞,分別對論壇文件庫及相機介紹文件庫,統計每個字詞在文件庫中各廠牌討論文的出現頻率,反應出一般常見特徵;運用不同廠牌產品特徵字詞出現的機率差異程度,反應出廠牌特有特徵;並運用廠牌與特徵字詞出現的相關程度,反應出廠牌關聯特徵。此外我們亦考慮跨文件庫的字詞出現機率差異程度,反應出論壇及相機文中常用的產品特徵字詞,再透過常見字詞列表進行一般口語字詞的過濾篩選。我們提出產品特徵字詞重要性評估函式,結合各種分析方法所得的重要性評估值作為產品特徵字詞擷取的依據。實驗結果顯示以所提出的字詞重要性評估函式篩選字詞,可有效地自動擷取出產品特徵字詞。Item 利用剖析樹結構探討論壇評論之特徵與意見詞配對關係(2017) 江宜勳; Chiang, I-Hsun隨著網際網路的蓬勃發展,人們的消費習慣逐漸傾向網路購物,然而在尚未見到實體的情況下,往往會被官方「美好」的商品照片及描述所矇蔽,因為官方往往帶有主觀的推銷目的而不會將產品真正的優劣寫出來,故網友的評論就具有很大的參考價值,這也是本研究進行「分析評論」以達成產品推薦的主要原因。 本研究從巴哈姆特論壇中找尋該產品的相關評論,利用中研院剖析器逐一進行分析,從中找到標記為Head Na系列之詞彙 (本研究稱為特徵詞)及標記為VH、A系列之詞彙(本研究稱為意見詞),由於網路評論大多為非正式中文,故在語料庫之擷取上本論文秉持著只要有一個特徵詞或是意見詞就採納。利用投票的方式建構出特徵詞的資料庫,意見詞資料庫的建構部分則是與台大的情緒字典(NTUSD)比對,並利用物以類聚法、教育部重編字典和人工標記等方式加以補充,建構好之資料庫可用於處裡分群及给定分數等工作,並利用Aspect Based Semantic Analysis (ABSA)的核心概念,藉由剖析樹進行特徵及意見詞的配對。在輸出方面會提供使用者該產品的各項評論之特徵、意見詞、意見詞的情感分數、特徵及意見詞之配對及整體產品的分數等,以期提供評論之重要資訊給使用者。 本論文的最後的實驗數據在特徵詞分群上有著81.8%的正確率、意見詞的分群上有著87.71%的正確率,特徵詞語意見詞之配對正確率有著87.13%,而最後與日本亞馬遜的推薦與否在星等上有著90%的相似度,IDF值上有著70%的相似度。Item 結合監督式及非監督式方法進行新聞文章意見持有者辨識之研究(2016) 張益豪; Chang, Yi-Hao意見探勘幫助我們自動地從大量的可靠來源文本,擷取人們感興趣且可利用的主觀性資訊。意見句可分為四個部分,包括意見主題、意見持有者、意見主張及意見情感,本研究目的在於辨識意見持有者。本研究提出一個結合監督式及非監督式學習的方法,辨識意見句中的文章作者或持有者代表詞,本研究的主要流程任務分成兩個部分:文章作者意見辨識、意見持有者辨識。 意見持有者辨識目的是從意見句中擷取出表達此意見的人物名或組織名,以監督式學習方法為基礎,從包含主觀性意見句的文檔中,人工標記意見持有者的代表詞答案,再經由自然語言處理方法進行預處理步驟(包含斷詞、詞性標記及具名實體辨識等),之後將兩個主要任務通過各自建立的數個支援向量機模型,對意見表達句進行文章作者辨識與意見持有者的識別。在文章作者意見辨識中使用包含詞彙相關資訊、詞性相關資訊、標點符號相關資訊、具名實體相關資訊、句法相關資訊、意見詞資訊等特徵值;在意見持有者的識別中則使用包含詞性相關資訊、詞彙相關資訊、具名實體相關資訊、文句組成相關資訊、標點符號相關資訊等特徵值。最後合併兩部分的辨識結果,產生系統提報的意見持有者。 對於一個意見句中含有多個意見持有者候選詞之問題,我們利用公式計算出代表意見持有者的詞彙,並借助本研究制定的規則,修正持有者代表詞完整度不足的問題;此外,對於意見持有者涉及指代消解問題的情況,本研究使用Hobbs Algorithm句法剖析的方式解決此問題。本研究的系統辨識方法,實驗結果表明在英語新聞語料中,文章作者辨識可以達到F-1值91.58%的效能,及意見持有者辨識可以達到F-1值71.83%的效能,在此基礎上進行了交叉驗證和刪減特徵值分析重要程度的工作,並且能夠得到良好的辨識效果。