資訊工程學系
Permanent URI for this communityhttp://rportal.lib.ntnu.edu.tw/handle/20.500.12235/60
本系前身「資訊教育學系」成立於民國七十四年,首先招收大學部學生,民國九十年成立資訊工程研究所碩士班,而後於民國九十五年進行系、所調整合併為「資訊工程學系」;並於九十六年成立博士班。本系目前每年約招收大學部四十餘人,碩士班六十餘人,博士班約五人,截至民國一百零四年十一月止,總計現有大學部一百九十多人,碩士班一百二十多人,博士班二十三人,合計學生人數約為三百三十多位。
News
Browse
9 results
Search Results
Item 以深度學習對包含長文之資料集進行情感分析(2022) 陳宜威; Chen, I-Wei隨著網際網路的蓬勃發展,越來越多的訊息在社群網站、線上購物網站、論壇等各種網路平台間傳遞,而這一些訊息可能都表達了人們的看法或是評價。但是只依靠人力來觀察如此龐大的資訊量是非常沒有效率的,因此如何讓電腦得以代替人類完成這一項工作量龐大的任務是必要的。自然語言處理(Natural Language Processing,NLP)是一種讓電腦可以理解人類語言的技術,而情感分析(Sentiment Analysis)則是NLP其中的一項常見應用。它能夠了解字句間所表達的情緒,比如分析網路上對於某些產品、名人、事件等事物的評論立場為何,像是有好感還是持有負面態度。本實驗使用含有長文的IMDB資料集進行情感分析,該資料集將評論分為正面和負面,並且建立深度學習模型讓它藉由評論內容判斷評論表達的情緒是正面或負面,除了基本的LSTM和BERT模型以外,本實驗還有嘗詴讓BERT合併BERT或LSTM模型,希望藉由增加模型獲得的特徵來提高準確度,並且對各種模型的實驗結果進行比較。Item 以有限配對資料訓練事實問題生成模型之研究(2020) 蕭雅方; Hsiao, Ya-Fang本論文考慮在閱讀文句與對應問題的配對資料有限情況下,透過遷移式學習概念,利用未配對的資料增強編碼器-解碼器架構模型的學習效果,使模型仍能生成相當於輸入大量配對資料訓練後的生成效果。本研究採用序列對序列模型,先以非監督式學習方式,利用大量無需經過標記的文句和問題,訓練自動編碼器架構。接著,擷取出預訓練好能理解文句的編碼器及生成問題的解碼器進行組合,並對編碼器加入轉移層建構出新的模型,再以遷移式學習選用文句與問題配對訓練微調模型參數。實驗結果顯示,採用本論文設計的遷移式學習方式,並配合訓練策略,在減少一半文句與問題配對資料的訓練,仍比直接採用全部配對訓練資料進行訓練得到的問題生成模型有更佳效果。Item 於有限標示資料下可擴展關係擷取之學習策略(2020) 黃劭崴; Huang, Shao-Wei本論文以國中生物課本文本內容作為語料庫來源,研究如何從有限標示的中文文本資料中進行關係擷取。本論文將此問題分成三元詞組偵測及語意關係分群及分類兩個處理任務,我們對三元詞組偵測任務提出結合關係詞類標籤模型及句型分類模型,並搭配遷移式學習、句型分類微調、及條件隨機域預測的學習策略,輸出句子中可能包含的三元詞組;對語意關係分群及分類任務則提出兩階段分群演算法,找出三元詞組中語意關係相似的聚落,並搭配半監督式學習的策略指定聚落的關係類別,達到可擴展關係擷取的目的。本論文實驗顯示:採用 BERT模型加上各元件及學習策略時,可讓原模型達到更好的標籤預測效果,另外所提出之兩階段分群演算法也較傳統分群演算法得出三元詞組的聚落有更高的關係類別純度。最後結合兩個任務所提方法,在具一般關係詞類標籤的來源領域資料輔助下,本論文所提方法只需極少數目標領域中已指定關係類別的三元詞組標示資料,即可達到約 66% 的正確率,且較需大量標示資料的監督式學習關係擷取方法有更高的正確率。Item 以產品圖形為基的方法分析手機及相機功能之相關性研究(2020) 蔡鎮宇; Tsai, Chen-Yu隨著網路的普及,店家的銷售模式及消費者的購物模式逐漸改變,許多人購物前會事先在網路論壇等平台查詢產品相關評價後才決定是否購買。網路論壇常見的討論方式為發佈一篇與產品之間比較的文章,而許多網友則會在下方留下自己偏好的產品以及一些對產品的看法。 本論文使用的資料來自於批踢踢實業坊Mobilecomm看板文章,實驗語料選自文章中的網友所撰寫的文章推文。研究目的主要希望針對這些文章推文進行極性分析,透過分析結果進一步對產品進行排名。儘管產品的整體排名是一項重要的指標,但現在越來越多消費者會根據相機功能選購手機,因此研究中同時會對相機功能的部分進行排名。 在計算手機品牌分數上,本研究將建立有向加權圖確立每個手機品牌之間的關係,透過定義比較句和主觀判斷句的方式,以這些句子建立每個產品本身的分數以及有向邊的分數。 最後透過正向句和負向句不同的權重計算方式得出兩種不同結論。當使用正向句分數減去負向句分數時,得出當相機功能排名靠前時,手機品牌的分數不會靠後。當使用正向句分數除以負向句分數時,目前暫時無法判斷手機品牌與相機功能的相關性。Item 以自然語言技術自動評估學生答案之研究(2010) 曹家豪為了增進老師與學生之間的互動以提高學生學習的意願,最主要的事是讓老師能迅速的了解學生的學習狀況,一個智慧型電腦系統應該要具備有自動評量學生分數的功能,當老師提出了問題後,一開始我們先建立評量的文件集,有了這些文件集後,我們依照下列的步驟去擷取出有意義的資訊:(1)為了得到句法的相關資訊,我們一開始對文件做詞性標記,(2)因為標點符號以及十進位數字會對我們造成干擾的資訊,我們也對此進行去除的動作,(3)為了聚集更好的資訊,我們也對句子進行正規化以及還原成字根的步驟,(4)擷取另外的資訊。在這篇論文中我們將評量的問題改成以分類的角度來進行實驗,即將學生分數分成兩個類別,其中一個類別是得分為6分到10分,另外一個類別就是0到5分。我們得到平均精確度為65.2%,並且從初步的二分類擴展到多分類,precision由原本的65.2%提高到70.8%藉由SVM進行的實驗得到了一個令人振奮的結果,在未來希望能有更進一步的成果。Item 中文情感語意自動分類之研究(2010) 陳立目前情感語意分析的研究,半監督式學習和非監督式學習還屬於初發展的階段。由於基於監督學習情感分析的研究已經很成熟了,基於半監督學習的情感分析將會是未來的研究趨勢。 本篇論文所研究的為利用網路上的繁體中文電影討論區中網友的各類影評留言,探討中文文章中情感語義的分類,中文跟英文在用法上有很多的不同處,中文的研究探討對於我們中文使用者來說更是重要。本篇的方法用「連續」表達程度的不同而非二元的「正評價」、「負評價」,正和負為連續語義的兩邊極值,而在兩極值中間的值則表示存在有潛在的興趣。我們利用了非監督式分類的方法,所以並不需要已註釋的訓練資料,而僅需要使用到一般常用的「否定字」和「副詞」資訊,非監督式分類的方法還包含了一個「種子」字彙及反覆再訓練,使擴大其原本的字彙量。 經過本研究的方法及實驗,提出了一個自動分類文章語意的方法,有效的利用了中央研究院詞庫小組的斷詞系統,並且從單純的二分類法擴展到連續的評分程度。Item 利用詞性與詞權重分析中文意見之研究(2010) 李昇陽在資訊爆炸的時代中,我們可以很容易搜尋到大眾的想法與心得,如何快速擷取這些寶貴的資訊,變成了一個重要的課題。目前關於這方面的研究已經慢慢興起,也有許多大型會議提供進行評比的競賽主題,我們希望提出意見的模型,使得進行意見存在與否方面的研究能有所助益。 本篇研究根據主題中的查詢字串找出包含意見的文件,在探討詞的各種權重方面,我們首先對每份文件進行斷詞,並根據查詢主題計算詞的PMI值,然後我們以文件內主題相關詞彙的PMI跟BM25屬性得到關於主題相關度的分數。也根據文件內意見相關詞彙權重與距離權重結合主題相關分數得到意見相關分數;在探討詞性方面,我們在流程中加入主題相關詞彙需經過名詞過濾,意見相關詞彙除了原本的詞典外,也加入了高PMI且詞性為不及物動詞的的詞來擴充。Item 旅遊評論關注面向與不一致性分析研究(2018) 許先緯; Hsu, Hsien-Wei網路的便利性改變人們的消費習慣和店家的經營模式,許多人在進行購物前習慣上網先查詢相關評價再決定是否購買,希望購買的物品能達到預期的效益。店家則希望消費者在購物體驗後能上網留下評價,這些評論能夠吸引更多人關注並且提供店家維持品質和改善的方向。一篇評論通常包含使用者給予的星等分數和意見,當評論文章數量變多,經過觀察會發現其中有些評論的星等分數和意見內容不符合,像是使用者給予5顆星的正面評分但是留下的意見卻都是許多缺失和抱怨,就是所謂的不一致現象。 本論文使用的資料來自於TripAdvisor國際旅遊評論網站,實驗資料選自台北市知名7間飯店。研究目的有二:第一個目的是擴充情感字典裡的詞彙數量,透過自建擴充的情緒詞彙庫和所提出的情緒計算模組能自動賦予每個詞彙情緒分數,分析評論文章的不一致性,以便提供有效的評論意見供旅客做為參考依據。第二個目的是找出評論文章裡的面向詞(Aspect term),將所有面向詞映射到向量空間後使用分群演算法進行分群,希望意義相近的詞彙能夠分到同一類並找出能夠代表此類的代表字,當使用者想要查看所在意面向的評論文章時,不需要每篇評論都要看過,而是能夠透過分析出來的代表字快速找到有關此面向的評論文章,也能更細部的分析各個面向的正負面評價。 本研究提出三種基於不同規則的統計算法辨識評論文章的不一致性,其中使用去掉最低分做算術平均數之規則,系統準確率可達到85.7%。關注面向部分,使用Word2vec產生詞向量,利用K-Means和Fuzzy C-Means將面向詞分群,並找出每群的代表字。研究結果顯示,使用Fuzzy C-Means分群找出的代表字較能區分各種不同面向。Item 電影評論之助益性分析研究(2018) 徐志廷; Hsu, Chih-Ting現今網際網路的蓬勃發展下,巨大的資料量已經是無可避免的趨勢,其中也包含了使用者留下的評論。眾多的評論中不一定每則都是有用的資訊,因此從大量的使用者評論中篩選出有助益性的評論,是本篇論文的研究目標。 評論的有助益性(review helpfulness)並沒有一個標準的定義,只要能幫助使用者有所思考,就能是助益性的一種。因此本研究嘗試透過各項特徵給定評論分數,作為判斷的依據。 本篇論文以雅虎電影中文短篇評論做為研究題材,使用中央研究院中文斷詞系統先將評論進行斷詞處理,再從資料裡找出TFIDF關鍵詞、詞性及評論長度。其中TFIDF關鍵詞經過教育部線上辭典進行同/反義詞擴充,並使用臺灣大學建立的情緒詞詞典NTUSD (National Taiwan University Semantic Dictionary)進行比對,找出每則評論所包含的情緒詞,且計算情緒詞出現的次數。並使用SVM訓練模型及預測結果,得到了79.7%的準確率。