中文情感語意自動分類之研究

No Thumbnail Available

Date

2010

Authors

Journal Title

Journal ISSN

Volume Title

Publisher

Abstract

目前情感語意分析的研究,半監督式學習和非監督式學習還屬於初發展的階段。由於基於監督學習情感分析的研究已經很成熟了,基於半監督學習的情感分析將會是未來的研究趨勢。 本篇論文所研究的為利用網路上的繁體中文電影討論區中網友的各類影評留言,探討中文文章中情感語義的分類,中文跟英文在用法上有很多的不同處,中文的研究探討對於我們中文使用者來說更是重要。本篇的方法用「連續」表達程度的不同而非二元的「正評價」、「負評價」,正和負為連續語義的兩邊極值,而在兩極值中間的值則表示存在有潛在的興趣。我們利用了非監督式分類的方法,所以並不需要已註釋的訓練資料,而僅需要使用到一般常用的「否定字」和「副詞」資訊,非監督式分類的方法還包含了一個「種子」字彙及反覆再訓練,使擴大其原本的字彙量。 經過本研究的方法及實驗,提出了一個自動分類文章語意的方法,有效的利用了中央研究院詞庫小組的斷詞系統,並且從單純的二分類法擴展到連續的評分程度。

Description

Keywords

語意分類, 自然語言處理, 中文處理

Citation

Collections