學位論文
Permanent URI for this collectionhttp://rportal.lib.ntnu.edu.tw/handle/20.500.12235/73912
Browse
1 results
Search Results
Item 應用可讀性預測於中小學國語文教科書及優良課外讀物分類之研究(2016) 劉憶年; Liu, Yi-Nian可讀性(Readability)是指閱讀材料能夠被讀者理解的程度。可讀性高的文章較容易被讀者理解。文章的可讀性與很多因素有關,如:文長、字詞難度、句法結構、內容是否符合讀者的先備知識等,然而表淺的語言特徵無法反映這些複雜的成分。本論文以先前的研究為基礎,更深入的探討不同種類的特徵,包括句法分析(Syntactic Analysis)、詞性標記(Part-of-Speech, POS)、詞表示法(Word Embedding)、語意資訊(Semantic Information)與寫作程度(Well-written)等特徵,分析比對不同類型的特徵與可讀性高低的關聯性。實驗資料分為二部分:其一為中小學國語文教科書,選自98年度台灣三大出版社所出版的1~9年級(共18冊)審定版國中小國語文教科書;其二為優良課外讀物,選自文化部歷屆「中小學生優良課外讀物」獲選書籍。本論文嘗試透過逐步迴歸與支持向量機等兩種方式建立可讀性模型,比較兩者之效能優劣;最後,再將兩者加以結合,以提升預測之正確率。實驗結果顯示,本論文所提出的可讀性特徵相較於傳統所使用的表淺特徵,在文本難易度評估的任務中,能有顯著的效能提升。