Browsing by Author "Han, Yi-Chen"
Now showing 1 - 1 of 1
- Results Per Page
- Sort Options
Item 應用自動文字探勘於臺灣中文饒舌音樂歌詞之研究(2021) 韓怡臻; Han, Yi-Chen邁入千禧年後,饒舌歌曲已逐漸進入主流音樂市場,深受年輕族群的歡迎。饒舌歌手經常透過自行創作的歌詞來抒發心情或表達對社會的批判,了解饒舌音樂的歌詞內容也能了解當代文化和社會風氣。本研究旨在運用文字探勘探索臺灣中文饒舌音樂歌詞中可能存在之主題類型。 本研究首先進行詞頻分析,計算關鍵詞在歌詞文本中出現的總次數,從整體、歌手、年代三個不同面向去觀察關鍵詞的出現頻率以了解臺灣中文饒舌音樂歌詞的基本內涵與詞頻分布。隨後使用K-means分群演算法及鄰近傳播分群法進行非監督式的分群實驗,並透過輪廓係數的計算以及對各群集的深入觀察作為對分群成效的評估,同時找出了七種可能存在之歌詞主題類型,分別為:音樂、派對、友情、愛情、成長、地方、社會。最後,利用分群實驗與人工標記之結果搭配支援向量機與K-近鄰演算法進行監督式的二元分類實驗,並透過正確率、精確率、召回率與F1值之計算評估此兩種分類演算法在不同的歌詞主題及不同的標記方式下對於臺灣中文饒舌音樂歌詞之分類成效。 本研究發現臺灣中文饒舌音樂歌詞近二十年來以音樂、愛情、派對的主題最為常見,隨著年代的推移,也有越來越多不同的歌詞主題出現,例如,日常生活、社會議題、學校等。分群成效方面,鄰近傳播分群法相較於K-means分群演算法會得到略好些的分群成效。分類成效方面,使用K-近鄰演算法相較於支援向量機會得到略好些的分類成效,而且透過分群結果輔助分類標記能訓練出比純人工標記還要好的音樂類歌詞二元分類模型。音樂類主題的歌詞確實存在於臺灣中文饒舌音樂歌詞中,而其他主題類型的歌詞因為有資料不平衡之問題存在,能否自成一類仍有待觀察。建議未來研究可以增加歌詞文本的收錄範圍、嘗試不同的維度縮減方式、從不同面向進行詞頻分析、偕同專家或閱聽者進行標記、使用不同的分群與分類方法。