黃文吉Hwang, Wen-Jyi李兆珩Li, Zhao-Heng2020-12-142020-09-252020-12-142020http://etds.lib.ntnu.edu.tw/cgi-bin/gs32/gsweb.cgi?o=dstdcdr&s=id=%22G060747063S%22.&http://rportal.lib.ntnu.edu.tw:80/handle/20.500.12235/111747本研究為了解決使用主動式學習的推薦系統可能面臨到因為使用者使用系統的頻率不高,而造成資料收集困難的問題,我們希望透過使用者點選的歷史資料,進行資料增量,藉由多次的觀看紀錄,也就是使用者行為資料,產生相應且大量的模擬資料,來加速使用Active Learning的推薦系統收集資料的速度,減少時間資源的浪費。 本論文以強化式學習的Policy Gradient與主動式學習結合的動態節目導覽推薦系統為例來做資料增量。我們的推薦系統同時考慮使用者的觀看節目類別的喜好,工作日與例假日,觀看時間等,因此為了有效率的產生符合一般人習慣的模擬訓練資料,我們試圖產生情境式的模擬資料來訓練類神經網路。藉由對多種情境作情境增量,我們得以解決主動式學習所面臨到需要花費大量時間收集資料的問題。none推薦系統強化式學習主動學習none協助動態節目導覽推薦系統訓練資料增量之研究Data Augmentation for the Training of Smart Electronic Program Guide Systems