資訊工程學系
Permanent URI for this communityhttp://rportal.lib.ntnu.edu.tw/handle/20.500.12235/60
本系前身「資訊教育學系」成立於民國七十四年,首先招收大學部學生,民國九十年成立資訊工程研究所碩士班,而後於民國九十五年進行系、所調整合併為「資訊工程學系」;並於九十六年成立博士班。本系目前每年約招收大學部四十餘人,碩士班六十餘人,博士班約五人,截至民國一百零四年十一月止,總計現有大學部一百九十多人,碩士班一百二十多人,博士班二十三人,合計學生人數約為三百三十多位。
News
Browse
11 results
Search Results
Item 利用AlphaZero框架實作與改良MiniShogi程式(2020) 陳品源; Chen, Pin-Yuan2016年3月,DeepMind的AlphaGo程式以4:1的結果擊敗了當時韓國職業圍棋9段棋士李世乭,讓電腦對局的AI程式在強化學習的路上取得了巨大的突破與成就。隨後2017年10月更提出了AlphaGo Zero方法,以100:0的比數戰勝了原本的AlphaGo Lee程式,也證明了不用人類的棋譜當作先驗知識,就可以訓練出比人類還要更強的圍棋程式。而DeepMind最終把AlphaGo Zero方法一般化成了AlphaZero方法,也訓練出了當今世界棋力最強的西洋棋與將棋程式。但相對的,DeepMind也運用了非常龐大的運算資源來訓練,才得到了最強的棋力。 本論文所研究的棋類為1970年楠本茂信所發明的5五將棋,5五將棋是一種將棋變體,特色是棋盤大小比本將棋還要小,只有5×5的盤面,將棋則有9×9,所以5五將棋是很適合一般人在硬體資源有限的情況下,來實作電腦對局的AI程式項目。 本實驗是使用AlphaZero的演算法,搭配AlphaZero General框架來實作出使用神經網路搭配強化學習來訓練的AI程式,而我們也搭配了一些已知的優勢策略做改良,讓我們可以在有限的硬體資源下,增進神經網路模型的訓練效率。 在5五將棋的訓練中,我們使用兩種方法去做改良,第一種方法是依盤面的重要性對樣本做採樣,設定中局會比終盤與開局還要高的採樣機率,期待能讓神經網路學習下中盤棋局時能比一般的版本下的更好。 第二種方式是用能贏直接贏的方式去訓練,藉由提前一回合看到終局盤面,來達到Winning Attack的效果,因為MCTS在下棋時,即便是遇到能分出勝負的走步,不一定會走出能分出勝負的那一步,導致神經網路權重會收斂的很慢,而藉由此方法,可以比一般的訓練方法還要快的收斂。 本研究所採用的兩個方法是一個成功一個失敗的結果,以實驗數據來說,如果取樣取的好,是有機會提升棋力的,但數據的表現上除了一組數據外,其他數據皆不盡理想;而Winning Attack的棋力提升的數據就非常顯著了,不過兩種方法搭配起來一起訓練時,雖然也會提升棋力,但是兩個方法沒有互相加成的效果。Item 基於強化學習之Surakarta棋程式開發與研究(2019) 陳毅泰; Chen, Yi-TaiSurakarta棋是起源於印尼爪哇島的一種雙人零和遊戲,原名Permainan,在印尼文是遊戲之意,後來由法國人命名為Surakarta,取自當地地名「梭羅」。遊戲中獨一無二的吃子方法是這種棋的最大亮點,透過棋盤外圍的環狀構造,將對手的棋子一網打盡後,方可獲得最後的勝利。 除了現實的遊戲外,Surakarta棋也是Computer Olympiad定期舉辦的比賽項目之一,歷年來誕生了不少棋力高強的程式。而這兩年的AlphaGo和AlphaZero將電腦對局推向了新的里程碑,也有了新的契機,希望能夠將Surakarta棋程式的棋力向上提升。 本研究將利用AlphaZero的架構,搭配不同的參數及架構上的改良,訓練及實做Surakarta棋的AI和視覺化平台。除了單一神經網路的版本,研究中也嘗試了一種新的多神經網路架構,將遊戲的過程分成三階段並訓練三種不同的神經網路來各司其職,分別為「開局網路」、「中局網路」和「殘局網路」。其中,使用殘局網路版本的AlphaZero算法和DTC殘局庫做了交叉驗證,顯示其正確率高達99%。Item 基於AlphaZero作法之國際跳棋程式開發及研究(2020) 簡沅亨; Chien, Yuan-Heng國際跳棋是由民族跳棋演變而來的。據說在一七二三年,居住在法國的一名波蘭軍官把六十四格的棋盤改為一百格,因此又被稱為「波蘭跳棋」。國際跳棋擁有flying king和連吃的特殊規則,使得下法有趣多變,深受大眾的喜愛。 近年來,AlphaZero演算法在多種棋類AI訓練上,都獲得極大的成功。因此,本研究使用AlphaZero的架構來實作國際跳棋的AI。然而,國際跳棋擁有連吃路徑的問題,無法以單次神經網路輸出來完整表達連吃的路徑,所以本研究設計連續走步,藉由神經網路的多次走步輸出來完整描述連吃的路徑。 為了提高國際跳棋AlphaZero的訓練效率,本研究使用大贏策略來加速訓練,讓神經網路能夠往大贏的方向去訓練。經過100迭代訓練之後,使用大贏策略訓練的神經網路模型與原始AlphaZero版本訓練的神經網路模型相比,擁有較高的勝率。Item 自動化演講錄製系統之虛擬導播子系統(2013) 呂佳儒在一場演講或節目的錄製過程中,導播的角色主要是能將節目的內容和精神忠實地傳達給觀眾,為了達成此目標,導播藉由從多部攝影機對場景所拍攝的影像中,挑選出適合且符合節目精神的畫面播出。一位好的導播,必須能夠掌握群眾的心理來挑選畫面並且在適當的時機做切換。然而這些能力的養成,需要經過長時間的訓練與經驗累積。為了節省人力訓練的成本,本研究提出一套能夠模擬真實導播運作方式的系統,稱之為「虛擬導播系統」。 本研究所提出的虛擬導播系統將具備下列的能力:分析攝影美學、光學、情節與動作連續性各方面資訊,對多個虛擬攝影師所傳來的畫面進行自動評估分析,再從其中挑選出適合的鏡頭。至於挑選畫面的方式,主要是藉著學習真實導播的操作手法而來。虛擬導播系統具有機器學習的能力,可以透過事先學得導播選鏡的技巧,以達到模擬真實導播的選鏡手法,使系統能更貼近真實的導播。 本系統於自動分析評估畫面時,使用FAST corner detection與optical flow estimation偵測攝影機的運鏡狀況;以及結合包含動態資訊的attention map與包含靜態資訊的static saliency map製作顯著圖像,用以估計主體所在的位置及大小;並且使用平均位移分群演算法(mean shift clustering),以區分出不同主體物等,根據上述等技術來實現對輸入影像進行攝影美學、光學、情節與動作連續性分析,並將評估所得的資訊輸入Counter Propagation Network (CPN)網路進行訓練。由於該網路屬於監督式學習模型,為求實驗客觀與可用性,我們邀請傳播相關科系並且具有擔任導播經驗的人員替訓練資料提供預期的輸出,使虛擬導播選擇的畫面方式能更貼近專業導播的選鏡手法,並透過不同的真實導播的訓練模式,進而訓練出可適應不同風格的選鏡效果。Item 改進AlphaZero的大贏策略並應用於黑白棋(2019) 張乃元; Chang, Nai-YuanDeepMind的AlphaZero演算法在電腦遊戲對局領域中取得了巨大的成功,在許多具有挑戰性的遊戲中都取得了超越人類的表現,但是我們認為AlphaZero演算法中仍然有可以改進的地方。 AlphaZero演算法只估計遊戲的輸贏或是平手,而忽略了最後可能會獲得多少分數。而在像是圍棋或是黑白棋這類的佔地型遊戲中,最後所得到的分數往往會相當大地左右遊戲的勝負,於是我們提出大贏策略:在AlphaZero演算法中加入對於分數的判斷,來改進演算法的效率。 在本研究中使用8路黑白棋作為實驗大贏策略效果的遊戲,我們使用並且修改網路上一個實作AlphaZero演算法的開源專案:alpha-zero-general來進行我們的實驗。經過我們的實驗之後,使用大贏策略的模型相比未使用的原始AlphaZero模型,在經過100個迭代的訓練之後有著高達78%的勝率,證明大贏策略對於AlphaZero演算法有著十分顯著的改進效益。Item 基於深度學習網路之農產品期貨價格預測模型(2019) 陳建瑋; Chen, Jian-Wei在財務金融領域當中,預測金融商品價格一直是個研究者以及產業界所感興趣的主題。其中國際大宗原物料價格變動對於仰賴進出口的台灣經濟體系影響甚鉅,大型企業營運更深受原物料價格起伏所干擾,必須經常性地採取避險手段,將非營運因素的干擾降低。為了解決此問題,本研究蒐集芝加哥期貨商品交易所(Chicago Mercantile Exchange, CME)之原物料期貨資料為樣本,在本研究中以黃豆期貨為例,訓練類神經網路模型解決價格預測之問題。 研究結果顯示,對於充斥雜訊的金融時間序列資料,使用降噪自編碼器可以從期貨價格資料中提取出更具有代表性的潛在特徵。此類特徵有助於提升類神經網路模型價格預測之表現。而透過集成式學習的方法,對於不同的時間區間建立模型並且使模型間共同進行決策,能夠提高方向性預測準確度以及價格預測表現,進一步改進模型效能。Item Item 深度學習用於愛因斯坦棋研發之初步探討(2017) 曹少剛; Tsao, Shao-Kang愛因斯坦棋,是於西元2004年由德國中部耶拿(Jena)鎮的一位數學教授—Ingo Althöfer所發明的兩人骰棋類遊戲。 在5x5的棋盤中放入雙方各六個棋子,雙方必須利用擲骰子的方式,來決定當前回合可以移動的棋子編號,透過各種不同的策略,減少我方或敵方的棋子,使我方比敵方優先達成勝利條件,以獲取勝利。雖然此遊戲的遊戲盤面尺寸、棋子數目較其他棋盤遊戲小、少,但是由於融入了骰子這個不確定的要素,大大地增加此遊戲的複雜度,同時也增加了耐玩性與挑戰性。 本研究將嘗試利用蒙地卡羅演算法、卷積式類神經網路的方法,嘗試使用、尋找各種不同的特徵,將這些特徵互相搭配以形成不同的feature map,藉此訓練類神經網路各個節點的參數(權重),期望新的方法可以達到、擁有,甚至是超越目前其他強力的愛因斯坦棋下棋程式的棋力。Item 透過使用者行為與廣告特性預測點擊率(2018) 黃家儀; Huang, Chia-Yi本論文研究廣告點擊預測方法,採用類神經網路架構為基礎,建立全體預測模型及分群預測模型,並比較採用四種不同類神經網路模型架構之預測效果。第一種架構是單屬性模型,以線性迴歸方法為基礎而建立的類神經網路模型架構;第二種架構是跨屬性模型,結合不同廣告欄位的屬性值,運用內積運算建立對應的特徵值;第三種架構是屬性權重因子分解機模型,為相關研究所提出的模型;第四種是FwFMs改良版模型,採用第三種模型的架構,但將部分參數固定採用跨欄位互信息值為權重值。本論文並對大量資料的資料分群提出兩種分割處理後再合併的分群方法,用來對測試資料選取適用的分群預測模型。第一種是雅卡爾相似分數群集法,第二種是餘弦相似分數群集法。實驗評估顯示,全體預測模型於FwFMs改良版模型架構,準確度可達76.40%。在分群預測模型中,採用四種類神經網路模型架構皆可提升準確度,最高可達76.58%。此外,採用餘弦相似分數群集法,能快速有效的對測試資料選取適當的分群預測模型。Item GRNN網路硬體之實現及在區域網路管理之應用(2016) 鍾育君; CHUNG, Yu-Chun區域網路已於一般人的生活中扮演了重要的地位,如何管理有限的網路資源,製造最大的使用效益,是一個困難的議題,根據不同的使用者習慣,以及應用,會需要各種不同的網路環境設定,如何快速且即時的反應是我們追求的目標。 由於使用者的回饋與反應,才是我們判定服務品質(Quality of Service)的重要指標,根據以往累積的使用者回饋,本論文設定一品質標準,並結合GRNN(Generalized Regression Neural Networks)類神經網路學習法則,快速且精準的計算使用者會感到滿意的網路環境設定,並從所有可能感到滿意的設定中,找出消耗網路資源最少的設定,提供給使用者, 利用軟體實現網路環境設定之頻寬分配計算,建構於一般的網路橋接器環境,將會耗費相當大量的反應時間,使用者的體驗感受將會大幅度下降,所以本論文欲以VLSI晶片設計,設計出效能強大,且快速精準的分配網路環境設定,計算法則也是不可或缺的一環,故結合GRNN類神經網路學習法則,以硬體電路晶片實現處理單元,便可達成這一目的。