資訊工程學系
Permanent URI for this communityhttp://rportal.lib.ntnu.edu.tw/handle/20.500.12235/60
本系前身「資訊教育學系」成立於民國七十四年,首先招收大學部學生,民國九十年成立資訊工程研究所碩士班,而後於民國九十五年進行系、所調整合併為「資訊工程學系」;並於九十六年成立博士班。本系目前每年約招收大學部四十餘人,碩士班六十餘人,博士班約五人,截至民國一百零四年十一月止,總計現有大學部一百九十多人,碩士班一百二十多人,博士班二十三人,合計學生人數約為三百三十多位。
News
Browse
3 results
Search Results
Item 使用KataGo方法及迫著空間搜尋提升AlphaZero在六子棋的訓練成效(2023) 林育璋; Lin, Yu-Chang自從Google DeepMind提出AlphaZero演算法之後,許多使用傳統搜尋法的電腦對局程式都被AlphaZero作法取代。然而AlphaZero作法需要非常大量的算力,才能夠達到頂尖的水準,因此我們希望透過程式效能改進及傳統做法的輔助,提升AlphaZero在六子棋遊戲的訓練效率,讓我們可以使用個人電腦達到頂尖水準。本篇論文使用Alpha-Zero-General開源程式碼作為基礎,研發一支AlphaZero的六子棋程式。我們參考galvanise_zero的做法修改MCTS的搜尋方式、參考OOGiveMeFive提出的通用型Bitboard,將其進行修改後用於六子棋程式中,並且參考陽明交通大學的CZF_Connect6提出的六子棋強度改進方式。本篇論文從三個面向來加速AlphaZero的訓練效率。第一個是提升程式效能,我們分析Alpha-Zero-General的一個效能瓶頸是MCTS的部分,因此透過C++及平行化的方式重新實作MCTS,大幅提升AlphaZero的訓練效率。第二個是提升神經網路的性能,使用KataGo提出的Global Pooling及Auxiliary Policy Targets方法修改神經網路,並套用於六子棋程式中。第三個是提升訓練資料的品質,使用KataGo提出的Forced Playout and Policy Target Pruning方法及傳統的迫著空間搜尋提升訓練資料的品質。另外本篇論文提出一種新的訓練方式,提升AlphaZero加入heuristics的訓練效果。我們使用C++、平行化及批次預測的方式可以讓MCTS的搜尋效率達到26.4的加速比,並且使用Bitboard的方式可以讓迫著空間搜尋達到6.03的加速比。在短時間的訓練中,雖然使用相同時間AlphaZero方法可以訓練更多個迭代,不過使用相同時間訓練的KataGo方法與原始AlphaZero方法相比依然可以取得57.58%的勝率,且使用相同時間訓練的KataGo-TSS Hybrids方法與原始AlphaZero方法相比也可以取得70%的勝率。並且這三種作法訓練到500個迭代後與NCTU6_Level3對戰,都可以取得超過65%的勝率。Item 六子棋之棋型分類及審局函數之研究(2011) 陳志宏; Chih-Hung Chen六子棋是吳毅成教授所提出的一系列K子棋當中的一種,又稱連六棋(Connect6),是具備「規則簡單」、「變化複雜」、「遊戲公平」等特性的棋類遊戲。本研究以賴昱臣設計的六子棋程式Ant,作為基礎程式進行改良。經過棋型分類、審局函數與迫著搜尋系統的修改,使得勝率及和率明顯提升、敗率明顯降低。實驗顯示,本研究方法確實可大幅提升Ant程式的棋力。 經過修改後的Ant版本,於TAAI 2010獲得第二名的成績,而在TCGA 2011得到第三名的名次。Item 結合單迫著與雙迫著搜尋之六子棋程式之研發(2010) 賴昱臣; Lai, Yu-Chen六子棋(Connnect6),又名連六棋,為國立交通大學資訊工程系吳毅成教授於第十一屆國際電腦賽局研討會(11th Advances in Computer Games Conference,ACG11)中提出和發展。六子棋的提出是有鑑於五子棋(Go-Moku)和連珠棋(Renju)在幾經改善後仍無法完全消除先手方的優勢而提出的另一種較公平的棋類。 2007年,由劉思源及顏士淨博士設計的六子棋程式「X6」,主要使用雙迫著搜尋,在ICGA(International Computer Games Association)六子棋競賽中取得金牌,顯示出迫著搜尋對棋力影響的強度;2007年及2009年,由Theo van der Storm先生所設計的六子棋程式「MeinStein」,使用淺層的alpha-beta search取得兩面銀牌,可見其審局函數之準確性。 不同於雙迫著搜尋的單迫著搜尋,在實作上難以兼顧成功率、準確性與誤判風險。本論文利用「MeinStein」開放原始碼中之其審局函數來提升單迫著搜尋在成功率、準確性、誤判風險之間的平衡。由此我們所研發出來的程式已能在實戰時較X6與MeinStein更強。