理學院

Permanent URI for this communityhttp://rportal.lib.ntnu.edu.tw/handle/20.500.12235/3

學院概況

理學院設有數學系、物理學系、化學系、生命科學系、地球科學系、資訊工程學系6個系(均含學士、碩士及博士課程),及科學教育研究所、環境教育研究所、光電科技研究所及海洋環境科技就所4個獨立研究所,另設有生物多樣性國際研究生博士學位學程。全學院專任教師約180人,陣容十分堅強,無論師資、學術長現、社會貢獻與影響力均居全國之首。

特色

理學院位在國立臺灣師範大學分部校區內,座落於臺北市公館,佔地約10公頃,是個小而美的校園,內含國際會議廳、圖書館、實驗室、天文臺等完善設施。

理學院創院已逾六十年,在此堅固基礎上,理學院不僅在基礎科學上有豐碩的表現,更在臺灣許多研究中獨占鰲頭,曾孕育出五位中研院院士。近年來,更致力於跨領域研究,並在應用科技上加強與業界合作,院內教師每年均取得多項專利,所開發之商品廣泛應用於醫、藥、化妝品、食品加工業、農業、環保、資訊、教育產業及日常生活中。

在科學教育研究上,臺灣師大理學院之排名更高居世界第一,此外更有獨步全臺的科學教育中心,該中心就中學科學課程、科學教與學等方面從事研究與推廣服務;是全國人力最充足,設備最完善,具有良好服務品質的中心。

在理學院紮實、多元的研究基礎下,學生可依其性向、興趣做出寬廣之選擇,無論對其未來進入學術研究領域、教育界或工業界工作,均是絕佳選擇。

Browse

Search Results

Now showing 1 - 5 of 5
  • Item
    利用AlphaZero框架實作與改良MiniShogi程式
    (2020) 陳品源; Chen, Pin-Yuan
    2016年3月,DeepMind的AlphaGo程式以4:1的結果擊敗了當時韓國職業圍棋9段棋士李世乭,讓電腦對局的AI程式在強化學習的路上取得了巨大的突破與成就。隨後2017年10月更提出了AlphaGo Zero方法,以100:0的比數戰勝了原本的AlphaGo Lee程式,也證明了不用人類的棋譜當作先驗知識,就可以訓練出比人類還要更強的圍棋程式。而DeepMind最終把AlphaGo Zero方法一般化成了AlphaZero方法,也訓練出了當今世界棋力最強的西洋棋與將棋程式。但相對的,DeepMind也運用了非常龐大的運算資源來訓練,才得到了最強的棋力。 本論文所研究的棋類為1970年楠本茂信所發明的5五將棋,5五將棋是一種將棋變體,特色是棋盤大小比本將棋還要小,只有5×5的盤面,將棋則有9×9,所以5五將棋是很適合一般人在硬體資源有限的情況下,來實作電腦對局的AI程式項目。 本實驗是使用AlphaZero的演算法,搭配AlphaZero General框架來實作出使用神經網路搭配強化學習來訓練的AI程式,而我們也搭配了一些已知的優勢策略做改良,讓我們可以在有限的硬體資源下,增進神經網路模型的訓練效率。 在5五將棋的訓練中,我們使用兩種方法去做改良,第一種方法是依盤面的重要性對樣本做採樣,設定中局會比終盤與開局還要高的採樣機率,期待能讓神經網路學習下中盤棋局時能比一般的版本下的更好。 第二種方式是用能贏直接贏的方式去訓練,藉由提前一回合看到終局盤面,來達到Winning Attack的效果,因為MCTS在下棋時,即便是遇到能分出勝負的走步,不一定會走出能分出勝負的那一步,導致神經網路權重會收斂的很慢,而藉由此方法,可以比一般的訓練方法還要快的收斂。 本研究所採用的兩個方法是一個成功一個失敗的結果,以實驗數據來說,如果取樣取的好,是有機會提升棋力的,但數據的表現上除了一組數據外,其他數據皆不盡理想;而Winning Attack的棋力提升的數據就非常顯著了,不過兩種方法搭配起來一起訓練時,雖然也會提升棋力,但是兩個方法沒有互相加成的效果。
  • Item
    基於強化學習之Surakarta棋程式開發與研究
    (2019) 陳毅泰; Chen, Yi-Tai
    Surakarta棋是起源於印尼爪哇島的一種雙人零和遊戲,原名Permainan,在印尼文是遊戲之意,後來由法國人命名為Surakarta,取自當地地名「梭羅」。遊戲中獨一無二的吃子方法是這種棋的最大亮點,透過棋盤外圍的環狀構造,將對手的棋子一網打盡後,方可獲得最後的勝利。 除了現實的遊戲外,Surakarta棋也是Computer Olympiad定期舉辦的比賽項目之一,歷年來誕生了不少棋力高強的程式。而這兩年的AlphaGo和AlphaZero將電腦對局推向了新的里程碑,也有了新的契機,希望能夠將Surakarta棋程式的棋力向上提升。 本研究將利用AlphaZero的架構,搭配不同的參數及架構上的改良,訓練及實做Surakarta棋的AI和視覺化平台。除了單一神經網路的版本,研究中也嘗試了一種新的多神經網路架構,將遊戲的過程分成三階段並訓練三種不同的神經網路來各司其職,分別為「開局網路」、「中局網路」和「殘局網路」。其中,使用殘局網路版本的AlphaZero算法和DTC殘局庫做了交叉驗證,顯示其正確率高達99%。
  • Item
    增強學習架構與期望最小最大算法之愛因斯坦棋實作比較
    (2019) 林品儒; Lin, Pin-Ru
      愛因斯坦棋英文原名EinStein würfelt nicht!,在2004年由德國一位數學教授Ingo Althöfer所發明。這是一個包含擲骰子的機率性遊戲,走步會由骰子點數而有很大的影響。也因此要如何從被動地受到骰子點數而影響走步,變為主動影響棋子的分佈來控制骰子的機率就是一大學問。   本研究主要是將此種遊戲中的兩種不同架構進行比較:其一為使用增強學習架構,利用自我對下產生棋譜之後對類神經網路進行訓練,以增加蒙地卡羅樹節點展開以及盤面分數評估的精準度;另一個則是使用傳統的期望最小最大算法(expectiminimax)並且搭配各種剪枝手段降低搜索時間,並且在節點最後以人類經驗法則賦值的方式給予盤面分數。在使用兩種不同實作的情況之下,以自動化平台的方式來進行對弈的實驗。同時,此研究也透過提升處理器頻率提升兩者單位時間內運算量,也減少了類神經網路產生棋譜所需要的時間。   此次使用的增強學習架構為使用開放原始碼的專案進行改良,使用直譯式的Python語言;而期望最小最大算法的實作則是從無到有自行開發的程式,使用的是Crystal語言,能夠編譯成原生的x86機器碼執行。如此兩相比較的實驗可以視為新舊技術的對抗,使用新工具來實作傳統演算法是不是還有奮力一搏的機會?期待未來設備升級之後能兩者都能有改進的機會。
  • Item
    中國跳棋對局程式研發與深度學習之探討
    (2019) 陳俊豪; Chern, Jiunn-Haur
    中國跳棋遊戲是家喻戶曉的棋盤遊戲,但針對提升電腦對局棋力的研究並不多,過去以蒙地卡羅樹搜索法作為兩人中國跳棋AI的主要演算法,已經能表現出一定的棋力,但還是有改進的空間。中國跳棋的遊戲目標在於將己方的所有棋子前進至目的地,除了要使棋子能夠快速前進外,也要在適當的時機後退,取得攻防之間的平衡。 本研究針對兩人中國跳棋遊戲的AI做改良,加入深度學習的做法,主體採用 AlphaZero 的框架來訓練類神經網路。為了在有限的硬體資源及時間下取得效果,嘗試加入針對遊戲特性的改進。先使用蒙地卡羅樹搜索法搭配隨機模擬,產生多種開局的棋譜作為預先訓練模組的訓練資料,再用此模組做後續自我對弈的學習,可避免一開始脆弱的神經網路無法結束遊戲。遊戲後期則使用單人遊戲的搜索法,以改善後期已知必勝或必敗盤面時,不會挑選最佳走步的問題。
  • Item
    電腦五子棋程式JacksonFive之設計與實作
    (2018) 陳羽恆; Chen, Yu-Heng
    五子棋(Gomoku)是個歷史悠久的棋類遊戲,規則簡單但遊戲複雜度相當高,非常具有研究價值。其中比較常見的搜尋演算法有MiniMax、Alpha Beta Pruning、Iterative Deepening及Monte Carlo Tree Search(MCTS)等等。在這些演算法的實作細節中,存在著一些可以改進搜尋效率或精準度的地方。包括MCTS中的expansion階段可以利用米字型遮罩來減少搜尋廣度、simulation階段加上深度加權的調整,使得不同模擬深度有不同的分數。 在最傳統的MCTS算法中,也存在著一些尚待解決的問題。例如贏率稀釋問題,最優走步的贏率會被其他分支稀釋掉,因此分支愈多的子樹會被稀釋得更嚴重,因此,本論文提出了兩種解決稀釋問題的方法。 MCTS也存在一個缺點,就是不管盤面為何,都要經過固定的搜尋時間、或是一定的模擬次數才會決定走步。因此,本論文提出了一套時間控管機制,可以針對不同的盤面情況,給予不同的MCTS搜尋時間。 透過種種的改良,我所撰寫的程式JacksonFive也參加過數次的電腦對局比賽的外五棋項目,其中在TCGA 2015拿到銅牌、ICGA 2016拿到銅牌、TAAI 2017拿到銅牌、TCGA 2017拿到銀牌、ICGA 2018拿到金牌。另外,本論文的部份成果已發表在The 10th International Conference on Computers and Games (CG 2018)的一篇論文中。