資訊工程學系

Permanent URI for this communityhttp://rportal.lib.ntnu.edu.tw/handle/20.500.12235/60

本系前身「資訊教育學系」成立於民國七十四年,首先招收大學部學生,民國九十年成立資訊工程研究所碩士班,而後於民國九十五年進行系、所調整合併為「資訊工程學系」;並於九十六年成立博士班。本系目前每年約招收大學部四十餘人,碩士班六十餘人,博士班約五人,截至民國一百零四年十一月止,總計現有大學部一百九十多人,碩士班一百二十多人,博士班二十三人,合計學生人數約為三百三十多位。

News

Browse

Search Results

Now showing 1 - 3 of 3
  • Item
    強化學習與遷移學習應用於六貫棋遊戲
    (2023) 偕為昭; Jie, Wei-Zhao
    六貫棋是一款雙人對局遊戲,起初在1942年於丹麥的報紙中出現,被稱為Polygon。1948年時,被美國數學家John Forbes Nash Jr.重新獨立發明,並稱為Nash。最後在1952年由製造商Parker Brothers發行,且將其命名為Hex。在此遊戲中,上下及左右的對邊各以一個顏色表示,雙方玩家需要在棋盤上落子並將自己顏色的對邊連接以取得勝利。此遊戲為零和遊戲,且不會有平手的情況發生。在以前的研究中,六貫棋在9路以下的盤面已經被破解。由於AlphaZero的問世,現今電腦對局遊戲的程式有更進一步的發展,以該方法研發的對局程式都有不錯的棋力。而在六貫棋遊戲中,不得不提由加拿大Alberta大學研發的Mohex程式,該程式一直都在競賽中得到優異的成績,至今也持續進行改良。本研究試圖以AlphaZero的訓練框架進行強化學習,並以Mohex破解的盤面資料為輔助。在訓練大盤面的模型時需要較多的成本,因此嘗試結合遷移學習的方式,運用已經破解的小盤面資料,使初期的自我對下階段就能產生較好的棋譜,而不是從完全的零知識開始訓練,藉此提升大盤面模型的訓練成果。並且比較在進行遷移學習時,使用不同參數轉移方法的影響。
  • Item
    基於深度強化學習之室內空氣品質控制系統研究
    (2023) 余榮泰; Yu, Rong-Tai
    近年來世界各地飽受新冠肺炎的侵擾,許多政府為了防止病毒的擴散頒布了一系列措施以降低傳染病毒的風險,但是有些措施在一些場合無法完全的實施,如於學校中保持安全距離、在餐廳中配戴口罩等等,因此本研究嘗試以不干預人們行為的方式降低感染病毒的風險以及保持空間內的舒適和省電的條件下建立一套自動控制室內空氣品質的系統。該系統稱之為室內空氣品質自動控制系統(Indoor Air Quality Auto Control, IAQAC),藉由深度強化學習(Deep Reinforcement Learning)技術使系統能夠自行找出對該空間最佳的策略以保持舒適、低感染風險、省電的效果;另外研究中使用了遷移學習先後在模擬環境和現實環境中訓練以降低過多的時間成本;最後搭建了一套自動收集資料、控制設備的系統以提供必要的資訊和執行系統決策的動作。
  • Item
    以有限配對資料訓練事實問題生成模型之研究
    (2020) 蕭雅方; Hsiao, Ya-Fang
    本論文考慮在閱讀文句與對應問題的配對資料有限情況下,透過遷移式學習概念,利用未配對的資料增強編碼器-解碼器架構模型的學習效果,使模型仍能生成相當於輸入大量配對資料訓練後的生成效果。本研究採用序列對序列模型,先以非監督式學習方式,利用大量無需經過標記的文句和問題,訓練自動編碼器架構。接著,擷取出預訓練好能理解文句的編碼器及生成問題的解碼器進行組合,並對編碼器加入轉移層建構出新的模型,再以遷移式學習選用文句與問題配對訓練微調模型參數。實驗結果顯示,採用本論文設計的遷移式學習方式,並配合訓練策略,在減少一半文句與問題配對資料的訓練,仍比直接採用全部配對訓練資料進行訓練得到的問題生成模型有更佳效果。