Browsing by Author "陳宥儒"

Now showing 1 - 1 of 1

基於馬可夫決策過程之路徑規劃演算法用於複雜動態環境
(2023) 陳宥儒; Chen, Yu-Ju
本論文提出了一種基於馬可夫決策過程的機器人路徑規劃演算法。首先，需要將目標點設為一個正的獎勵訊號。其次，代理人每走一格就會有一個負的獎勵訊號。代理人必須最大化其長期累積的總獎勵，這也是代理人的唯一目標。利用根據能夠將長期獎勵最大化所得到的策略來決定機器人行走路徑。最後，將每個位置所得到的策略串聯來，就得到一條最佳路徑。此外，本篇論文透過設計馬可夫決策過程中的價值函數，使得規劃出來的路徑能與牆壁與移動障礙物保持一定的安全距離。最後，在本論文模擬中，代理人在產生第一條路徑之後，因應環境變化產生其他路徑相當迅速，且會主動閃避移動障礙物 ;而在實驗的部分，使用了搭載機器人作業系統 (Robot Operating System,ROS)的雙輪差動機器人在有移動的障礙物和移動的人時，皆能有效的產生閃避障礙物之路徑。此路徑規劃演算法是由馬可夫決策過程發展而成，也是現代機器學習的基石。有別於傳統的路徑規劃演算法，像是 Dijkstra、 A*、 D*之類的演算這些演算法無法在複雜動態環境有良好表現甚至無法適用於動態環境，本篇論文所提出的基於馬可夫決策過程路徑規劃演算法是以計算全域地圖上各點的獎勵訊號來決定路徑，在每個時刻、每一個點都會有一個預期回報的期望值，所以在動態變化較大的環境中可以比較即時的更改路徑因此其在動態環境的效率較佳。