學位論文
Permanent URI for this collectionhttp://rportal.lib.ntnu.edu.tw/handle/20.500.12235/73912
Browse
5 results
Search Results
Item 結合 Focal Loss 之 CenterNet 於數位彎曲感測器手勢辨識中的類別不平衡對策研究(2025) 許玳維; Hsu, Tai-Wei在Open-set場景中的手勢辨識應用中,背景資料往往具有數量龐大與高度變異的特性,對模型造成前景辨識上的挑戰。然而,在本研究所使用的數位彎曲感測器中,資料主要反映手指的彎曲與否,背景樣本雖然數量龐大,但變異度相對有限。基於此特性,本研究的問題核心轉為在樣本極度不平衡的情況下,有效抑制背景類別對模型學習造成的主導效應。為解決此問題,本研究提出一套結合 Focal Loss 與 CenterNet 概念的手勢辨識方法,並採用 Sliding Window 技術進行資料切分與時間特徵擷取。Focal Loss 能提升模型對少數前景手勢的關注度,提升前景手勢的學習效果,同時降低背景樣本的干擾。配合以手勢中心時間點為標註依據的設計,強化模型對手勢發生時機的掌握能力。在推論階段,系統設計雙門檻判斷機制進行手勢偵測,並以編輯距離衡量連續手勢序列的整體預測準確度。實驗結果顯示,本研究提出的方法可於高比例背景樣本的資料情境下穩定辨識各類前景手勢,並於連續手勢序列辨識任務中優於傳統交叉熵法,展現出在類別不平衡下的實用性與穩健性。Item 利用硬體加速器在RISC-V平台實現智慧手勢識別之研究(2024) 田敬瑄; Tien, Ching-Hsuan隨著手勢辨識技術在多媒體娛樂和智慧家電控制等領域的廣泛應用,隱私保護和低延遲推論速度已成為提升用戶體驗的關鍵因素。邊緣計算,由於其能在本地設備上即時處理數據,強化了數據的隱私保護並顯著減少數據傳輸和處理的延時,因而被重視。本研究開發的智慧手套手勢辨識系統採用開源的RISC-V指令集架構SoC,並在FPGA平台上實現了低成本及高效能的部署。透過整合Gemmini硬體加速器,本系統顯著提升了邊緣設備的計算效能及模型的推論速度。實驗結果顯示,配備硬體加速器的SoC相較於未搭載加速器的SoC,推論速度提升達55倍,同時維持了手勢識別的高準確度。該邊緣系統的實施不僅確保了用戶數據的安全,也通過硬體加速器顯著降低了推論時間,進一步提升了用戶體驗。本研究證明了開源技術和硬體加速器在邊緣計算領域的有效性,為未來智慧裝置的技術進步提供了一個經濟且高效的解決方案。Item 基於CornerNet利用加速度計及陀螺儀達成偵測及辨識手勢之研究(2021) 陳胤霖; Chen, Yin-Lin隨著時代變遷,人工智慧也有著長足的進步,其中一項研究主題便是手勢辨識,手勢辨識根據使用資料,可分為依影像資料為主和依感測器資料為主,而本論文使用的資料為感測器資料。以往以感測器資料為主的手勢辨識研究中,模型無法自動分離手勢資料與背景資料,需要使用人工方式擷取手勢資料,在實際運用時會降低使用者的體驗感,所以本論文提出了一個解決方法,並設計一個模型使其能自動分離手勢與背景,並將手勢分類。本論文參考了影像辨識中將物件視為關鍵點的概念,將手勢分為兩個關鍵區間,透過偵測並配對這兩個關鍵區間,以達到自動偵測並分類手勢的效果。Item Item 基於 Kinect 之台灣手語單字辨識(2013) 蕭怡涵手勢辨識一直被應用於人機互動介面相關的研究,而手語更是其中當熱門的研究之一。 以影像方法為基礎的單字手語辨識發展已有一段時間,並都獲得不錯的辨識結果,但仍有其限制及問題,故近期開始研究加入深度資訊來協助辨識。 然而,市面上的深度攝影機通常價格不斐或配戴不易,而微軟公司於2010年推出的 Kinect控制器則提供了新的選擇。因此本論文提出了一個以Kinect為基礎,可即時辨識台灣手語單字的方法。 手語中的手勢由位置、方向及形狀三個主要部分組成,我們利用Kinect本身的骨架追蹤及提供的深度資訊,對應不同部分的特性分別擷取如軌跡特徵及手型特徵,且利用不同方法來辨識。最後利用上述三個主要部分的辨識結果,並透過本論文所設計的單字決策方法,來達到最後辨識手語單字的目的。