學位論文
Permanent URI for this collectionhttp://rportal.lib.ntnu.edu.tw/handle/20.500.12235/73890
Browse
15 results
Search Results
Item 用於光學同調斷層掃描之基於深度學習和聯邦學習框架之視網膜積液分割技術(2024) 林志韋; Lin, Chih-Wei在眼科領域,光學相干斷層掃描(OCT)是檢測眼病的關鍵技術。偏鄉資源有限僅能使用輕量化設備,但其計算能力不足,難以支撐較為大型模型的訓練,以及數據缺乏和隱私問題阻礙醫院數據共享。首先針對輕量化設備,基於LEDNet設計了高效的LEDNet(α)模型,通過調整通道、添加Shuffle Attention模塊和Group Normalization。使用成本低廉的樹莓派5進行訓練,適合偏鄉需求,為解決隱私問題,引入聯邦學習,通過上傳本地模型參數聚合全局模型,避免資料直接上傳。本研究提出Krum(α)算法,在客戶端損失函數中添加近端項並考慮模型自適應性,改善淘汰機制,改進基於歐氏距離淘汰惡意模型的Krum算法。最後實驗結果顯示,在AROI、DUKE、UMN和RETOUCH數據集上,AROI積液類別提高了3.4%,DUKE提高了5.9%,UMN提高了2.4%,RETOUCH提高了1.4%。Item 基於臉部及語音特徵之輕量化深度學習情感辨識系統(2024) 呂健維; Lu, Chien-Wei因應近年來高齡化導致老人照護人力缺乏,本研究提出了一種可被應用於陪伴型機器人(Zenbo Junior II)上的整合臉部表情和語音的情感識別輕量化模型。近年來對於人類的情感識別技術大多使用基於卷積神經網路(Convolutional Neural Network, CNN)的方式來實現,並得到了優秀的成果,然而,這些先進的技術都沒有考慮計算成本的問題,導致這些技術在計算能力有限的設備上無法運行(例如,陪伴型機器人)。因此,本研究將輕量化的GhostNet模型,應用於臉部情感識別的模型,並將輕量化的一維卷積神經網路(One Dimensional Convolutional Neural Network, 1D-CNN)作為語音情感識別模型,再利用幾何平均數的方式將兩個模態預測的結果整合。所提出的模型,在RAVDESS和CREMA-D兩個數據集上分別取得了97.56%及82.33%的準確率,在確保了高準確率的情況下,本研究將參數量壓縮到了0.92M,浮點運算次數減少至0.77G,比起目前已知的先進技術要少了數十倍。最後,將本研究的模型實際部署在Zenbo Junior II中,並透過模型與硬體的運算強度作比較,得知本研究的模型能夠更加順利的在該硬體中運行,且臉部及語音情感識別模型的推理時間分別只有1500毫秒及12毫秒。Item 用於陪伴型機器人之輕量化深度學習音樂情緒辨識模型(2024) 林彥榕; Lin, Yen-Jung為了應對現今社會高齡化,導致老人缺乏陪伴導致的孤獨問題,本研究提出用於陪伴型機器人Zenbo Junior II的音樂情緒辨識模型來解決老人孤獨導致的情緒問題。在音樂情緒辨識這個研究領域中,雖然也有很多人已經在進行這項研究,但是這些研究中沒有能用於Zenbo Junior II的輕量化架構。本研究提出的方法是使用一維卷機神經網路(1D-Convolutional Neural Network, 1D-CNN)替換掉常用的2D-CNN並且使用閘門循環單元(Gated Recurrent Unit, GRU)使模型能更好的考慮音頻特徵的連續性。在訓練完模型後儲存並應用於Zenbo Junior II上,先將另一研究的情緒對應成4種情緒後播放音樂調適情緒。本研究提出之模型在PMEmo數據集上Valence和Arousal分別為0.04和0.038與其他模型相比效能最好。並且參數量僅有0.721M浮點運算次數僅有9.303M,遠小於其他相比較之模型。運算強度最靠近Zenbo Junior II之最佳工作點,且模型辨識音樂所需推理時間僅需229毫秒,可以即時辨識出音樂的情緒。這些表明本研究成功提出一個輕量化且效能優異,並且可以在Zenbo Junior II上運行的模型。Item 用於光學相干斷層掃描之基於深度學習和聯邦學習框架之視網膜層分割技術(2024) 張博翔; Chang, Po Hsiang在本研究中,我們提出了一種輕量級模型FPENet(α),以FPENet為基底,用於處理專為邊緣設備設計的 OCT 影像中視網膜層分割。視網膜層分割是眼科診斷的重要工具,但其在資源有限的邊緣設備上應用時存在計算成本和精度之間的瓶頸。FedLion(α)在使用 HCMS資料集、NR206資料集及OCT5K資料集進行訓練和測試時,實現了高精度和高效率。該模型經過最佳化,實現了精度和計算成本之間的平衡。FPENet(α)可以有效地捕捉不同尺度的特徵,同時大幅降低計算成本,非常適合部署在如Raspberry Pi等資源有限的邊緣設備上,其輕量化設計使其在計算資源和內存容量方面具有顯著優勢。聯邦學習的部分我們以FedLion為基礎添加了L2正則化與學習率遞減,提出FedLion(α),有效處理數據非獨立同分布的問題。數據顯示使用FPENet(α)與FedLion(α)進行聯邦學習,相較於原先只使用FPENet(α),在HCMS資料集平均DICE係數提升了0.7%,在NR206資料集提升了3.75%,在OCT5K資料集提升了9.1%。Item 基於深度學習之光流法應用於全天空影像之日射量估計與預測(2023) 陳家豪; Chen, Chia-Hao因應太陽能發電日益重要,又因太陽能發電量受制於日射量的影響,同時考量太陽能發電是間歇性的能源,故提出一種基於深度學習光流應用於全天空影像之日射量估計與預測的方法。由於日射量變化容易受到天氣狀況影響,本文藉由全天空影像,建立一個以影像特徵為基礎之日射量估計與預測系統,其影像特徵包括,利用紅藍比例法計算影像中雲層比例、雲層厚度,及藉太陽位置演算法得到影像中太陽位置,分析太陽附近雲層特徵,萃取全域與局部的雲層權重。同時用基於深度學習的光流法推算雲層移動的狀態,並製作未來數分鐘之天空預測圖像,將這些預測圖像作長短期記憶(LSTM)之輸入特徵,日射量作為訓練輸出,其深度學習光流法是透過卷積神經網路來實現。本文將資料集區分為月、季、半年與一年,分別進行10分鐘至60分鐘的日射量預測。同時,本文使用多個效能指標評估效果,包括平均絕對誤差(Mean Absolute Error)、均方根誤差(Root Mean Square Error)與判定係數(R^2)。最後,與文獻的方法進行比較,本文所提的方法具有較好的結果。Item 基於非監督式生成對抗網路及對比學習之水下影像品質回復(2023) 宋奕泓; Sung, Yi-Hung近年來水下環境之相關應用的重要性與日俱增,比如:水下資源探勘及水下環境監控。這些應用往往需要由水下無人載具來擷取水下數位影像資料以供後續之資料分析及其相關應用 (例如:水下物件偵測及水下影像分類等相關應用)。然而水下影像品質受到許多環境因素影響而造成影像退化,包括光線折射、反射等等,如此可能使得基於水下影像之相關應用無法得到良好的效果。近年來,隨著深度學習技術蓬勃發展,研究者提出許多基於深度學習的模型來改善水下影像的品質。目前現有方法中,以具備成對影像資料之監督式深度學習模型為主。成對影像學習雖然能以較輕量模型得到好的影像品質回復效果,但礙於現實難以取得成對的原始水下影像及其還原之陸上影像,因此模型訓練上受到許多限制。為了解決這個限制,許多研究以人工合成之影像來建立成對之訓練影像資料集。然而,人工合成之訓練影像資料集未必能反映真實的水下影像特性。為了解決此問題,最近已有研究提出使用生成對抗網路及非成對影像資料來進行深度學習網路訓練。本論文提出一基於非成對影像資料及生成對抗網路之深度學習模型,來處理水下影像回復的問題。本論文提出基於非成對訓練影像資料集及利用生成對抗網路架構訓練一影像領域轉換生成器將輸入之水下影像轉換為對應之陸上影像 (回復之水下影像),其中我們利用對比學習及多樣損失函數來進行網路訓練。實驗結果已證實我們的方法可得到較佳的回復影像品質且優於 (或近似) 現有基於成對/非成對訓練資料之基於深度學習之水下影像回復網路。Item 結合雙AI晶片與熱成像溫測模組之自動目標搜索與溫度量測系統(2022) 沈方靖; Shen, Fang-Jing本論文提出一種自動搜索目標系統,使用雙人工智慧邊緣型運算處理器結合紅外線熱成像感測器,並透過步控制進馬達來實現自動搜索目標且掃瞄範圍擴增的人體溫度測量設備。本文首先回顧深度學習及類神經網路對於影像辨識的起源以及其應用性,並探討邊緣型處理器對於人形偵測的可行性,再根據此基礎發想出測量人體溫度之應用。而後介紹本論文主要系統架構及硬體設備,使用Mipy深度學習AI開發板配合多種感測裝置,來達成AI目標辨識及環境訊息的測量。本系統架構建立於模型本身的可靠性,針對模型訓練的部分有加強描述:從目標圖片的選取及拍攝、訓練過程的流程改善及參數調整、及最後模型在實驗環境的誤判修正。接著將訓練好的模型載入雙Mipy深度學習AI開發板,並制定一套演算法,協調各微處理器間的交互關係,達成快速掃描且穩定測溫的功能。最後針對多個實際場景,驗證本論文所描述之目標以及該架構反應速度與正確性。Item 疊代推進生成對抗網路用於陰影去除(2022) 吳建霖; Wu, Chien-Lin隨著科技的高速發展,深度學習在工業、軍事、民生科技處處都有大量的應用,現今運用在影像處理上的深度學習技術不斷進步,影像的去除如影像除霧、去反光、去陰影等都是電腦視覺領域中具挑戰性的任務。本論文研究目的為針對影像陰影去除提出了迭代推進生成對抗網路,首先我們輸入陰影圖藉由兩個生成器網路分別生成出無陰影的圖及殘差陰影圖,將兩者合成得到陰影圖,與輸入進行比對,最後將合成的圖再次輸入至網路重複上述步驟直到收斂,透過迭代推進的方式提升陰影移除的效果。此外為了使結果更加優異,我們的生成器網路加入了注意力機制,讓模型更專注於影子的部分,以及長短期記憶,使我們在長序列訓練過程中有更好的表現,最後是修復網路,以進一步改善生成的結果。我們與傳統方法以及近年來基於深度學習所提出的陰影去除方法比較,實驗結果表明本論文所提出的迭代推進方法有更優異的結果。Item 高性能之輕量級卷積神經網路之設計(2021) 周世耀; Jou, Shyh-Yaw因深度學習強大的分析能力,其時常被用做影像辨識與物件偵測的工具。時至今日,已有許多基於深度學習方法的著名模型被提出,例如:SENet、EfficientNet、Densenet、MobileNet、ResNet、ShuffleNet、GhostNet、Yolo等。深度學習模型的性能主要可從4個層面進行探討,分別是參數量,資料分析能力、處理資料的速度以及模型的泛用能力。一般而言,模型能在上述4個層面都表現優秀是很困難的。在本論文中,我們設計出一各性能皆優秀的深度學習模型―ExquisiteNetV2。我們選用了15個具公信力的影像辨識資料集以及1個物件偵測資料集進行實驗,並以上述提到的著名模型做為比較對象。我們分別使用兩種不同的權重更新法做實驗,根據實驗結果,無論使用何種權重更新法,在超過一半以上的資料集中,ExquisiteNetV2的分類正確率都是第一名。ExquisiteNetV2的參數量遠少於其他模型,但資料分析能力以及運算速度卻優於其他模型,因此,ExquisiteNetV2是一種高性能之輕量級卷積神經網路,可通用於影像分類與物件偵測之應用。Item 利用卷積神經網路對黃斑部病變的視力進行預測之研究(2021) 柯竑亨; Ke, Hong-Heng黃斑部皺褶,是一種慢性眼疾,經常發生在年長者身上,患者視網膜的黃斑 部會產生皺摺,進而影響視力。不過,雖然已知此疾病對於視力有非常重大的影 響,但在同樣患有此疾病的患者當中,卻可能擁有不同的視力分布,有些病人的 視力可能僅僅只有 0.1,有些病人卻能夠擁有高達 1.0 的視力。視力的差異難以單 純地依靠肉眼檢視醫學影像來判斷,因此,以深度學習為基礎的電腦視覺將可能 是一個有效之方法。深度學習在這幾年來可以說是蓬勃發展,尤其是在影像辨識方面更是有著相 當優異的表現,本論文將使用 Resnet18、Resnet50、MobilenetV2、ShuffleV2 這四 種神經網路來加以分析,透過卷積神經網路強大的圖形識別能力,來幫助我們找 到在患有黃斑部皺褶的病人的黃斑部之中影響視力最為關鍵的部分。本論文所使 用的資料集是採用台大醫院眼科所提供的 angio retina 影像,它是一種使用了光學 原理成像的眼底血管影像,由於本論文中所使用到的資料集較難以蒐集,所以在 數量上比較稀少,因此除了針對資料集做了資料增強來增加資料集的數量外,另 外還有使用投票法、K 折交叉驗證等方法,來提升模型的表現,在實驗的最後, 本論文採用了 Grad-CAM++這個工具,使訓練結果可以視覺化,以熱像圖的方式 描繪出卷積神經網路所關注的區域,希望此有助於眼科醫師的臨床判斷。