學位論文

Permanent URI for this collectionhttp://rportal.lib.ntnu.edu.tw/handle/20.500.12235/73890

Browse

Search Results

Now showing 1 - 8 of 8
  • Item
    用於光學同調斷層掃描之基於深度學習和聯邦學習框架之視網膜積液分割技術
    (2024) 林志韋; Lin, Chih-Wei
    在眼科領域,光學相干斷層掃描(OCT)是檢測眼病的關鍵技術。偏鄉資源有限僅能使用輕量化設備,但其計算能力不足,難以支撐較為大型模型的訓練,以及數據缺乏和隱私問題阻礙醫院數據共享。首先針對輕量化設備,基於LEDNet設計了高效的LEDNet(α)模型,通過調整通道、添加Shuffle Attention模塊和Group Normalization。使用成本低廉的樹莓派5進行訓練,適合偏鄉需求,為解決隱私問題,引入聯邦學習,通過上傳本地模型參數聚合全局模型,避免資料直接上傳。本研究提出Krum(α)算法,在客戶端損失函數中添加近端項並考慮模型自適應性,改善淘汰機制,改進基於歐氏距離淘汰惡意模型的Krum算法。最後實驗結果顯示,在AROI、DUKE、UMN和RETOUCH數據集上,AROI積液類別提高了3.4%,DUKE提高了5.9%,UMN提高了2.4%,RETOUCH提高了1.4%。
  • Item
    針對空拍影像物件偵測之改良型YOLOv7演算法研究
    (2024) 鍾宜修; Chung, Yi-Hsiu
    近幾年無人機的技術發展迅速,飛行距離越來越遠、體積也不斷縮小,甚至能自動飛行,因此能應用的範圍也越來越廣泛,例如交通監測、工業或自然環境巡檢等等。另外隨著人工智慧的興起,現在無人機也會結合人工智慧演算法協助其辨識影像。由於無人機所拍攝的影像內物件往往尺寸偏小,且無人機本身的運算支援有限,因此如何提升小物件的辨識效果且同時降低模型運算時所需的資源至關重要。本論文以YOLOv7為基礎模型進行改良,提升它對小物件的偵測效果且同時降低模型參數量及計算量,我們以VisDrone-DET2019資料集來驗證模型改良成效。總共修改五種方式,第一種方式是將ELAN (Efficient Layer Aggregation Network)替換成M-ELAN (Modified Efficient Layer Aggregation Network),第二種方式是在高階特徵層添加M-FLAM (Modified Feature Layer Attention Module),第三種方式是將特徵融合的結構從PANet (Path Aggregation Network)改成ResFF (Residual Feature Fusion),第四種方式是將模型內下採樣的模塊改成I-MP模塊 (Improved MaxPool Module),最後一種方式是將SPPCSPC (Spatial Pyramid Pooling Cross Stage Partial Networks)替換成GSPP(Group Spatial Pyramid Pooling)。綜合以上方法,將mAP (mean Average Precision)提升1%,同時模型參數量卻下降24.5%,模型計算量GFLOPs (Giga Floating Point of Operations)也降低13.7%。
  • Item
    用於光學相干斷層掃描之基於深度學習和聯邦學習框架之視網膜層分割技術
    (2024) 張博翔; Chang, Po Hsiang
    在本研究中,我們提出了一種輕量級模型FPENet(α),以FPENet為基底,用於處理專為邊緣設備設計的 OCT 影像中視網膜層分割。視網膜層分割是眼科診斷的重要工具,但其在資源有限的邊緣設備上應用時存在計算成本和精度之間的瓶頸。FedLion(α)在使用 HCMS資料集、NR206資料集及OCT5K資料集進行訓練和測試時,實現了高精度和高效率。該模型經過最佳化,實現了精度和計算成本之間的平衡。FPENet(α)可以有效地捕捉不同尺度的特徵,同時大幅降低計算成本,非常適合部署在如Raspberry Pi等資源有限的邊緣設備上,其輕量化設計使其在計算資源和內存容量方面具有顯著優勢。聯邦學習的部分我們以FedLion為基礎添加了L2正則化與學習率遞減,提出FedLion(α),有效處理數據非獨立同分布的問題。數據顯示使用FPENet(α)與FedLion(α)進行聯邦學習,相較於原先只使用FPENet(α),在HCMS資料集平均DICE係數提升了0.7%,在NR206資料集提升了3.75%,在OCT5K資料集提升了9.1%。
  • Item
    基於YOLO深度學習用於小型漂浮物檢測的新型卷積演算法
    (2023) 沈峻宇; Shen, Jun-Yu
    海洋中的不當廢棄物已導致全球危機,為了緩解這個問題,要在海洋及河流的廢棄物到達環境負荷上限之前對其進行檢測和清理,本研究提出了一種基於 YOLOv4 的算法來檢測河流中的漂流廢棄物,算法結合了改進後的RegP池化層並添加到空間金字塔中的池化層與減少輸出部分的檢測層,以改進特徵提取並防止丟失重要或微小細節,並且針對微小的物品進行檢測。實驗結果中評估了本研究的方法在 FloW和Pascal VOC資料集上的性能,與現今的最先進的技術相比,結果表明提出的方法具有更好的mAP準確率,具體來說,在FloW上分別提升了7.91%和11.36%,並且也與多個在漂流廢棄物檢測的先進方法進行對比,獲得了最佳的準確率,在Pascal VOC上的實驗證實了本研究的方法在不同尺寸大小的物件上的有效性,最後測試了在WIDER FACE上對小尺寸的人臉進行檢測實驗,在準確率上也有一定的提升。本研究提供了一個有前途的解決方案,有助於檢測和清除河流中的廢棄物。
  • Item
    基於深度學習之光流法應用於全天空影像之日射量估計與預測
    (2023) 陳家豪; Chen, Chia-Hao
    因應太陽能發電日益重要,又因太陽能發電量受制於日射量的影響,同時考量太陽能發電是間歇性的能源,故提出一種基於深度學習光流應用於全天空影像之日射量估計與預測的方法。由於日射量變化容易受到天氣狀況影響,本文藉由全天空影像,建立一個以影像特徵為基礎之日射量估計與預測系統,其影像特徵包括,利用紅藍比例法計算影像中雲層比例、雲層厚度,及藉太陽位置演算法得到影像中太陽位置,分析太陽附近雲層特徵,萃取全域與局部的雲層權重。同時用基於深度學習的光流法推算雲層移動的狀態,並製作未來數分鐘之天空預測圖像,將這些預測圖像作長短期記憶(LSTM)之輸入特徵,日射量作為訓練輸出,其深度學習光流法是透過卷積神經網路來實現。本文將資料集區分為月、季、半年與一年,分別進行10分鐘至60分鐘的日射量預測。同時,本文使用多個效能指標評估效果,包括平均絕對誤差(Mean Absolute Error)、均方根誤差(Root Mean Square Error)與判定係數(R^2)。最後,與文獻的方法進行比較,本文所提的方法具有較好的結果。
  • Item
    基於深度學習之多連接模塊對於物件偵測的影響
    (2022) 李政霖; Li, Cheng-Lin
    在本論文中,我們提出與YOLOv5不同的加深網路模型的方法,並設計了三種適用於特定資料集的多連接模塊(Multi-Connection)。多連接模塊的主要目的是重用特徵並保留輸入特徵以供向下傳遞。我們在8個公開的資料集驗證我們的方法。我們改進了YOLOv5中的殘差塊(Residual block)。實驗結果顯示,與YOLOv5s6相比,YOLOv5s6加入多連接模塊型一在Global Wheat Head Dataset 2020上的平均精度(mAP)提高1.6%; YOLOv5s6加入多連接模塊型二在PlantDoc 資料集上的 mAP 提高2.9%;YOLOv5s6加入多連接模塊型三的mAP在PASCAL Visual Object Classes(VOC)資料集上提高了2.9%。另一方面,我們也比較了一般的傳統深化模型的方法。一般來說,加深網絡模型會提高模型的學習能力,但我們認為對於不同的資料集,採用不同的策略可以獲得更高的準確率。此外我們設計多連接模塊型四,應用在交通號誌偵測上,多連接模塊型四之一基於殘差塊做堆疊增加網路深度,來加強網路的學習能力,並加入壓縮和激勵模塊(SE block),來強化特徵圖資訊,另外透過一個額外的跳連接鼓勵特徵重用。多連接模塊型四之二,主要是將多連接模塊型四之一的通道減半,來減少模型計算量跟參數量。多連接模塊型四之三我們基於多連接模塊型四之二多增加一個3乘3的卷積提升模型學習能力。我們選擇TT100K資料集來訓練模型,我們也收集了臺灣交通號誌當作客製化資料集,去驗證我們的方法,目的是要設計出一個高效性能的模塊,所以設計出多連接模塊型四之三。在TT100K資料集中多連接模塊型四之三獲得最好的表現,與YOLOv5s6相比計算量僅增加了11%,mAP提升了3.2%,犧牲一點計算量換來模型準確率有感的提升,此外我們也在其他公開的資料集驗證我們的方法,多連接模塊型四之三的表現也是非常有效益的。
  • Item
    利用卷積神經網路對黃斑部病變的視力進行預測之研究
    (2021) 柯竑亨; Ke, Hong-Heng
    黃斑部皺褶,是一種慢性眼疾,經常發生在年長者身上,患者視網膜的黃斑 部會產生皺摺,進而影響視力。不過,雖然已知此疾病對於視力有非常重大的影 響,但在同樣患有此疾病的患者當中,卻可能擁有不同的視力分布,有些病人的 視力可能僅僅只有 0.1,有些病人卻能夠擁有高達 1.0 的視力。視力的差異難以單 純地依靠肉眼檢視醫學影像來判斷,因此,以深度學習為基礎的電腦視覺將可能 是一個有效之方法。深度學習在這幾年來可以說是蓬勃發展,尤其是在影像辨識方面更是有著相 當優異的表現,本論文將使用 Resnet18、Resnet50、MobilenetV2、ShuffleV2 這四 種神經網路來加以分析,透過卷積神經網路強大的圖形識別能力,來幫助我們找 到在患有黃斑部皺褶的病人的黃斑部之中影響視力最為關鍵的部分。本論文所使 用的資料集是採用台大醫院眼科所提供的 angio retina 影像,它是一種使用了光學 原理成像的眼底血管影像,由於本論文中所使用到的資料集較難以蒐集,所以在 數量上比較稀少,因此除了針對資料集做了資料增強來增加資料集的數量外,另 外還有使用投票法、K 折交叉驗證等方法,來提升模型的表現,在實驗的最後, 本論文採用了 Grad-CAM++這個工具,使訓練結果可以視覺化,以熱像圖的方式 描繪出卷積神經網路所關注的區域,希望此有助於眼科醫師的臨床判斷。
  • Item
    基於最佳化演算法的類神經網路剪枝策略
    (2021) 鐘暘; Chung, Yang
    隨著深度學習領域不斷的進步,類神經網路的架構比起以往擁有更多的參數量和記憶體的使用量,相對地對於硬體的要求也就更高。如何在有限的記憶體和硬體效能中擁有差不多的辨識效能也成為需要被關注的問題之一,而網路剪枝則是最直接能夠解決參數量過大問題,將網路中不必要的參數刪除,就能夠省去大量的記憶體空間。過去在網路剪枝當中,通常的策略都是將較小的權重刪除。這些網路剪枝方法的主要策略都是假設網路裡較小的權重,對於網路本身的影響較小,而可以被捨棄掉。但是我們認為這個假設對於神經網路而言並不是絕對的。在本篇論文中我們假設小權重也有可能會是重要權重的可能性,我們提出一個最佳化的剪枝策略,在剪枝時不只留下較大權重,還會留下由最佳化策略所挑選出的較小權重,能證明保留網路中重要的較小權重,有益於剪枝網路的準確率, 讓剪枝網路能夠在低參數量和高準確度中取得最佳的權衡。實驗結果說明在相較於只留較大權重的做法,透過最佳化的方法留下的較小權重,在相同的剪枝率網路會有更高的準確度。