學位論文
Permanent URI for this collectionhttp://rportal.lib.ntnu.edu.tw/handle/20.500.12235/73912
Browse
2 results
Search Results
Item 具泛化能力的槽位表示之自監督學習(2025) 林詠閎; Lin, Yung-Hung自監督的發展在近年來受到了巨大的關注,其中對比式學習透過拉近同一圖像的另一視圖並推遠來自其他圖像的視圖,從而從未具標註的資料中學習表徵。近年以場景為主的影像資料集也開始被使用於預訓練,並且著重局部的學習可以在場景資料集表現得更好,這些方法大多依賴密集的匹配機制或是透過Selective Search找出可能物件,最近的方法透過將像素進行分群學習(稱作槽位),將相同語義的像素分配到同一槽位內,並讓習得的槽位可以隨著資料進行調整。我們發現全局的增強方法無法針對槽位調整,因此,我們提出了一種局部的特徵增強方法,透過對每個槽位進行特徵級別的增強,使槽位可以學習到資料的更多變化與型態,以提升泛化能力。我們在物件偵測、語義分割、多標籤分類等下游任務上評估我們所開發的自監督方法的性能,我們引入的方法不會增加訓練參數,並且在各個下游任務的表現上都有所提升。Item 整合全局場景與局部注意的自監督多標籤分類(2023) 陳俊彥; Chen, Chun-Yen自監督學習在各種計算機視覺任務中取得了顯著的成果,證明了其在廣泛應用中的有效性。然而,儘管取得了這些成功,針對多標籤分類的挑戰的研究工作仍相對有限。該領域尚待深入探討,需要進一步研究以充分利用自監督學習技術進行多標籤分類任務。在這篇論文中,我們提出了一個適用於自監督多標籤分類的多層次表徵學習(GOLANG)框架,同時捕捉圖像的場景和物件資訊。我們的方法結合了全局場景和局部對齊,以捕捉圖像中不同層次的語義信息。框架的全局模組通過對輸出特徵進行平均池化來學習整個圖像,而局部對齊模組通過學習關注來消除與對象無關的干擾。通過整合兩個模組,我們的模型能從影像中有效地學習各種層次的語義信息。為了進一步提高模型提取物件-場景關係的能力,我們引入了全局和局部交換預測技術,有效捕捉圖像中各種物件和場景之間的複雜關係。GOLANG框架在自監督多標籤分類的實驗上展示了優秀的性能,凸顯了其在在多標籤影像中捕捉多個物件和場景之間錯綜複雜關係的有效性。