Browsing by Author "Yeh, Chia-Hung"
Now showing 1 - 7 of 7
Results Per Page
Sort Options
Item Fast inter-prediction algorithm based on motion vector information for high efficiency video coding(2018-10-01) Lin, Kao-Min; Lin, Jie-Ru; Chen, Mei-Juan; Yeh, Chia-Hung; Lee, Cheng-AnAbstract High Efficiency Video Coding (HEVC/H.265) is the latest international video coding standard, which achieves better compression ratio and supports higher resolution than Advanced Video Coding (H.264/AVC). However, HEVC/H.265 increases the computational burden. To reduce the coding complexity of the HEVC encoder, this paper proposes a fast inter-prediction algorithm to speed up coding time. We collect the average rate-distortion costs (RD-cost) of Skip modes and Merge modes to accelerate prediction unit (PU) mode decisions. In addition, we also acquire and analyze the motion vector range from Merge modes and Inter 2N × 2N modes to decide whether to execute Merge and advanced motion vector prediction (AMVP) of other PUs. The experimental results show that the proposed algorithm provides 48.54% time saving on average in random-access configuration and maintains good rate-distortion performance and video quality at the same time. The proposed algorithm also outperforms previous works.Item 基於暗通道先驗之疊代神經網路應用於低光圖像增強(2022) 劉晟岳; LIOU, Cheng-Yue本論文研製一新穎的架構。稱為疊代低光影像增強網路,它使用暗通道先驗來增強低光源影像。我們透過觀察得知負片後之低光影像類色彩分佈似於含霧影像。因此,本論文所提出的架構遵循這個假設來恢復低光圖像。此外,我們還使用灰度世界算法來改善色彩偏移的問題。通過疊代,本架構可以得到亮度足夠的前處理影像。隨後,本論文使用自動編碼器進一步提高最終輸出影像的質量。由實驗結果可以表明,所提出的此方法可以處理各種光照條件,並且輸出效果優於現有方法。由所進行的實驗可以證明,提出之輕量化架構不僅減輕硬體設備之負擔還可以顯著提高物件偵測的性能,以便後續與高階電腦視覺任務的配合。Item 基於生成對抗式網路的人臉影像身分重建(2021) 屈軒宇; Chiu, Daniel基於卷積神經網路的人臉辨識技術已經達成極高的準確率並且廣泛應用於各種場域,然而在特定的應用場合人臉辨識技術還是有很大的挑戰,特別是影像品質不佳的監控設備環境下,人會與鏡頭有較大的距離,導致人臉影像解析度過低造成人臉身分難以辨識,為此我們提出一個新穎的基於生成對抗式網路的人臉影像重建網路,藉由學習低解析度的人臉影像與高解析度的人臉影像之映射關係,我們可以從低解析度人臉影像重建出高解析度人臉影像,此外我們使用Feature Embedding的方法從網路的輸出層得到人臉身分特徵,並且利用三元組損失計算人臉身分特徵用以訓練神經網路,使神經網路可以藉由人臉身分特徵表達做相應的高解析度人臉影像重建,實驗階段我們使用了公開的人臉資料集CASIA-WebFaces進行訓練,並與近年來基於深度學習所提出的底解析度人臉重建方法作為比較並稱為傳統方法。實驗結果表明我們所提出的極低解析度人臉重建網路在大倍率放大的影像品質與辨識率優於傳統方法。Item 基於空間引導機制之高頻細節增強的影像運動模糊去除(2023) 王宇捷; Wang, Yu-Chieh在影像運動去模糊中,多階段架構已被廣為使用且獲得卓越的效能。而過去傳統方法通常透過提取模糊輸入影像的空間細節來修復退化的影像,但由於輸入模糊圖像無法提供準確的高頻細節,因此降低了整體去模糊演算法的性能。為了解決這個問題,本文提出一種新的雙階段架構,該架構可以通過提取模糊圖像的高頻細節資訊來重建詳細的紋理。它使用了一種有監督的引導機制來提供精確的空間細節來重新校準多尺度特徵。此外,該方法還設計一個基於注意力的特徵聚合器,可以自適應地融合來自不同階段的有影響的特徵,以抑制傳遞到下一個階段的冗餘資訊。本文通過實驗證明,所提出的法在 GoPro 和 HIDE 基準數據集上的去模糊性能和計算複雜度方面都優於其他現有方法。Item 基於編碼之隱性運動感知的影像超解析度(2022) 林少擎; Lin, Shao-Ching影像超解析度和單張影像超解析度相比較為複雜,要修復影像中的細節和背景且同時要保持時域一致性,雖然許多現存方法致力於完成此任務,但由於運動資訊不精確而造成的過度平滑仍未解決,為了處理此問題,我提出了基於編碼之影像超解析度,該方法直接從影像解碼器中得到運動補償幀和殘差幀,使用了兩個的神經網路分別將兩個幀上採樣,接著優化模組會將上述兩個神經網路的輸出結果結合並產生高品質影像。提出方法可以有效避免帶有複雜運動訊息的低解析度影像產生出模糊的高解析度影像,這是因為從影像解碼器中提取到的運動補償幀和殘差幀保有更精準的運動訊息。實驗結果顯示提出方法在REDS和Vid4兩個指標資料集上有更突出的成果。Item 基於變分自動編碼器之解糾纏模型設計與應用:單細胞RNA定序之聚類與細胞擾動之預測(2022) 陳則光; Chen, Ze-Guang在今天,深度網路已經應用於許多領域,包含產業界以及科學研究中,然而雖然深度網路可以自動生成出許多特徵已擬合出我們要求的結果,這些特徵卻難以被人類解讀。 當模型得出結果時,我們往往難以理解其是如何得出該結果以進行驗證其合理性,本研究的目標為設計可生成出更有解釋性特徵的基於變分自動編碼器模型,首先我們提出了可估計模型生成的特徵間的訊息相關性的方法,並藉此調控訓練過程中的超參數以使模型生成彼此訊息相互獨立的解糾纏特徵,並證明了使用這些解糾纏特徵可有效提升單細胞RNA定序的聚合正確度,本論文也提出了透過解開擾動不變訊息以預測細胞經擾動後的狀態,實驗證明這不只可以提升預測準確度,而且可以提供預測的根據,並可在某種程度上預測細胞經擾動前的狀態。Item 疊代推進生成對抗網路用於陰影去除(2022) 吳建霖; Wu, Chien-Lin隨著科技的高速發展,深度學習在工業、軍事、民生科技處處都有大量的應用,現今運用在影像處理上的深度學習技術不斷進步,影像的去除如影像除霧、去反光、去陰影等都是電腦視覺領域中具挑戰性的任務。本論文研究目的為針對影像陰影去除提出了迭代推進生成對抗網路,首先我們輸入陰影圖藉由兩個生成器網路分別生成出無陰影的圖及殘差陰影圖,將兩者合成得到陰影圖,與輸入進行比對,最後將合成的圖再次輸入至網路重複上述步驟直到收斂,透過迭代推進的方式提升陰影移除的效果。此外為了使結果更加優異,我們的生成器網路加入了注意力機制,讓模型更專注於影子的部分,以及長短期記憶,使我們在長序列訓練過程中有更好的表現,最後是修復網路,以進一步改善生成的結果。我們與傳統方法以及近年來基於深度學習所提出的陰影去除方法比較,實驗結果表明本論文所提出的迭代推進方法有更優異的結果。