資訊工程學系
Permanent URI for this communityhttp://rportal.lib.ntnu.edu.tw/handle/20.500.12235/60
本系前身「資訊教育學系」成立於民國七十四年,首先招收大學部學生,民國九十年成立資訊工程研究所碩士班,而後於民國九十五年進行系、所調整合併為「資訊工程學系」;並於九十六年成立博士班。本系目前每年約招收大學部四十餘人,碩士班六十餘人,博士班約五人,截至民國一百零四年十一月止,總計現有大學部一百九十多人,碩士班一百二十多人,博士班二十三人,合計學生人數約為三百三十多位。
News
Browse
7 results
Search Results
Item 基於頻率域和時序性特徵的假人臉影片偵測(2021) 王順達; Wang, Shun-Ta隨著深度學習生成技術日新月異發展, 越來越多深度學習生成的假臉充斥在網路世界。多項研究證實人眼對於深度學習生成假臉的真偽越來越沒有判斷能力,將來勢必衍生更多擬真度極高的假影片讓大眾堅信不移,製造多重假資訊和社會恐慌。然而深度學習模型卻有辦法偵測某些細微特徵,不論是從語意上、屬性上、和頻譜上,甚至是幀和幀之間的不一致性都逃不過模型精準的法眼,因此利用深度學習模型偵測假臉勢在必行。近年來,深度學習偵測假臉研究日益受到關注,其中不乏利用離散餘弦轉換、傅立葉轉換等方式將特徵圖轉換至頻率域,並在頻譜中學習特徵,以及運用注意機制讓模型學習、強調局部特定區域,和利用循環神經網路學習幀和幀之間的不一致性。但過往研究往往忽略模型追求的目標是具備高度泛化能力,畢竟將來人類面臨到的造假影片不會是模型訓練時所見過的,也必然隨著深度生成技術演進產生更難辨別的影片,此時模型能否精準偵測便是考驗演算法泛化能力的時候。 因此本研究結合卷積神經網路抽取空間域特徵,離散餘弦轉換後的頻譜抽 取頻率域特徵,以及利用注意機制學習、強調竄改區域,和運用 GRU 架構抽 取前面學習到的特徵再加以學習時序性特徵,辨別真偽。此外還設計兩種損失 函數實驗,Focal Loss 和 Cross-Entropy Loss 追求最好的模型泛化能力。實驗證 實,我們的模型架構能在沒有預訓練的情況下,在 Celeb-DF 資料集達到當今最 佳的泛化結果,並在其他資料集也展現顯著的泛化能力。Item 基於臉部偵測及CNN模型之硬體臉部辨識系統(2019) 謝斯宇; Xie, Si-Yu本論文透過FPGA(Field Programmable Gate Array)的特性,如運算速度快、功率消耗低以及可攜性高等,來實現基於簡單CNN Model LeNet-5的人臉即時辨識系統。 LeNet-5是簡單的CNN Model,對於複雜背景的影像有著極低的辨識率,為了改善其缺點,有兩種作法。第一,使用較為複雜的CNN Model如VGG-Net16等,第二,新增額外的前處理人臉偵測方式來改善。 如果使用較為複雜的CNN,在現有基於複雜的CNN電路絕大多數是使用PE (Process Element)Array的架構,每層電路共享相同的運算單元,而這種方法會造成一些問題,硬體資源消耗高、硬體設計複雜以及Latency長等問題。所以本論文是使用較為簡單的CNN來設計電路,根據軟體模型不同層的特性去做不同的設計,藉由改善電路的架構,使得每一層電路部分重疊的方式,提升電路平行計算的能力,進而提高電路的運算速度。 本論文使用簡單的CNN電路搭配人臉偵測的方式,來實現即時人臉辨識系統,不僅辨識率足以跟複雜的CNN匹敵之外,更重要的是我們只需花成本低的硬體規格就能實現實際的應用,如手機上的APP人臉解鎖功能以及家庭人臉辨識等應用,符合普及計算(Pervasive Computing)的概念。Item 可應用於學生專注度之人眼開闔偵測研究(2012) 簡郁菱; Yu-Ling Chien本論文提出一個即時的簡易偵測方式,著重於解決遠距離低解析度下,光源與雜訊干擾等問題,能使得眼睛在不同開闔程度下皆能擁有優良的辨識率。 藉由使用人臉偵測、局部影像擷取、眼睛區域決策與眼睛區域-可靠度檢查,截取出完整且無遮蔽物的眼睛影像,並且在低解析度時也能明確的找出眼睛位置。再使用簡易、快速且不受光源影響的紋理特徵分佈影像,強化開眼闔眼的對比,得到平順、破碎或群集分佈的二值化影像,分析其中平均值、變異值與分群數的差異,能有效的偵測眼睛狀態。 在實驗中可以證明,辨識速率非常的快,在一般複雜環境下表現優異,在遠距離中也並未受到外在環境的干擾。 眼睛狀態偵測可搭配人臉偵測與移動偵測,來推廣至學生專注度偵測應用,能有效的辨識出學生專心狀態。Item 使用單一網路攝影機之視線判斷(2013) 許雅淳; Ya-Chun Hsu眼動追蹤一直被應用於認知心理學相關的研究,近年來眼動追蹤更成為人機互動相當熱門的發展重點之一。事實上,眼動追蹤不但能夠被用於輔助行動不便的病患透過電腦與人溝通,也能應用於偵測駕駛精神狀態上,減少駕駛因過度疲勞造成的車禍率,除了可挽救許多人命外,更可降低社會成本。 然而,市面上的眼動追蹤系統經常價格不斐且不易取得,因此我們提出一個只要個人電腦及一個網路攝影機就能使用的眼動追蹤方法。我們修改了Adaboost的人臉追蹤方式,以期調高偵測速度並降低偵測錯誤率,也提出一個能夠快速尋找到虹膜中心位置的方法。最後透過支持向量機,判斷視線可能坐落的區塊,再透過我們設計的視線追蹤機制,進行最終視線所在區塊的判斷。Item 以Graph cut演算法為基礎的連續影像人臉偵測系統(2012) 郭俊麟; Jiun-Lin Guo本論文提出一套可在各種教室情境中運作的人臉偵測系統,偵測對象為教室中的多名學生,主要應用在自動教室觀察與記錄系統中。本研究採用顏色做為人臉偵測時的特徵,且利用graph cut技術做為人臉偵測時主要的方法。 以顏色為特徵的人臉偵測有著較不受頭部轉動和傾斜影響的優點,因為在頭部轉動和傾斜時,膚色依然在人臉中佔有一定比例的面積;至於眼睛、嘴巴和鼻子等其他人臉特徵在頭部轉動和傾斜時(尤其是轉動)在影像中較不穩定。這個顏色特徵的優點對於在教室中進行自動人臉偵測來觀察與記錄學生的行為有很大的幫助,因為在課堂中學生頭部的姿勢變化常常都是有意義的,如疲憊時打瞌睡、表示贊同時點頭或心不在焉時將人臉轉向他處等,而這些變化也往往是教學觀察者們(教師、研究人員)所關心的現象。因此,本系統若能夠在各種頭部姿勢狀態下做人臉偵測,就能夠更進一步地去分析這些姿勢變化和其所代表的意義。 利用顏色特徵來偵測人臉必須選擇一個適當的色彩空間,並且決定人臉的膚色在該色彩空間中的範圍。然而,這類作法常會遇到兩個問題,一是不同的光線以及人種需定義不同的膚色範圍,二是在教室中有許多物體顏色接近膚色(如原木色課桌椅),會降低人臉偵測的正確率。針對第一個問題,本研究提出一個動態的膚色範圍定義方式;而為了解決第二個問題,本研究提出一個穩定的方法在影像中擷取前景(即學生的部分)。此方法結合單點建模與graph cut的技術,可以得到完整不破碎的前景,在前景的範圍內擷取膚色,避免類膚色背景的干擾。 另一方面,利用膚色在Hue色彩空間中高度集中的特質,本研究再次以graph cut技術優化膚色區域的偵測結果,統計收集到的膚色像素、動態更新膚色範圍,以提高偵測的穩定性。 在實驗時,本研究架設單一攝影機來擷取影像,每張影像中均包含4~6位學生。本研究假設初始教室沒有學生,系統首先進行背景建置,待學生進入教室,系統偵測到影像中有前景出現後,便會開始進行人臉偵測。實驗結果顯示,本研究提出的人臉偵測技術,較不受各種頭部轉動和傾斜角度之影響,並且能夠在低解析度影像下,維持高準確率。Item 基於智慧型裝置之多使用者即時人臉辨識及權限控管研究(2014) 李鈺新; li-Yu-Sin人臉辨識是電腦視覺裡面一個重要的技術,近幾年由於身分認證,金融卡認證的需求日益增加,傳統的識別方法如密碼,身分證號碼存在可能的風險,而人臉辨識應用在智慧型手機上的需求更是日益漸增,像是身分認證,信用卡認證,手機解鎖,門禁管理,照片庫分類等等,而以手機上不同使用者登入來說,密碼以及圖形的輸入都存在著可以模仿的風險,所以生理特徵作為辨識的方法變得更為安全,也有其存在的必要性,現有的方法很多像是指紋,眼球虹膜,但在這些方法中,人臉辨識所需要的設備最為低價且最容易取得,也相對便宜。 本研究提出一個有效且快速的流程來辨識人臉,做為手機或平板電腦上的多使用者權限控管功能,亦可以應用到其他身分辨識的應用上,由於平板電腦的運算能力相對於一般電腦是較為薄弱的,所以本論文提出特徵擷取運算速度較快的noise-resilient LBP演算法,和特徵群聚法來解決平板電腦上記憶體不足的問題,研究方法共分成四個部分,一開始做人臉偵測找出人臉位置,再對該張人臉做影像前處理來克服不同光線的影響,提出noise-resilient LBP演算法進行特徵擷取,由於訓練集人臉特徵過多,因此本研究亦提出特徵群聚法來找出具有代表性的特徵,最後則是特徵距離相似度計算。Item 可應用於一般課堂環境中之人眼開闔狀狀態研究(2013) 盧姿卉眼睛開闔辨識是電腦視覺的一個重要技術,能夠在生活中發展成多種應用,大部分的眼睛狀態偵測,環境皆屬於背景較為單純、近距離以及頭部晃動不大的情形,像是汽車駕駛疲勞偵測系統,然而本研究希望能將眼睛開闔辨識應用於一般課堂環境中,因此需要解決在有光線干擾及遠距離低解析度下的環境中,仍能快速且有效辨識眼睛的開闔狀態。 本研究之方法共分成三個部分,分別是人臉偵測、眼睛區域決策,最後則是眼睛狀態辨識。首先對影像做人臉偵測,接著將做完前處理的臉部影像利用局部取像的方法得到眼睛的大致位置,再利用水平投影及垂直投影找出眼睛精確的範圍及位置,最後本研究利用開闔眼睛影像輪廓複雜度之差異設計一套新的特徵擷取方式,並搭配已事前訓練過的SVM模型來判斷眼睛的開闔狀態。 無論是近距離或是遠距離實驗,由實驗結果可證明出在相同的辨識率下,本研究所設計之特徵擷取方式比複雜度函數的方法能判斷出的開閉眼資料比例多,因此整體的執行時間可以降低,也證明了本篇方法的可用性,除了開閉眼整體辨識率皆可達到84.9%以上,且隨著門檻值的調整,執行時間也可比單純用SVM快了1.5至3倍,時間上的減少能帶給本系統很大的效益。