資訊工程學系

Permanent URI for this communityhttp://rportal.lib.ntnu.edu.tw/handle/20.500.12235/60

本系前身「資訊教育學系」成立於民國七十四年,首先招收大學部學生,民國九十年成立資訊工程研究所碩士班,而後於民國九十五年進行系、所調整合併為「資訊工程學系」;並於九十六年成立博士班。本系目前每年約招收大學部四十餘人,碩士班六十餘人,博士班約五人,截至民國一百零四年十一月止,總計現有大學部一百九十多人,碩士班一百二十多人,博士班二十三人,合計學生人數約為三百三十多位。

News

Browse

Search Results

Now showing 1 - 4 of 4
  • Item
    以Graph cut演算法為基礎的連續影像人臉偵測系統
    (2012) 郭俊麟; Jiun-Lin Guo
    本論文提出一套可在各種教室情境中運作的人臉偵測系統,偵測對象為教室中的多名學生,主要應用在自動教室觀察與記錄系統中。本研究採用顏色做為人臉偵測時的特徵,且利用graph cut技術做為人臉偵測時主要的方法。 以顏色為特徵的人臉偵測有著較不受頭部轉動和傾斜影響的優點,因為在頭部轉動和傾斜時,膚色依然在人臉中佔有一定比例的面積;至於眼睛、嘴巴和鼻子等其他人臉特徵在頭部轉動和傾斜時(尤其是轉動)在影像中較不穩定。這個顏色特徵的優點對於在教室中進行自動人臉偵測來觀察與記錄學生的行為有很大的幫助,因為在課堂中學生頭部的姿勢變化常常都是有意義的,如疲憊時打瞌睡、表示贊同時點頭或心不在焉時將人臉轉向他處等,而這些變化也往往是教學觀察者們(教師、研究人員)所關心的現象。因此,本系統若能夠在各種頭部姿勢狀態下做人臉偵測,就能夠更進一步地去分析這些姿勢變化和其所代表的意義。 利用顏色特徵來偵測人臉必須選擇一個適當的色彩空間,並且決定人臉的膚色在該色彩空間中的範圍。然而,這類作法常會遇到兩個問題,一是不同的光線以及人種需定義不同的膚色範圍,二是在教室中有許多物體顏色接近膚色(如原木色課桌椅),會降低人臉偵測的正確率。針對第一個問題,本研究提出一個動態的膚色範圍定義方式;而為了解決第二個問題,本研究提出一個穩定的方法在影像中擷取前景(即學生的部分)。此方法結合單點建模與graph cut的技術,可以得到完整不破碎的前景,在前景的範圍內擷取膚色,避免類膚色背景的干擾。 另一方面,利用膚色在Hue色彩空間中高度集中的特質,本研究再次以graph cut技術優化膚色區域的偵測結果,統計收集到的膚色像素、動態更新膚色範圍,以提高偵測的穩定性。 在實驗時,本研究架設單一攝影機來擷取影像,每張影像中均包含4~6位學生。本研究假設初始教室沒有學生,系統首先進行背景建置,待學生進入教室,系統偵測到影像中有前景出現後,便會開始進行人臉偵測。實驗結果顯示,本研究提出的人臉偵測技術,較不受各種頭部轉動和傾斜角度之影響,並且能夠在低解析度影像下,維持高準確率。
  • Item
    可應用於一般課堂環境中之人眼開闔狀狀態研究
    (2013) 盧姿卉
    眼睛開闔辨識是電腦視覺的一個重要技術,能夠在生活中發展成多種應用,大部分的眼睛狀態偵測,環境皆屬於背景較為單純、近距離以及頭部晃動不大的情形,像是汽車駕駛疲勞偵測系統,然而本研究希望能將眼睛開闔辨識應用於一般課堂環境中,因此需要解決在有光線干擾及遠距離低解析度下的環境中,仍能快速且有效辨識眼睛的開闔狀態。 本研究之方法共分成三個部分,分別是人臉偵測、眼睛區域決策,最後則是眼睛狀態辨識。首先對影像做人臉偵測,接著將做完前處理的臉部影像利用局部取像的方法得到眼睛的大致位置,再利用水平投影及垂直投影找出眼睛精確的範圍及位置,最後本研究利用開闔眼睛影像輪廓複雜度之差異設計一套新的特徵擷取方式,並搭配已事前訓練過的SVM模型來判斷眼睛的開闔狀態。 無論是近距離或是遠距離實驗,由實驗結果可證明出在相同的辨識率下,本研究所設計之特徵擷取方式比複雜度函數的方法能判斷出的開閉眼資料比例多,因此整體的執行時間可以降低,也證明了本篇方法的可用性,除了開閉眼整體辨識率皆可達到84.9%以上,且隨著門檻值的調整,執行時間也可比單純用SVM快了1.5至3倍,時間上的減少能帶給本系統很大的效益。
  • Item
    結合臉部表情及聲音之嬰兒情緒辨識系統
    (2015) 馬仲文; Ma, Chung-Wen
    嬰兒的情緒發展會影響未來的學習力、注意力甚至於成長後的個性及人際關係,而在人一生的情緒發展中以嬰兒時期的情緒發展最為重要。所以若是能得知嬰兒目前情緒及生理需求並予以滿足,對未來發展影響甚大,然而嬰兒在1歲之前只能使用臉部表情及不帶詞意的聲音來向父母表達自己目前的情緒及生理需求。所以本論文開發一套結合嬰兒臉部表情及聲音的監控系統,適時協助轉達嬰兒情緒,以減輕父母照顧嬰兒的負擔,更幫助父母妥善的照顧嬰兒。 本系統一開始分成兩部分執行,一部分為影像部分,另一部分為聲音部分。影像部分主要分為嬰兒臉部偵測及臉部特徵擷取,當系統讀入連續的嬰兒影像後,會從影像中擷取膚色區域並從這些膚色區域中找出嬰兒的臉部區域。接著採用local ternary pattern標示影像中嬰兒臉部輪廓,並進行差分影像累積,最後計算累積差分影像中0階至3階的Zernike moments值,當作嬰兒臉部特徵使用。而聲音方面利用常見的mel frequency cepstral coefficients與其差量倒頻譜係數當作嬰兒聲音特徵使用。最後利用support vector machine將影像及聲音特徵分別進行分類,並將兩者分類結果整合成嬰兒情緒類別。 實驗影片共有100段,其中每段影片僅包含單一情緒類別,合計影片長度為100分鐘,拍攝嬰兒之月齡為1個月至7個月,而嬰兒情緒辨識之平均正確率約為85.3%,由此可知,本系統的辨識結果具有一定的可信度。
  • Item
    駕駛者眼睛的眨眼偵測
    (2006) 林慧雯; Hui-Wen Lin
    交通事故死亡率總是佔國內前十大死因之一,其中肇事原因之一是因為駕駛者精神不集中而發生交通意外。故許多學者積極地在車內裝設偵測眨眼頻率的設備,以便預測駕駛者的精神狀態,若是想打瞌睡的時候,趕緊發出警告喚醒駕駛者。 本論文的目的在於使用一般攝影設備拍攝駕駛中的駕駛者,克服光線變化的問題即時從影像中偵測駕駛者眨眼狀況,以應用於偵測駕駛者的精神狀態。在偵測駕駛者眨眼狀況的過程中,主要可分成四步驟:臉部偵測、眼睛偵測、眼睛追蹤與眨眼偵測。首先從輸入的影像中,結合不同來源的色度偵測膚色的區域,快速地擷取駕駛者的臉部,並且使用邊線的資訊修復這個臉部,之後使用橢圓的資訊找出臉部真正的位置。在偵測到駕駛者臉部後,依據人臉比率找出眼睛的範圍,並在這範圍內根據膚色的資訊、眼睛的特徵以及連續數張影像的輔助,準確偵測出駕駛者的眼睛部分。接著使用眼睛的形狀與位置,在連續影像中追蹤眼睛的位置,並且同時利用顏色的資訊判斷駕駛者的眨眼狀況。