Browsing by Author "Greg C. Lee"
Now showing 1 - 20 of 33
- Results Per Page
- Sort Options
Item A comparative study on post-class lecture video viewing in two classes.(2006-01-25) 楊如雪; Chiung-Fang Chiu; Greg C. Lee; Ju-Hsush YangItem PDF文件影片關鍵畫面擷取之研究(2006) 杜珮瑩; Tu Pei-Ying本篇論文提出一個偵測影片關鍵畫面的方法,可自動擷取使用PDF文件為教材之影片發生換頁的畫面。偵測方法分為兩階段,第一階段找出可能發生換頁之處,利用P、B畫面運動向量方向、位移量及所佔比例,找出換頁的位置並過濾不為換頁的畫面,如:移動程度較小、區域移動、移動偏於某一方向的畫面;第二階段為去除多餘畫面,利用畫面DC值直方圖的熵找出畫面顯著區域,再藉由其間的差異判斷其是否為換頁或其他多餘畫面,如:縮放、移動距離較大的畫面,經過上述兩階段存留下來的畫面即為關鍵畫面。本研究分別針對使用不同參數設定之影片、使用不同類型的PDF文件、不同移動速率及動作的PDF文件進行偵測分析,實驗結果證明所提出的方法不論在處理速度及結果均有不錯之效果。Item RST不變性數位浮水印技術(2009) 黃靖雅; Ching-Ya Huang網際網路的發達,使得聲音、影像及影片等多媒體資料容易被取得,甚至於遭到有意及無意的破壞與盜用。為了使多媒體資料原創者著作權受到保護,不論影像遭到旋轉、縮放及位移處理後,仍可以準確辨識該影像著作權,本研究以適用於浮水印之尺度(Scale)不變特徵值轉換,擷取影像中較穩定的特徵值,並分別在影像空間域及頻率域上,配合浮水印量化及中頻係數選取,在特徵值周圍進行嵌入與萃取浮水印訊息,以有效抵抗RST攻擊。 實驗結果顯示,影像經過旋轉(Rotation)攻擊,例如旋轉30度以上,或是受到放大2倍以上之縮放(Scaling)攻擊,其整體浮水印萃取效能(Performance)為75%及89%。從結果可知,不論在空間域或是頻率域浮水印技術,我們都可使浮水印萃取之效能較為強韌。Item 以區域為基礎的影像搜尋 — 影樣表達、比對與學習(2007) 江政杰; Cheng-Chieh Chiang本論文針對以區域為基礎的影像搜尋為主題進行研究。以區域為基礎的影像搜尋將影像分割成許多區域,各區域涵括相近的主題或特徵,然後用影像區域建立影像搜尋之索引與機制。我們建構了一個以區域為基礎的影像搜尋架構,包含了特徵擷取-包含視覺性特徵與語意性特徵-來表達影像資訊,設計一套影像比對機制,然後建置一個重複學習的機制允許使用者可以回饋他們的意見。 本論文首先定義一種新的影像視覺特徵,我們稱之為顏色-大小直方圖,本特徵的主要概念是結合傳統的顏色特徵與影像區域大小的資訊,來增加影像資訊的表達能力。此外,我們設計一個視覺-文字模式的影像特徵,這種特徵並不是單純的訊號低階特徵,而是建構在低階特徵之上彙整過的中階資訊。我們同時設計一套影像的語意特徵,這種語意特徵可以透過機器學習的機制,自動擷取影像內涵的語義概念。透過這三層的特徵描述,影像表達的機制可以更加完善。 除了三個不同階層的影像特徵,本論文還設計一套重複的機器學習模式,使系統可以根據使用者回饋的資訊,判斷使用者希望搜尋的影像資訊類型。這樣的學習模是可以讓影像搜尋的結果更加精確,而彌補使用影像視覺特徵之不足。因此,由影像特徵來表達影像資訊,到設計影像比對之學習模式,本論文建構一整套以區域為基礎的影像搜尋機制。Item 以投影片單應性映射之相關特徵進行演 講影片分析研究(2014) 林祐生; You Sheng, Lin投影簡報檔是講者用來輔助說明、提供註記,以及引領觀眾快熟掌握重點的工 具,但缺點是無法清楚表達細節;配合影音多媒體串流,不論在教學、會議或是演說 等場合中,可以完整的提供觀眾更多的細節資訊,但是也因此需要一個更有效率的方 式來瀏覽內容。 本文提出一個有效率而且準確的方法,將投影片以及影音內容配對。主要流程分 為三個部份,首先找出影音串流的候選影像,以減少後續配對是所花的時間,接著找 出影像特徵,計算候選影像及投影片匹配的特徵點,取得相似度。然後使用鄰近點差 異及隨機抽樣一致將可信度低的特徵濾除;如果條件許可,利用單應性特徵得到投 影片的約略位置。利用投影片在畫面中的比例將畫面分類為「有投影片」及「無投影 片」兩類畫面。接著將「有投影片」的部分在利用前面取得的相似度直接配對,並且 利用投票機制修正結果,最後可以正確的找出 96% 的畫面切換時間點。Item 以支持向量機為基礎之問卷填答識別研究(2012) 簡培修; Pei Hsiu Chien在現今電腦網路蓬勃發展的世代,部分的紙本問卷已轉成線上問卷,方便快速統計結果,然而仍然有許多電腦與網路不便使用的場合,例如:餐廳用餐、商店購物、銀行存提款、參加產品發表會或研討會、或是到政府機關洽公等,在這些場景中,通常不方便提供電腦及網路供問卷填寫,若要在第一時間取得意見回饋,紙本型式的問卷還是最直接且最便利的管道。而一般問卷設計,為了讓填答者方便填寫,以及快速統計填答結果,大部分會以選擇題方式呈現,不論是學術研究領域或是商業軟體,對這一類型問題的處理方式仍以計算填答區域中的可視點數量,作為是否有被標記之主要依據,然而雜訊問題以及填答者填答方式的多樣性(勾選、畫叉、塗滿等),經常讓這些計算可視點數的方法無法正確辨識選項是否被標記。 本論文提出一套完整的問卷處理流程,從空白的問卷自動擷取填答區域,並依照題目順序加以群組,輔助問卷設計者建立填答區域的model檔案;然後以支持向量機方法結合輔助判定規則,進行標記自動辨識,利用機器學習的途徑解決雜訊的問題,提高辨識正確率;同時嘗試利用「填答者意圖」的理念,嘗試解決填答者塗改答案的問題,而在實驗部份,以兩個真實的問卷應用驗證系統效能,另外,擴展系統功能為大學新生智慧財產權測驗進行評分。實驗結果顯示,SVM對於選項是否被標記的正確率達到99%以上;另一方面,以問題為基礎的正確率也達98%以上。最後本論文亦提出混合型支持向量機的作法來處理非一般性的選項符號,經實驗的結果顯示,將混合型支持向量機應用在上述的問卷與試卷,其正確率也都可達95%以上,表示混合型的SVM可應用於對正確率要求不是那麼高的問卷。Item 以教學影片及實驗策略進行影像處理原理學習之研究(2009) 邱瓊芳本研究提出整合教學影片及實驗策略之學習模式進行高中影像處理原理之學習。研究採準實驗研究法,比較此學習模式對學生學習影像處理之學習成就、對學習活動看法、以及學習電腦科學原理興趣之差異。此外,亦探討學習者特質對課前瀏覽教學影片之影響。研究參與者為二所高中各六個班級的學生,其中兩班學生為實驗組1,兩班學生為實驗組2,另兩班學生為控制組(採用傳統講述法)。實驗組1學生於課前瀏覽教學影片,課堂上進行實驗活動;實驗組2學生於課堂先接受影像處理原理教學,再進行實驗活動;控制組學生則於課堂接受影像處理原理教學。研究結果發現:(1)整合教學影片及實驗策略是可行及有效學習影像處理原理之學習模式;(2)此學習模式可促進課堂上同儕之間及師生之間的互動;(3) 此學習模式可提升學生對學習電腦科學原理之興趣;(4)學生特質方面,學習動機是課前瀏覽教學影片的重要因素。Item 以機率為基礎的語意分析之物件辨識研究(2009) 吳家維; Jia-Wei Wu使用影像中具有語意資訊的內容來作物件辨識,應該比使用低階特徵來辨識更為合理。為了克服語意隔閡,也就是高階與低階影像特徵之間的差距,我們提出一個非監督式的方法,藉由收集影像中的高階資訊,建構出一個新的影像表示法,我們將之命名為以機率為基礎的語意組成描述子(pSCD)。首先,我們將低階影像特徵量化,藉此得到一組視覺字組。接著我們利用修改過的pLSA模型來分析在視覺字組與影像間,包含哪些具有語意資訊的隱藏類別。利用這些隱藏類別,我們可以建構出pSCD,並將之應用在物件辨識上。另外,我們也會討論隱藏類別的數量多寡對pSCD的影響。最後,藉由物件辨識的實驗,我們證明了pSCD比起其它的影像表示法更加具有辨別性,例如袋字表示法或pLSA表示法。Item 以視覺為基礎之即時指揮手勢追蹤系統(2008) 莊謹萍; Chin-ping Chuang隨著網路視訊的普及,網路攝影機品質日趨優良、價格也相對低廉,本研究旨在提出一個「指揮者手勢追蹤系統」,代替鍵盤與滑鼠作為輸入單元,讓使用者能透過視訊攝影機(Webcam)及個人電腦、運用基本的指揮動作,能夠即時追蹤使用者手勢的軌跡與方向變化、偵測音樂節拍所在的時間點。 本研究可分為兩個主要階段:第一階段為目標物追蹤,採用CAMSHIFT演算法來實現物件追蹤。CAMSHIFT演算法為平均位移演算法的改良,此演算法利用使用者所感興趣的顏色機率分佈特性,經由平均位移迭代的方式,找出其機率分佈圖的峰值,此峰值即為可能性最高之影像區塊並得到物體移動路徑。第二階段則利用兩種方法計算:K-曲率法則以及垂直分量低點偵測。K-曲率法則利用物體移動路徑各點之區率並計算找出其方向轉變;而垂直分量低點偵測則是找出物體移動的垂直低點,將此低點定義為音樂的節拍點。 本研究所開發之系統可以讓使用者自行選定偵測目標(如指揮棒)並準確偵測移動的軌跡,將使用者的指揮動作上方向的改變,轉變成音樂檔的節拍事件,其準確率平均可達86.46%以上。Item 使用單一網路攝影機之視線判斷(2013) 許雅淳; Ya-Chun Hsu眼動追蹤一直被應用於認知心理學相關的研究,近年來眼動追蹤更成為人機互動相當熱門的發展重點之一。事實上,眼動追蹤不但能夠被用於輔助行動不便的病患透過電腦與人溝通,也能應用於偵測駕駛精神狀態上,減少駕駛因過度疲勞造成的車禍率,除了可挽救許多人命外,更可降低社會成本。 然而,市面上的眼動追蹤系統經常價格不斐且不易取得,因此我們提出一個只要個人電腦及一個網路攝影機就能使用的眼動追蹤方法。我們修改了Adaboost的人臉追蹤方式,以期調高偵測速度並降低偵測錯誤率,也提出一個能夠快速尋找到虹膜中心位置的方法。最後透過支持向量機,判斷視線可能坐落的區塊,再透過我們設計的視線追蹤機制,進行最終視線所在區塊的判斷。Item 使用網路攝影機即時人眼偵測與注視點分析(2011) 林瑞硯; Lin Ruei Yan數年來,眼睛偵測與注視點分析一直為學術或應用上的熱門研究主題,其原因為眼睛是人臉上最重要且顯著的部位。學術上常利用眼睛作為人臉偵測特徵,應用上則常用於影像追蹤,例如以眼睛代替滑鼠操作的眼控滑鼠、駕駛疲勞偵測或是近年熱門的裸視3D技術。 過往的方法多數利用侵入性的紅外線照射眼睛,亦或是利用昂貴的眼動儀輔助實驗,雖然可提高眼睛偵測或注視點分析辨識率,卻忽略了對人體的潛在傷害或是一般人無法輕易取得的缺點。 本論文提出一個使用低解析度的網路攝影機即時偵測眼睛與注視點分析方法,實現以低成本實驗器材達到正確偵測眼睛與注視點分析的目的,主要方法分成兩大部分,首先利用人臉偵測獲得人臉影像,利用光線濾波器過濾光線,並且結合鼻子位置實作角度權重機制,保留正確的眼睛區域,其次透過注視點校正程序,記錄使用者不同注視點位置的眼睛資訊,建構使用者當下環境的注視點模型,藉由比對模型以達到判斷注視點區塊。Item 具擴展性之視訊隨選隨播系統設計與實際應用(2013) 陳紹中; Shao-Chung Chen隨著網際網路與資訊科技產品之迅速發展與普及,線上視訊隨選隨播系統之需求日漸增長。本文旨在提出一個具擴展性之視訊隨選隨播系統設計,以及依循此設計開發實際應用之系統,並藉由實驗以評估該設計之可行性。 實驗結果指出本文提出之系統設計與實際應用具備同時服務大量使用者之能力;此外,依循此設計開發之系統,其規模可透過加入更多伺服器而得到擴張,毋須針對系統實做進行修改。Item 可應用於學生專注度之人眼開闔偵測研究(2012) 簡郁菱; Yu-Ling Chien本論文提出一個即時的簡易偵測方式,著重於解決遠距離低解析度下,光源與雜訊干擾等問題,能使得眼睛在不同開闔程度下皆能擁有優良的辨識率。 藉由使用人臉偵測、局部影像擷取、眼睛區域決策與眼睛區域-可靠度檢查,截取出完整且無遮蔽物的眼睛影像,並且在低解析度時也能明確的找出眼睛位置。再使用簡易、快速且不受光源影響的紋理特徵分佈影像,強化開眼闔眼的對比,得到平順、破碎或群集分佈的二值化影像,分析其中平均值、變異值與分群數的差異,能有效的偵測眼睛狀態。 在實驗中可以證明,辨識速率非常的快,在一般複雜環境下表現優異,在遠距離中也並未受到外在環境的干擾。 眼睛狀態偵測可搭配人臉偵測與移動偵測,來推廣至學生專注度偵測應用,能有效的辨識出學生專心狀態。Item 基於二階層式支持向量機之即時注視區域分析(2014) 陳美琪; Mei Chi, Chen眼動追蹤過去經常被使用在學術研究方面,近年來由於技術的進步眼動追蹤也被應用在醫療以及交通方面,抑或是應用於駕駛或課堂學生專注度的分析等。然而,過去相關的研究技術許多會利用侵入性的紅外線設備照射眼睛,或是利用較為昂貴的眼動儀輔助,雖然可提高注視點分析辨識率及準確度,但卻忽略了對人體可能的潛在傷害或是無法為大眾輕易取得的缺點。 本研究提出一個使用筆記型電腦內建之低解析度的網路攝影機即時偵測眼睛與注視點分析方法,實現以低成本且可輕易取得之設備達到正確偵測眼睛與注視點分析的目的。本研究主要方法分成兩大部分,首先利用Adaboost的人臉及人眼偵測獲得眼睛影像,接著加入光線濾波,利用眼睛區域平均灰階值過濾過強的光線,並且記錄使用者的眼睛特徵資訊(包含眼睛開合高度、上眼瞼斜率以及瞳孔位置);其次記錄使用者於不同注視區塊的眼睛資訊,透過本論文提出之二階層式支持向量機(2-Layer Support Vector Machine),建構使用者相對於當下環境的注視點模型,藉由比對測試資料及模型資訊以達到注視區塊的決策。 注視區塊決策準確度在注視輔助點固定的狀況下平均可達84%,比使用單一層支持向量機之準確度高出9.4%,而在注視輔助點是隨機出現的情況下平均約為80%。Item 基於增量學習之人臉辨識研究(2011) 李昇龍; Sheng-long Li人臉在生物驗證中是非常重要的特徵,在過去十幾年來,人臉辨識於電腦視覺的研究上也是非常熱門的議題,人臉辨識的技術也廣泛的運用在各方面,例如使用於監視系統或是安全控管系統上。本論文使用了增量學習的方法,設計了一個於課堂環境中可以自動辨識學生的一個點名系統,由於學生的造型在每一次的上課中會與之前有些微的變化,因此在辨識的同時,將這些新的影像加入原有的訓練資料中訓練,對於後續所訓練出的人臉模型將會越來越好。在論文中,我們使用了二維線性鑑別法(2DLDA)作為人臉訓練及辨識所用的分類器,並且使用了影片辨識上常用的投票,以及課堂所能利用的互斥資訊來提升辨識率;在增量學習上,也提出了一個驗證方式由測試影像中選擇出適當的影像重新訓練,並且進行了許多實驗來評估增量學習使用於人臉辨識上的效能。Item 基於擴增實境之傢俱模擬擺設系統(2011) 顏子軒; Tzu-Hsuan Yen本研究將以擴增實境的概念為基礎,設計一套應用於模擬家俱擺設的系統。本研究利用少數標記物提供場景深淺、定位、角度等資訊,使用與介面作互動的方式來擺設家具;取代以往擴增實境需要準備多組標記物來代表各個家俱的限制,與場景中的虛擬家俱和操作介面作互動,幫助使用者可以更方便、快速、直覺地達到模擬家俱擺設的效果。 本系統將以ARToolKit為基礎,針對家具擺設來設計系統。提出以標記物(Marker)為指標,與虛擬物件的作互動,藉由標記物提供深淺與座標資訊,將真實場景與虛擬物件做結合,使用者能夠即時的觀看到模擬結果並能隨時對已存在的虛擬物件做調整。Item 基於智慧型裝置之多使用者即時人臉辨識及權限控管研究(2014) 李鈺新; li-Yu-Sin人臉辨識是電腦視覺裡面一個重要的技術,近幾年由於身分認證,金融卡認證的需求日益增加,傳統的識別方法如密碼,身分證號碼存在可能的風險,而人臉辨識應用在智慧型手機上的需求更是日益漸增,像是身分認證,信用卡認證,手機解鎖,門禁管理,照片庫分類等等,而以手機上不同使用者登入來說,密碼以及圖形的輸入都存在著可以模仿的風險,所以生理特徵作為辨識的方法變得更為安全,也有其存在的必要性,現有的方法很多像是指紋,眼球虹膜,但在這些方法中,人臉辨識所需要的設備最為低價且最容易取得,也相對便宜。 本研究提出一個有效且快速的流程來辨識人臉,做為手機或平板電腦上的多使用者權限控管功能,亦可以應用到其他身分辨識的應用上,由於平板電腦的運算能力相對於一般電腦是較為薄弱的,所以本論文提出特徵擷取運算速度較快的noise-resilient LBP演算法,和特徵群聚法來解決平板電腦上記憶體不足的問題,研究方法共分成四個部分,一開始做人臉偵測找出人臉位置,再對該張人臉做影像前處理來克服不同光線的影響,提出noise-resilient LBP演算法進行特徵擷取,由於訓練集人臉特徵過多,因此本研究亦提出特徵群聚法來找出具有代表性的特徵,最後則是特徵距離相似度計算。Item 基於背景模型的姿勢判斷系統(2011) 李振遠; Chen Yuan Lee姿勢辨識在電腦視覺領域中,特別是針對人體部分是項越來越重要的議題,涵蓋的範圍可分為:手部與手臂的姿勢辨識、頭部與臉部姿勢辨識、整個身體姿勢辨識等種類。在姿勢辨識的問題中,一個很大的瓶頸在於如何在複雜環境下取得所需要的特徵資訊,並且選擇適當的方法將這些資訊完成姿勢辨識。本論文主要目標是在真實的教室裡並且只有一台攝影機拍攝下,能即時(real-time)辨識出講者的手臂姿勢來達到控制投影片的效果,所提出的方法能讓講者在教室投影機照射下,穩定並不受投影機照射並且背景隨著投影片的換頁變化影響下抓取需要的資訊來進行辨識。本論文使用高斯混合背景模(Mixture of Gaussian background model)來擷取出前景(foreground)的輪廓(silhouette)影像,並使用連通元(connected component)將前景輪廓的特徵資訊截取出來,並套入支持向量機(Support Vector Machine,SVM)對手臂動作進行分類。此外,搭配人臉偵測(face detection)方法能分辨出左右手,達到不同手部動作來控制投影片的效果。Item 基於霍夫轉換之複雜名片文字行擷取(2013) 黃郁珊; Yu-Shan Huang由於手持照相機的影像受到光源不均、投影扭曲和震動等外界干擾影響,圖像品質較掃描機所生成的影像為低,加上名片的設計也愈來愈多元,這些都是不利於光學字元辨識(optical character recognition)的因素。本研究目標專注於減少外界因素和名片設計本身的影響,取出名片內的文字部分,分析名片文字行的排列角度並準確切割出文字行。 本研究為一名片影像分析之系統設計,藉由文字偵測和文字行的切割,擷取出單行文字影像。包括三大部份:第一部份為前處理,偵測出名片的文字部份;第二部份為名片文字行方向分析,採用Hough transform當基底,修改成針對特定區域檢測的方式,在名片中同時存在垂直或水平兩種排列方式的文字區塊時,偵測出不同區塊的文字行方向;第三部份為文字行建構,使用第二步驟得到的資訊,由下而上(bottom-up) 擷取完整文字行,最後將得到的文字行影像輸出。 實驗結果以三種OCR(optical character recognition)軟體為例,辨識率增進程度依序為67.87%增為87.52%,其次為62.91%增為72.84%,最後為28.74%增為77.06%,數據證明本研究擷取文字行的方法有效增加OCR軟體的辨識度。Item 學習導向黑板教學影片結構化之研究(2010) 蔡曉瑩; Hsiao-Ying Tsai現今的教室仍然經常使用黑板,而以黑板授課的教學影片亦相當普遍,但黑板教學影片的內容分析在多媒體語意分析的領域深具挑戰性但極少被討論。本論文提出一個基於注意力模型的教學影片結構化方法,用以提醒學習者要投注多少注意力在不同時段的教學影片上。本研究分別設計視覺和聽覺注意力模型以分析影片內容,並利用兩種模型的混合結果產生一個以學習為中心的模型。在視覺分析方面,則以講者寫在黑板上的字跡和講者的講述姿態為分析的內容;而在聽覺分析方面,則以將分析講者的講述語音分析為主。 藉由混合多重注意力模型的結果,產生一個以學習為中心的注意力曲線。以學習為中心的注意力值反映出此段黑板教學影片中講者期望學生投注注意力的程度,也反映語意的強度。因此,學習者可以有彈性且結構化地讀取黑板教學影片,去找到他們應該理解的片段。實驗結果呈現提出的方法可以有效地結構化黑板教學影片,也擷取出與以學習為中心注意力值關聯的教學內容。