資訊工程學系

Permanent URI for this communityhttp://rportal.lib.ntnu.edu.tw/handle/20.500.12235/60

本系前身「資訊教育學系」成立於民國七十四年，首先招收大學部學生，民國九十年成立資訊工程研究所碩士班，而後於民國九十五年進行系、所調整合併為「資訊工程學系」；並於九十六年成立博士班。本系目前每年約招收大學部四十餘人，碩士班六十餘人，博士班約五人，截至民國一百零四年十一月止，總計現有大學部一百九十多人，碩士班一百二十多人，博士班二十三人，合計學生人數約為三百三十多位。

News

系所網址：http://w1.csie.ntnu.edu.tw/

Browse

Search Results

Now showing 1 - 10 of 21

運用類神經網路方法分析基於面向的情感極性分類
(2022) 王皓平; Wang, Hao-Ping
隨著時代以及科技技術的成長，人們不像過去一樣，需要查看報紙、購買雜誌、詢問左右鄰居的情報才能知道自己想要得知的資訊。在科技技術的成長下，不管是餐廳的評價、筆記型電腦的實用程度，大部分的人們都可以使用網際網路來查看是否有所想要的資訊。本論文使用的資料集由SemEval-2014 Task 4官方所提供，並且含有四項子任務：(一) Aspect term extraction、(二) Aspect term polarity、(三) Aspect category detection、(四) Aspect category polarity，本論文進行第二項子任務研究，判斷出句子中的面向詞是正面、負面或中立，評估方式採用Accuracy，並且與當年競賽結果相比較。本論文實驗方法將資料先進行前處理並且轉成詞向量作為輸入的來源，以及將極性做情感標籤，並且使用Bi-LSTM (Bi-directional Long Short-Term Memory)、Self-attention(自注意力機制)及使用Two-level encoding對資料進行訓練。最後去比對每種不同模型的準確率，結果顯示Two-level encoding預測準確率餐廳達82%，筆記型電腦則達78%。
基於深度學習之變韌鐵電子顯微影像中MA島的輕量化分割模型
(2023) 曾柏恩; Tseng, Po-An
本研究提出一個基於深度學習之變韌鐵電子顯微影像中 MA 島的輕量化分割模型，用於在變韌鐵顯微影像中分割麻田散鐵-沃斯田鐵（MA）島。MA 島在預測變韌鐵的抗衝擊性能中起著關鍵作用。傳統的 MA 島評估依賴專家主觀的意見，限制了評估結果的準確性和一致性。因此本研究透過訓練 MA 島分割模型時時融入不同專家的意見，來實現更客觀和穩定的分割結果。而在實際應用中，處理大量高分辨率電子顯微鏡圖像需要的大量計算資源。因此，本研究將如何輕量化模型作為一個重要的研究方向。本系統利用骨幹網路 (backbone network) 從變韌鐵顯微影像中提取相關特徵，接著使用頭部網路 (head network) 進行 MA 島分割。本研究探索兩種不同的骨幹網路，HRNet 和 Lite-HRNet，並進行輕量化的改良以減少模型的複雜性和提高效率。另外對於兩種骨幹網路本研究皆使用 OCRNet 作為頭部網路。對於 HRNet 的輕量化，通過替換 HRNet 的基本構建塊-ResNet 塊為 ConvNeXt 塊，並刪除某些逐點 (pointwise) 卷積層來輕量化 HRNet，最後使用 ECA 模組增強 HRNet 的性能。在 Lite-HRNet 中，通過用 ECA 模組替換 SW 和 CRW 模組，來降低 Lite-HRNet 的參數量以及計算複雜度。實驗結果顯示改良後的 HRNet 與 OCRNet 的組合相較於原始的 HRNet，參數數量和 FLOPs 分別減少 64% 和 27%，同時 MA 島 IoU 達到 78.14%。改良後的 Lite-HRNet 與 OCRNet 的組合相較於原始的 Lite-HRNet，參數數量和 FLOPs 分別減少 4.6% 和 11.66%，同時保持 MA 島 IoU 為 78.09%。由實驗結果發現，本研究所提出的改良方案，在輕量化的同時仍能保持變韌鐵電子顯微影像中 MA 島的分割準確性。
基於深度學習之視覺式即時室內健身輔助系統
(2022) 胡雅雯; Hu, Ya-Wen
近年來人們的健康意識抬頭，越來越多人開始重視規律健身習慣的養成，而進行健身運動中的肌力鍛鍊時，記錄健身的內容是避免受傷及追求進步的重要途徑。因此本研究提出一種基於深度學習之視覺式即時室內健身輔助系統，能夠辨識健身動作並進行重複次數的計算，目的在於協助使用者在不需接觸式設備的情況下更加便利的自動記錄健身內容。視覺式即時室內健身輔助系統可分為三個模組，分別為健身動作辨識模組、動作重複次數計算模組及推理校正模組。本研究使用較適用於行動裝置的改良版Temporal Shift Module來進行健身動作辨識，並利用健身動作辨識神經網路所擷取的特徵圖進行動作重複次數計算，藉由訊號過濾、訊號選擇及峰值過濾演算法篩選出合適的特徵值變化訊號與峰值。最後將動作辨識結果利用短期推理分數和長期校正分數推理校正，使其具備穩定性同時保有使用者對於動作更換的敏感度。當使用者更換動作時，重複次數計算模組的結果將被重置，並輸出整合後的結果。本研究進行實驗的肌力鍛鍊動作共有25種，分別為一般深蹲、相撲深蹲、分腿蹲、前跨步蹲、後跨步蹲、羅馬尼亞硬舉、臀推、橋式、單腳橋式、跪姿伏地挺身、伏地挺身、臥推、仰臥飛鳥、俯身划船、反向飛鳥、肩推、前平舉、側平舉、肱二頭肌彎舉、肱三頭肌伸展、俄羅斯轉體、仰臥起坐、捲腹、交叉捲腹及仰臥抬腿。實驗結果顯示使用CVIU Fitness 25 Dataset在動作辨識的Top 1準確率為90.8%。動作重複次數計算之平均絕對誤差MAEn為8.36%，次數相對誤差MREc為2.55%，在總次數5004次中計次總差異量為183次。系統執行速率約為13 FPS。
以深度學習為基礎之野生動物辨識系統
(2021) 林旭政; LIN, Hsu-Cheng
近年來人們對於動物保育的意識抬頭，越來越多人加入保護野生動物的行列，對於野生動物生態系統進行觀察可以為人們提供保育的方針。目前主要觀察的方法是使用陷阱相機，因為其能夠長時間運行且不對野生動物造成影響。但由於陷阱相機擷取影像數量太過龐大，分析影像變成耗費大量的時間與勞力的枯燥工作。故本研究擬開發一套以深度學習為基礎之野生動物辨識系統，能夠自動辨識與計算影像中動物種類與數量，以期達到輔助分析之結果。野生動物辨識系統使用陷阱相機所攝影像來進行動物物種辨識，透過物件偵測類神經網路模型來辨識影像中野生動物的種類以及數量。本研究使用RefineDet物件偵測模型的改良版來進行動物物種辨識，將野生動物影像輸入本系統後，經由物件偵測類神經網路模型進行動物物種辨識以及數量統計。在改良RefineDet原型架構方面，本研究引入彈性非極值抑制演算法、受納域模塊等改良來提升RefineDet模型對野生動物的辨識能力；另外加入批量正規化技術來加速模型的訓練過程，提升RefineDet的整體效能。本研究使用賽倫蓋蒂陷阱相機資料集(Snapshot Serengeti dataset)[2]所蒐集的影像進行訓練及測試，辨識的野生動物種類共有11種，分別是水牛(Buffalo)、非洲象(African Elephant)、葛氏瞪羚(Grant's Gazelle)、湯氏瞪羚(Thomson's Gazelle)、長頸鹿(Giraffe)、黑斑羚(Impala)、灰頸鷺鴇(Kori Bustard)、獅(Lion)、牛羚(Wildebeest)、斑馬(Zebra)等。實驗結果為本野生動物辨識系統VOC mAP為83.29%，顯示出本研究所提出之野生動物辨識系統確實能夠準確偵測出影像中野生動物物種及數量。
利用深度學習輔助大規模宇宙模擬的視覺化參數空間分析
(2021) 孫誠; Sun, Cheng
宇宙學家經常建立數學模擬模型來研究觀察到的宇宙。隨著計算能力的大幅提升，模擬可以進行更多的細節生成，並減少觀察到的宇宙與模擬結果之間的差異。然而，高保真的模擬運算耗時且給分析帶來不便，特別是當涉及大量的輸入參數組合時。因此，選擇一個能夠滿足分析任務需要的輸入參數組合就成為分析過程的重要部分之一。在這項工作中，我們提出了一個交互式視覺系統。它可以幫助用戶有效地理解大規模宇宙學數據的參數空間，並進一步發現有價值的模擬輸入參數組合。我們的系統利用基於 GAN 的代理模型來重建模擬輸出，而無需運行每個實例都要花費大量時間的原始昂貴模擬模型。我們還提取了基於深度神經網絡的代理模型學習到的信息，以促進參數空間的探索。例如，隱藏層的輸出用於估計輸入參數配置之間的模擬輸出相似性。模擬參數的敏感性是使用反向傳播從代理模型中估計出來的。我們通過多個案例研究證明了我們系統的有效性，包括發現有價值的模擬輸入參數配置和子區域分析。
使用卷積神經網路進行飯店評論的情緒分析
(2021) 蕭承豪; Hsiao, Cheng-Hao
隨著網路與科技的蓬勃發展，產生了愈來愈多的數據與資料，就文字方面，評論方面占著一個很大一定的比例，這些評論的對象大多是人、產品、服務或活動等。其中線上旅遊論壇的興起使網路成為尋求旅行資訊的主要手段。旅行者在社交網站上相互交流並分享他們的觀點和經驗，每天產生大量評論，以至於產生在線酒店評論信息過載的問題。將近95％的旅行者在做出預訂決定之前先閱讀了在線酒店評論，並且超過三分之一的旅行者認為在網上選擇飯時，評論中表達的觀點是最關鍵的因素。因此，有效識別有益性的評論已成為重要的研究課題。本文藉由擷取歐洲飯店515,000條客戶評論的資料做情緒分析，除了做一般的情緒分析，另外抽取詞性當作特徵，分別為完整資料集，只有形容詞跟副詞的形容詞，以及名詞還有動詞的資料集，經過卷積神經網路的訓練，並觀察實驗結果，效能的評估方式以精準率 (Precision)、召回率 (Recall) 和 F1 分數 (F1-measure, F1)作比較。
Towards a Conversational Recommendation System with Item Representation Learning from Reviews
(2021) 林佩萱; Lin, Pei-Hsuan
none
以智慧椅墊進行坐姿分析之研究
(2019) 張雅婷; Chang, Ya-Ting
在現代社會中，大部分人的生活型態，不論是工作或者休息，往往有很長的時間維持坐姿。近年來有越來越多的疾病被證實與久坐有關。許多人認為坐姿是種休息的姿勢，但研究中指出，比起站姿與躺姿，坐姿讓椎間盤承受的壓力更大，而不適當的坐姿則更提升了椎間盤的壓力。由於久坐逐漸成為現代人的生活習慣，所以適當的坐姿就顯得格外的重要。在日常生活中，不適當的坐姿對於大多數的人而言，屬於較為舒適的姿勢，所以往往無心注意自己的坐姿是否適當。故須透過工具協助來了解自己的坐姿情況。本研究設計一智慧椅墊之雛形，旨在透過較低的成本 Arduino開發版與少量的壓力感測器，並且準確的分類使用者的坐姿。過去使用壓力感測器進行坐姿分類的相關研究中，透過傳統的機器學習方法進行坐姿的分類，且使用較多數量的感器收集各類坐姿的資料。準確率落在百分之八十至百分之九十。本研究使用一種傳統機器學習演算法與兩種深度學習之方法進行實驗，找出適合進行坐姿分類之方式，並以特徵選擇實驗找到能夠準確分類坐姿之感測器數量及擺放方式。本研究除了使用限制坐姿使用資料進行坐姿分類模型訓練以及評估初步的分類結果，並透過實際座椅使用情況資料，再次檢視此智慧椅墊在實際使用情形下，亦能有良好的做姿分類表現。透過智慧椅墊設計實驗與特徵選擇實驗，本研究完成一智慧椅墊，使用少量的感測器與基礎的物聯網開發板，降低了硬體成本，達成良好的坐姿分類表現。
基於邊緣計算和深度學習之病媒蚊分類系統
(2019) 洪銘鴻; Hong, Ming-Hong
由於登革熱與日本腦炎是由病毒所引起的一種傳染病，會經由蚊子傳播給人類。在最近一次 2015 年的台南市爆發登革熱的疫情，最初只出現在台南市北部地區，接著以驚人的速度擴散到全台南市，最終蔓延至台灣全島。當年，確診病例超過 4 萬人，死亡病例也高達 218 人，而且未發病的感染者約為發病者的九倍至十倍。若患者再次被病媒蚊叮咬造成交叉感染，則重症死亡率會大幅度提升至 20%以上，而且目前沒有預防疫苗，也沒有特效藥物可治療，而引發登革熱的病媒蚊為埃及斑蚊（Aedes aegypti）與白線斑蚊 (Aedes albopictus)。而日本腦炎的致死率大約為 20%以上，存活病例約有 40%有神經性或精神性的後遺症，而且亦目前沒有特效藥可治療，引發日本腦炎的病媒蚊為三斑家蚊（Culex tritaeniorhynchus）與環蚊家蚊（Culex annulus），避免病媒蚊叮咬是目前唯一的預防登革熱及日本腦炎的方法。為解決登革熱與日本腦炎問題，本篇論文提出病媒蚊分類系統，這是一套影像分類準確率高達 98%以及計數功能的智慧捕蚊系統，其中包含邊緣計算、深度學習的影像處理和電腦視覺，主要功能在邊緣計算為物體偵測，深度學習為斑蚊分類與計數，透過這些步驟，改善了現今捕蚊燈、滅蚊燈不能分類 (Classification)蚊子種類。並以智慧捕蚊裝置收集影像資料，主要資料收集與處理正是引發登革熱的兩種台灣常見的病媒蚊種類──白線斑蚊與埃及斑蚊以及引發日本腦炎的兩種台灣常見的病媒蚊種類──三斑家蚊與環蚊家蚊，並在分類時以斑蚊 (Aedes) 和家蚊 (Culex) 進行二元分類，由於此系統與裝置獲得更多台灣蚊子資訊，其資訊包含進入捕蚊燈的蚊子數量、種類以及時間、地點，以便後續作為對病媒蚊採取措施的重要參考依據。
多重樂器自動採譜之探討
(2020) 吳宥德; Wu, Yu-Te
自動音樂採譜 (Automatic Music Transcription, AMT)是音樂資訊檢索 (Music Information Retrieval, MIR)中最重要的任務之一,由於其訊號的複雜性,它已被視為訊號處理中最具挑戰性的領域之一。在許多 AMT 任務中,多樂器採譜任務是通用採譜系統的關鍵步驟之一,但相關領域的研究卻很少。模型必須在一首樂曲當中,同時辨識多種樂器和其相應音高,而其中包括了不同樂器的各種音色和豐富的諧波(Harmonics),可能導致訊號彼此相互干擾,造成更為複雜的情況,因此與傳統的單樂器採譜研究相比,多樂器採譜成為了一個更進階且複雜的問題。除了存在技術本質上的困難,統整與協調不同層次的採譜問題、處理複雜的交互影響,也需要更加清晰與明確的問題定義,並針對最後的結果發展一套有效的評估方法。在這項研究中,我們提出了一個多樂器自動採譜的方法。藉由發展一套從訊號層級的特徵工程、到最終評估結果的端到端流程,整合了多項技術以更好的處理此複雜的問題。當中結合了能夠清楚顯現音高特徵的訊號處理技術、新穎的深度學習模型,以及從多目標識別(Multi-object Recognition),實例分割(Instance Segmentation)、計算機視覺中,圖到圖轉換所激發出來的概念,進一步整合新發展的後處理演算法,提出來的系統對於多樂器採譜中的所有子任務,呈現出通用彈性且十分有效率的表現。在針對不同子任務進行綜合評估後,於各項指標上皆表現出了至今為止最優的結果,其中包括了過去從未被研究的多樂器音符層級採譜任務(Note-level Transcription)。

資訊工程學系

News

Browse

Filters

Settings

Sort By

Results per page

Search Results