資訊工程學系

Permanent URI for this communityhttp://rportal.lib.ntnu.edu.tw/handle/20.500.12235/60

本系前身「資訊教育學系」成立於民國七十四年,首先招收大學部學生,民國九十年成立資訊工程研究所碩士班,而後於民國九十五年進行系、所調整合併為「資訊工程學系」;並於九十六年成立博士班。本系目前每年約招收大學部四十餘人,碩士班六十餘人,博士班約五人,截至民國一百零四年十一月止,總計現有大學部一百九十多人,碩士班一百二十多人,博士班二十三人,合計學生人數約為三百三十多位。

News

Browse

Search Results

Now showing 1 - 3 of 3
  • Item
    探究基於異質圖和上下文語言模型之自動文件摘要技術
    (2022) 林筱芸; Lin, Hsiao-Yun
    由於網路蓬勃發展,每日都會產生成千上萬筆的文字訊息,但不是每個人都有時間逐一瀏覽,因此我們需要一個技術來幫助我們快速的理解每篇文章中的重要內容。自動文件摘要技術油然而生,該技術可以幫助我們從單一或數個文檔中迅速且準確地擷取關鍵的信息。自動摘要方法可以分為兩種類型:節錄式抽取式(extractive)摘要與重寫式(abstractive)摘要。前者將文章中重要的句子提取出來構成摘要內容,後者則是在理解文章內容後重建文章成字數精簡且富含重點的摘要結果。本論文的目標是建立一個能提取語意的節錄抽取式摘要模型,且其摘要句之間具有較少的冗餘。本文使用基於圖的神經網絡(graph-based neural networks, GNN)來學習富含上下文語意的句嵌入。圖在真實世界應用上,通常會具有多種不同性質的節點,因此我們使用異構圖神經網絡(heterogeneous graph neural network, HGNN)作為我們的基礎,並從三個不同的面向來提升模型效能。首先,在編碼階段(encoding stage),我們致力於在此時期加入更多的資訊。例如,我們使用基於雙向編碼器表示的變形器(bidirectional encoder representation from transformers, BERT)的語言模型,來提供摘要模型更多的上下文資訊。除此之外,句子與句子之間的關係,或是句子本身的內部關係等,這些句子屬性皆會在此階段納入考量。緊接著,在句子評分(sentence rescoring)的階段,我們提供了幾種重新評分的方法。其中,我們可以將句子在文章中的順序納入考量,但必須經過標準化以減少誤差。最後,在挑選句子(sentence selection)的階段,我們改善了句子挑選器來減少冗餘。實驗結果證明,此論文提出的各式方法在公開的摘要集中,皆獲得相當不錯的成效。
  • Item
    應用階層式語意暨聲學特徵表示於語音文件摘要之研究
    (2019) 劉慈恩; Liu, Tzu-En
    由於巨量資訊的快速傳播,如何有效率地瀏覽資料是ㄧ項重要的課題。對於多媒體文件而言,語音是其內容中具有語意的主要元素之一,能夠相當完整的表達整份多媒體文件。近年來,有許多研究紛紛針對多媒體文件的理解與檢索進行深入的研究探討,並且有優異的成果與貢獻,如影像摘要、音訊摘要及影片摘要。 文件摘要可概分為節錄式 (Extractive) 和重寫式 (Abstractive) 摘要。其中節錄式摘要會依固定的比例,從文件中選出具代表性的文句組成其摘要結果;而重寫式摘要主要會先完整理解整份文件中的隱含意義,之後會根據其隱含意義,並使用不同的文詞,產生一個簡短版本的文件描述即為摘要。由於重寫式摘要對於自動語音摘要任務的困難度較高,故目前的研究大多是以節錄式摘要方式為主流。 本論文主要探討新穎的節錄式摘要方法於語音文件摘要任務上的應用,並深入研究如何改善語音文件摘要之成效。因此,我們提出以類神經網路為基礎之摘要摘要模型,運用階層式的架構及注意力機制深層次地理解文件蘊含的主旨,並以強化學習輔助訓練模型根據文件主旨選取並排序具代表性的語句組成摘要。同時,我們為了避免語音辨識的錯誤影響摘要結果,也將語音文件中相關的聲學特徵加入模型訓練以及使用次詞向量作為輸入。最後我們在中文廣播新聞語料(MATBN)上進行一系列的實驗與分析,從實驗結果中可驗證本論文提出之假設且在摘要成效上有顯著的提升。
  • Item
    使用多種鑑別式模型以及特徵資訊於語音文件摘要之研究
    (2010) 張鈺玫; Yu Mei Chang
    已有許多機器學習的摘要方法被應用於語音文件摘要,它們通常將文件摘要視分類問題(分兩類),嘗試從文件中挑選重要的語句做為摘要結果;然而,訓練語料不平衡的問題有時會影響這些摘要方法的效能。另一方面,藉由以增進分類正確率而訓練的摘要方法並不見得擁有較好的摘要結果。鑑於此種現象,本論文首先探討使用兩個不同的訓練準則的摘要方法,以減輕上述問題所造成的負面影響,並且得以提高摘要效能。其一為將訓練文件中成對語句之間的重要性排序資訊,做為摘要方法訓練之依據;另一則以直接最大化其摘要評估分數為準則做為計摘要方法訓練之依據。另外,一些訓練語句和特徵選取的方法也在本論文被廣泛地研究與比較。摘要實驗是在中文廣播新聞上進行;我們發現所使用的兩種訓練準則皆能夠展現出比基礎實驗方法較好的結果,但於訓練語句以及特徵選取方法似乎並不能顯地改善摘要效能。