學習資訊專業學院—圖書資訊學研究所

Permanent URI for this communityhttp://rportal.lib.ntnu.edu.tw/handle/20.500.12235/22

國立臺灣師範大學(本校)於民國四十四年成立社會教育學系圖書資訊學組,為臺灣最早成立之圖書資訊學相關科系。為培育知識經濟社會所需之高階圖書資訊服務人才,本校於民國九十一年成立圖書資訊學之獨立研究所(本所),隸屬本校教育學院,招收一般碩士生。

為提供在職圖書資訊服務人員之進修管道,本所於民國九十四年續接社會教育學系(社教系)之「圖書資訊學碩士學位在職專班(週末班)」及「學校圖書館行政碩士在職專班(暑期班)」,以培育具備資訊科技知能之圖書資訊服務人才。

為進一步推動跨領域合作,本所於民國九十五年與本校美術系、歷史系、國文系及產業界專家等共同籌設「數位內容與創新應用學分學程」,以培育兼具數位內容創作與加值應用之人才。因應圖書資訊學研究之變遷與知識服務產業之發展趨勢,本所於民國九十七年奉教育部核准成立博士班,並於民國九十八年招收第一屆博士生,以培育兼具圖書資訊學學術研究與管理領導能力之人才。

Browse

Search Results

Now showing 1 - 1 of 1
  • Item
    開放取用學術資源的自動化擷取系統實作:以臺灣人文社會領域期刊資料為例
    (2025) 余宗翰; Yu, Zong-Han
    本研究旨在建置一套可穩定運作且具高度擴展性的自動化學術資源擷取系統,針對臺灣人文社會領域開放取用期刊進行抓取。現行國內引文索引資料庫多仰賴人工建檔與維護,導致資料更新與整合流程費時費力;而開放取用平台則受限於期刊端主動上架與維運意願,造成資料時效與涵蓋範圍不足,進而影響學術資源的可用性與知識庫建構的穩定性。為此,本研究設計並實作「Social and Theoretical Academic Repository(STAR)」系統,結合 Scrapy 爬蟲框架與 Docker 容器化部署技術,整合 MySQL、Redis、Django、Playwright、FTP 等模組,建立排程式爬取、結構化檔案儲存與網頁式管理操作的自動化平台。系統具備網頁式管理介面,支援管理者透過 Django 後台調整排程或即時執行爬蟲任務,亦提供 FTP 批次下載功能供使用者取得期刊全文檔案。系統完成部署後共建置 46 支期刊爬蟲模組,成功擷取 17,865 篇 PDF 文章檔案,總容量達 79 GB。比較首次與後續爬取平均耗時,整體處理效率提升 73.4 %,顯示系統具備長期穩定運作與低維運負擔的特性。本研究驗證了以模組化容器架構整合開源爬蟲技術,能有效支援多網站資料擷取與期刊資料彙整之需求,並為後續文本生成、語意比對與知識問答等應用場景,提供可重複使用之期刊資料擷取基礎。未來可進一步結合語意嵌入與文本分析工具,拓展資料加值應用場景。