學術產出-Books & Chapters in Books

Article View/Open

Publication Export

Google ScholarTM

政大圖書館

Citation Infomation

  • No doi shows Citation Infomation
題名 自然語言處理技術於中文史學文獻分析之初步應用
其他題名 An Exploration of Analyzing Historical Chinese Documents with Natural Language Processing Techniques
作者 劉昭麟
貢獻者 資科系
關鍵詞 詞頻分析、共現詞組、齊夫定律、詞彙權重、詞組權重
日期 2012.12
上傳時間 20-Jun-2014 16:39:13 (UTC+8)
摘要 自然語言處理是計算機科學中具有相當歷史的學科,過去主要應用於分析與處理現代文字語料。文字作為人類溝通與記錄的主要工具,詞意與語法都與時俱進。因此,處理現代文字語料的計算技術,不見得可以立即應用於歷史語料的處理工作。本文以中國近現代思想及文學史數據庫為例,實驗如何利用自然語言處理技術輔助史學研究。我們利用PAT Tree 技術從大量史料中,透過專家的協助來擷取與史學研究相關的詞彙,進一步分析詞彙的語境與共現的現象,最終估計個別文件與研究議題相關度,希望藉此輔助學者以比較有效率的方式,覓得相關的史學文件和分析文件內容。
關聯 數位人文要義 : 尋找類型與軌跡 = Essential digital humanities : defining patterns and paths, 臺灣大學出版中心, pp.61-82
國際標準書號 9789860342369
資料類型 book/chapter
dc.contributor 資科系en_US
dc.creator (作者) 劉昭麟zh_TW
dc.date (日期) 2012.12en_US
dc.date.accessioned 20-Jun-2014 16:39:13 (UTC+8)-
dc.date.available 20-Jun-2014 16:39:13 (UTC+8)-
dc.date.issued (上傳時間) 20-Jun-2014 16:39:13 (UTC+8)-
dc.identifier.uri (URI) http://nccur.lib.nccu.edu.tw/handle/140.119/66795-
dc.description.abstract (摘要) 自然語言處理是計算機科學中具有相當歷史的學科,過去主要應用於分析與處理現代文字語料。文字作為人類溝通與記錄的主要工具,詞意與語法都與時俱進。因此,處理現代文字語料的計算技術,不見得可以立即應用於歷史語料的處理工作。本文以中國近現代思想及文學史數據庫為例,實驗如何利用自然語言處理技術輔助史學研究。我們利用PAT Tree 技術從大量史料中,透過專家的協助來擷取與史學研究相關的詞彙,進一步分析詞彙的語境與共現的現象,最終估計個別文件與研究議題相關度,希望藉此輔助學者以比較有效率的方式,覓得相關的史學文件和分析文件內容。en_US
dc.format.extent 383 bytes-
dc.format.mimetype text/html-
dc.language.iso en_US-
dc.relation (關聯) 數位人文要義 : 尋找類型與軌跡 = Essential digital humanities : defining patterns and paths, 臺灣大學出版中心, pp.61-82en_US
dc.relation (關聯) 國際標準書號 9789860342369en_US
dc.subject (關鍵詞) 詞頻分析、共現詞組、齊夫定律、詞彙權重、詞組權重en_US
dc.title (題名) 自然語言處理技術於中文史學文獻分析之初步應用zh_TW
dc.title.alternative (其他題名) An Exploration of Analyzing Historical Chinese Documents with Natural Language Processing Techniquesen_US
dc.type (資料類型) book/chapteren