學術產出-Theses

Article View/Open

Publication Export

Google ScholarTM

政大圖書館

Citation Infomation

題名 網路論壇議論檔案事件主題及其情感傾向分析
Subject Mining and Sentiment Analysis of Archival Events in the Internet Forum
作者 李育賢
Lee, Yu-Hsien
貢獻者 林巧敏
Lin, Chiao-Min
李育賢
Yu-Hsien Lee
關鍵詞 數位人文
檔案管理
網路論壇
文字探勘
情感分析
Digital humanities
Archival management
Internet forums
Text mining
Sentiment analysis
日期 2022
上傳時間 2-Sep-2022 14:59:37 (UTC+8)
摘要 大眾的意見經常是公務機關提供服務的參考依據,網路論壇及社群媒體成為了公民發揮「公共性」的場所,因此,本研究欲借助數位人文方法與數位工具,探討網路論壇中有關檔案議題的貼文,在巨觀以及微觀的視角中,對其內容所呈現的主題、情感、脈絡、關聯,加以剖析並探討網路論壇的輿情走勢。
本研究以想想論壇、風傳媒、關鍵評論網及鳴人堂,四家網路論壇為資料來源,蒐集2012年至2021年之間,共586筆檔案主題貼文。首先透過中研院CKIP Tagger進行文本預處理後,分別使用WEKA、CORPRO、CVAW4.0及Gephi數位工具,依序進行主題分析、語料庫分析、情感分析及社會網絡分析,多面向剖析網路輿情。
研究結果顯示,網路論壇中常被討論的檔案議題為「檔案解密公開」、「轉型正義與政治檔案」、「歷史研究」、「檔案推廣應用」與「檔案稽憑功能」,其中「檔案解密公開」占比最多;從檔案輿論關鍵字的高共現詞彙可以觀察出,近十年網路中的檔案輿論,與政治事件高度相關;透過情感分析,得知網路論壇檔案文本的情感傾向整體呈現負面,且在主題之間、論壇來源之間呈現差異,加入時間軸可以探得歷史脈絡變化,藉此提供檔案主管機關推動檔案解密公開以及提升檔案應用服務作業之參考。
Public opinions are often used as a reference by government agencies in order to provide services to citizens. Internet forums and social media platforms have evolved into places where people can exercise their "publicness." In this research, the public opinion patterns in each of the four representative Taiwanese forums are examined together with the themes, sentiments, contexts, and associations presented by the posts on each of the four forums.
A total of 586 posts from four internet forums were collected for this study between 2012 and 2021. The four internet forums are "Thinking-Taiwan", "The Storm Media", "The News Lens", and "Opinion". As a pre-processing procedure, the study analyzed the posts with CKIP Tagger. After that, digital tools like WEKA, CORPRO, CVAW4.0, and Gephi were used to break down the online public opinions from multiple perspectives. The study then conducted research including topic analysis, corpus analysis, sentiment analysis, and social network analysis.
The results indicate that "declassification and disclosure of archives," "transformational justice and political archives," "historical research," "archival promotion and application," and "archival audit function" are the four internet forums` most frequently discussed archival topics, with "declassification and disclosure of archives" accounting for the majority of these discussions. Through sentiment analysis, we can see that internet forum texts tend to be read negatively as a whole. However, the topics and forum sources offer varying degrees of the strength of the sentiments. Additionally, by including the timeline, we can help to understand the historical changes. This study hopes to be served as a guide for archival authorities to promote the declassification and disclosure of archives and enhance application services for the archives.
參考文獻 一、中文部份
丁曉陽、王蘭成(2021)。網路論壇文本特徵詞權重計算優化方法研究。情報理論與實踐,2021(5),187-192。
王嵐霞、李高峰(2007)。內容分析法在圖書情報領域中的應用與展望。新世紀圖書館,2007(1),16-18。
王貿(2020)。公務人員關注議題之文字探勘:以PTT公職板為例。大數據與資料科學特刊,45,119-154。
王毓莉(2007)。網路論壇與國家機器的碰撞:從三個新聞事件看大陸網路論壇對公共性的實踐。新聞學研究,92,37-95。
王麗蕉(2018)。數位檔案系統在人文研究的應用:以總督府職員錄系統觀察臺灣女力公職發展。圖資與檔案學刊,10(1),44-66。
江婉琪等(2019)。運用文字探勘分析全民健保與五項總額支付制度之民眾知覺感受。台灣衛誌,38(2),189-202。
余采蓓、施俊名、郭洪國雄(2019)。運用文字探勘技術探討性相關議題之研究―以PTT論壇 feminine_sex板為例。性學研究,9(2),63-89。
吳乃德、吳叡人、顏厥安、吳志光(2007)。轉型正義對檔案開放應用影響之報告。檔案局委託研究報告,未出版。
吳玫(2004)。中文網路論壇的資訊流動。二十一世紀雙月刊,81,113-123。
李松濤(2020)。數字人文視角下人文研究者利用檔案館藏的行為與激勵研究〔未出版之碩士論文〕。吉林大學管理學院。
周立柱、賀宇凱、王建勇(2008)。情感分析研究綜述。計算機應用,28(11),2725-2728。
林巧敏、王立勛(2021)。黨史檔案數位典藏作業及其數位人文工具應用經驗。圖資與檔案學刊,13(1),172-205。
林昆賢、蔡俊明(2019)。基於深度學習的自然語言處理中預訓練 Word2Vec 模型的研究。國教新知,66(1),15-31。
林施望(2019)。從「人文計算」到「數字人文」——概念與研究方式的變遷。圖書館論壇,2019(8),12-20。
林嶔(2021)。詞嵌入模型與其深度學習應用。檢自:https://linchin.ndmctsgh.edu.tw/Deep%20Learning-Theory%20and%20Practice/Lesson%2013/Lesson_13.html#(1)
邵軒磊(2019)。機器學「習」:以文字探勘法探索習近平時期之大外宣戰略。中國大陸研究,62(4),133-157。
邵軒磊、曾元顯(2018)。文字探勘技術輔助主題分析--以「中國大陸研究」期刊為例。問題與研究,57,29-62。
張奕萱(2021)。運用數位人文工具進行網路論壇之檔案主題及情感探勘〔未出版之碩士論文〕。國立政治大學圖書資訊與檔案學研究所。
郭文平(2020)。語料庫輔助的媒體論述分析:以台灣平面媒體中國夢報導為語料的實證研究。資訊社會研究,38,51-92。
陳志銘(2021)。類神經網路分類器(課堂講義)。檢自:https://moodle-demo-course.dlll.nccu.edu.tw/course/view.php?id=15
陳志銘(2021)。社會網絡分析(課堂講義)。檢自:https://moodle-demo-course.dlll.nccu.edu.tw/course/view.php?id=15
陳育正、孫懋嘉、顧志文與林立偉(2020)。由社群媒體的觀點論習近平主政後對臺統戰策略對我國民眾的影響:以對臺31項措施為例。中國大陸研究,63(2),111-150。
陳良駒、傅振華、楊誌瑋(2010)。詞彙共現分析在中國大陸信息作戰領域發展之實證研究。中國大陸研究,53(2),111-145。
陳勇汀(2021)。巨量資料之文字探勘實作。檢自:https://docs.google.com/document/d/e/2PACX-1vTELeEVBh_yOKaQPqgVRc-bM7Tcc3AYJtYl6O7QZR6uwksbHwzLGywvfvvmd0UMn-SbMX4ycbvHpNhq/pub
陳迪、程朗、王志鋒、熊錦鵬、張玉茹、梨高贊(2021)。論壇情感挖掘研究粽述:現狀、挑戰與趨勢。計算機工程與應用,57(17),17-28。
陳雅文(1995)。圖書館學與資訊科學大辭典。檢自:https://terms.naer.edu.tw/detail/1683205/
陶治中、陳亭愷(2016)。社群運算應用於網路輿情情感傾向分析之研究-實施國道計程電子收費政策為例。運輸學刊,28(3),295-334。
陶治中、簡睿志(2016)。三元決策理論應用於社群媒體挖掘之情感分析-以 UBER 在臺營運話題為例。運輸計劃季刊,45(4),301-330。
曾元顯(2012)。圖書館學與資訊科學大辭典。檢自:https://terms.naer.edu.tw/detail/1678993/
程嵐嵐、何丕廉、孫越桓(2005)。基於朴素貝葉斯模型的中文關鍵詞提取算法研究。計算機應用,25(12),2780-2782。
項潔、涂豐恩(2011)。從保存到創造:開啟數位人文研究,國立臺灣大學出版中心。
項潔、翁稷安(2012)。數位人文要義:尋找類型與軌跡。國立臺灣大學出版中心。
項潔、薛弼心(2018)。科技部「數位人文推廣計畫」概述。人文與社會科學簡訊,19(2),86-92。
黃韋菱(2020)。數位人文系統中之檔案加值應用研究〔未出版之碩士論文〕。國立政治大學圖書資訊與檔案學研究所。
黃筠芝(2020)。檔案主題新聞之數位人文研究〔未出版之碩士論文〕。國立政治大學圖書資訊與檔案學研究所。
褚乃慈(2020)。台灣獨立樂團歌詞與樂迷留言內容之情緒分析。〔未出版之博士論文〕。世新大學資訊傳播學系。
劉嘉薇(2017)。網路統獨的聲量研究:大數據的分析。政治科學論叢,71,113-166。
闕河嘉、陳光華(2016)。庫博中文獨立語料庫分析工具之開發與應用。數位人文研究與技藝第六輯,285-313。
黎彥彣(2019)。基於多方面的情感分析模型之共同處理方法〔未出版之碩士論文〕。國立臺灣科技大學電機工程系研究所。
薛化元、江子陽(2020)。轉型正義的數位人文取徑嘗試:以傅正在自由中國有關黨產議題文章為例。黨產研究,5,175-201。
薛理桂(2012)揭開檔案的神秘面紗: 後典藏時代的檔案推廣與應用。全國新書資訊月刊,101(5),48-49。
鄭君、馬曉君、華強(2014)。社會網絡分析工具Ucinet和Gephi的比較研究。情報理論與實踐,37(8),133-138。

二、西文部份
Ashok N. Srivastava, Mehran Sahami (2009).Text Mining Classification, Clustering, and Applications.London: Chapman and Hall/CRC.
Berry, David M.(2012).Understanding Digital Humanities. London: Palgrave MacMillan.
Blake, C. (2011). Text mining. Annual Review of Information Science and Technology, 45(1), 121-155.
Dave, Kushal, Lawrence S. and Pennock D. “Mining the Peanut Gallery: Opinion Extraction and Semantic Classification of Product Reviews.” In Proceedings of the 12th International Conference on World Wide Web, WWW 2003, pp. 519-528, 2003.
Duriau, Reger, & Pfarrer, (2007). A Content Analysis of the Content Analysis Literature in Organization Studies: Research Themes, Data Sources, and Methodological Refinements.Organization Research Methods,10:5–34.Retrieved from https://www.terry.uga.edu/contentanalysis/research-and-methodology.php
Feldman, R., & Sanger, J. (2007). The text mining handbook: advanced approaches in analyzing unstructured data. Cambridge University Press.
Grimmer, J., & Stewart, B. (2013). Text as Data: The Promise and Pitfalls of Automatic Content Analysis Methods for Political Texts. Political Analysis, 21(3), 267-297. doi:10.1093/pan/mps028
Hajrizi, R., & Nuçi, K.P. (2020). Aspect-Based Sentiment Analysis in Education Domain. ArXiv, abs/2010.01429. 
Jin-Cheon Na, Tun Thura Thet, Arie Hans Nasution, Fauzi Munif Hassan(2022). A Sentiment-Based Digital Library of Movie Review Documents Using Fedora.Canadian Journal of Information and Library Science ,35(3):307-337.
Olga Kolchyna, Tharsis T. P. Souza, Philip Treleaven, Tomaso Aste.Twitter Sentiment Analysis: Lexicon Method, Machine Learning Method and Their Combination.Handbook of Sentiment Analysis in Finance. Mitra, G. and Yu, X. (Eds.)
Park, Sejung; Bier, Lindsey M.; Park, Han Woo (2021). The effects of infotainment on public reaction to North Korea using hybrid text mining: Content analysis, machine learning-based sentiment analysis, and co-word analysis. Profesional de la información, v. 30, n. 3, e300306.
Patrik Svensson . Humanities Computing as Digital humanities[EB/OL]. [2018-11-29]. http:// digitalhumanities.org/dhq/vol/3/3/000065/000065.html.
Rahmad Agus Dwianto, Achmad Nurmandi,& Salahudin Salahudin.The Sentiments Analysis of Donald Trump and Jokowi’s Twitters on Covid-19 Policy Dissemination.Webology, 18(1), 388-405.
Rosenzweig, R. (2003). Scarcity or Abundance? Preserving the Past in a Digital Era. American Historical Review 108(3), 735-762.Russell, J. A. (1980). A Circumplex Model of Affect. Journal of Personality and Social Psychology, 39(6), 1161–1178. doi: 10.1037/h0077714
Sultan M. Al-Daihania, Alan Abrahams. Analysis of Academic Libraries` Facebook Posts: Text and Data Analytics. The Journal of Academic Librarianship, 44(2), 1-10.
描述 碩士
國立政治大學
圖書資訊與檔案學研究所
109155011
資料來源 http://thesis.lib.nccu.edu.tw/record/#G0109155011
資料類型 thesis
dc.contributor.advisor 林巧敏zh_TW
dc.contributor.advisor Lin, Chiao-Minen_US
dc.contributor.author (Authors) 李育賢zh_TW
dc.contributor.author (Authors) Yu-Hsien Leeen_US
dc.creator (作者) 李育賢zh_TW
dc.creator (作者) Lee, Yu-Hsienen_US
dc.date (日期) 2022en_US
dc.date.accessioned 2-Sep-2022 14:59:37 (UTC+8)-
dc.date.available 2-Sep-2022 14:59:37 (UTC+8)-
dc.date.issued (上傳時間) 2-Sep-2022 14:59:37 (UTC+8)-
dc.identifier (Other Identifiers) G0109155011en_US
dc.identifier.uri (URI) http://nccur.lib.nccu.edu.tw/handle/140.119/141615-
dc.description (描述) 碩士zh_TW
dc.description (描述) 國立政治大學zh_TW
dc.description (描述) 圖書資訊與檔案學研究所zh_TW
dc.description (描述) 109155011zh_TW
dc.description.abstract (摘要) 大眾的意見經常是公務機關提供服務的參考依據,網路論壇及社群媒體成為了公民發揮「公共性」的場所,因此,本研究欲借助數位人文方法與數位工具,探討網路論壇中有關檔案議題的貼文,在巨觀以及微觀的視角中,對其內容所呈現的主題、情感、脈絡、關聯,加以剖析並探討網路論壇的輿情走勢。
本研究以想想論壇、風傳媒、關鍵評論網及鳴人堂,四家網路論壇為資料來源,蒐集2012年至2021年之間,共586筆檔案主題貼文。首先透過中研院CKIP Tagger進行文本預處理後,分別使用WEKA、CORPRO、CVAW4.0及Gephi數位工具,依序進行主題分析、語料庫分析、情感分析及社會網絡分析,多面向剖析網路輿情。
研究結果顯示,網路論壇中常被討論的檔案議題為「檔案解密公開」、「轉型正義與政治檔案」、「歷史研究」、「檔案推廣應用」與「檔案稽憑功能」,其中「檔案解密公開」占比最多;從檔案輿論關鍵字的高共現詞彙可以觀察出,近十年網路中的檔案輿論,與政治事件高度相關;透過情感分析,得知網路論壇檔案文本的情感傾向整體呈現負面,且在主題之間、論壇來源之間呈現差異,加入時間軸可以探得歷史脈絡變化,藉此提供檔案主管機關推動檔案解密公開以及提升檔案應用服務作業之參考。
zh_TW
dc.description.abstract (摘要) Public opinions are often used as a reference by government agencies in order to provide services to citizens. Internet forums and social media platforms have evolved into places where people can exercise their "publicness." In this research, the public opinion patterns in each of the four representative Taiwanese forums are examined together with the themes, sentiments, contexts, and associations presented by the posts on each of the four forums.
A total of 586 posts from four internet forums were collected for this study between 2012 and 2021. The four internet forums are "Thinking-Taiwan", "The Storm Media", "The News Lens", and "Opinion". As a pre-processing procedure, the study analyzed the posts with CKIP Tagger. After that, digital tools like WEKA, CORPRO, CVAW4.0, and Gephi were used to break down the online public opinions from multiple perspectives. The study then conducted research including topic analysis, corpus analysis, sentiment analysis, and social network analysis.
The results indicate that "declassification and disclosure of archives," "transformational justice and political archives," "historical research," "archival promotion and application," and "archival audit function" are the four internet forums` most frequently discussed archival topics, with "declassification and disclosure of archives" accounting for the majority of these discussions. Through sentiment analysis, we can see that internet forum texts tend to be read negatively as a whole. However, the topics and forum sources offer varying degrees of the strength of the sentiments. Additionally, by including the timeline, we can help to understand the historical changes. This study hopes to be served as a guide for archival authorities to promote the declassification and disclosure of archives and enhance application services for the archives.
en_US
dc.description.tableofcontents 第一章 緒論 1
第一節 研究動機 1
第二節 研究目的 2
第三節 研究問題 2
第四節 研究範圍與限制 3
第五節 名詞解釋 3
第二章 文獻探討 5
第一節 數位人文研究發展 5
第二節 網路論壇相關研究 10
第三節 文字探勘工具與運用 12
第四節 情感意涵相關研究分析 19
第三章 研究設計與實施 24
第一節 研究架構 24
第二節 研究方法 26
第三節 研究對象 27
第四節 研究工具 32
第五節 研究實施步驟 35
第六節 資料處理與分析 38
第四章 研究結果與分析 40
第一節 文本處理過程分析 40
第二節 網路輿論檔案主題分析 70
第三節 網路輿情內容語料分析 80
第四節 網路檔案輿情情感分析 87
第五節 綜合討論 97
第五章 結論與建議 99
第一節 結論 99
第二節 建議 100
第三節 未來研究建議 102
參考文獻 103
附錄:本研究對象586篇檔案主題網路論壇文本 109
zh_TW
dc.format.extent 12428992 bytes-
dc.format.mimetype application/pdf-
dc.source.uri (資料來源) http://thesis.lib.nccu.edu.tw/record/#G0109155011en_US
dc.subject (關鍵詞) 數位人文zh_TW
dc.subject (關鍵詞) 檔案管理zh_TW
dc.subject (關鍵詞) 網路論壇zh_TW
dc.subject (關鍵詞) 文字探勘zh_TW
dc.subject (關鍵詞) 情感分析zh_TW
dc.subject (關鍵詞) Digital humanitiesen_US
dc.subject (關鍵詞) Archival managementen_US
dc.subject (關鍵詞) Internet forumsen_US
dc.subject (關鍵詞) Text miningen_US
dc.subject (關鍵詞) Sentiment analysisen_US
dc.title (題名) 網路論壇議論檔案事件主題及其情感傾向分析zh_TW
dc.title (題名) Subject Mining and Sentiment Analysis of Archival Events in the Internet Forumen_US
dc.type (資料類型) thesisen_US
dc.relation.reference (參考文獻) 一、中文部份
丁曉陽、王蘭成(2021)。網路論壇文本特徵詞權重計算優化方法研究。情報理論與實踐,2021(5),187-192。
王嵐霞、李高峰(2007)。內容分析法在圖書情報領域中的應用與展望。新世紀圖書館,2007(1),16-18。
王貿(2020)。公務人員關注議題之文字探勘:以PTT公職板為例。大數據與資料科學特刊,45,119-154。
王毓莉(2007)。網路論壇與國家機器的碰撞:從三個新聞事件看大陸網路論壇對公共性的實踐。新聞學研究,92,37-95。
王麗蕉(2018)。數位檔案系統在人文研究的應用:以總督府職員錄系統觀察臺灣女力公職發展。圖資與檔案學刊,10(1),44-66。
江婉琪等(2019)。運用文字探勘分析全民健保與五項總額支付制度之民眾知覺感受。台灣衛誌,38(2),189-202。
余采蓓、施俊名、郭洪國雄(2019)。運用文字探勘技術探討性相關議題之研究―以PTT論壇 feminine_sex板為例。性學研究,9(2),63-89。
吳乃德、吳叡人、顏厥安、吳志光(2007)。轉型正義對檔案開放應用影響之報告。檔案局委託研究報告,未出版。
吳玫(2004)。中文網路論壇的資訊流動。二十一世紀雙月刊,81,113-123。
李松濤(2020)。數字人文視角下人文研究者利用檔案館藏的行為與激勵研究〔未出版之碩士論文〕。吉林大學管理學院。
周立柱、賀宇凱、王建勇(2008)。情感分析研究綜述。計算機應用,28(11),2725-2728。
林巧敏、王立勛(2021)。黨史檔案數位典藏作業及其數位人文工具應用經驗。圖資與檔案學刊,13(1),172-205。
林昆賢、蔡俊明(2019)。基於深度學習的自然語言處理中預訓練 Word2Vec 模型的研究。國教新知,66(1),15-31。
林施望(2019)。從「人文計算」到「數字人文」——概念與研究方式的變遷。圖書館論壇,2019(8),12-20。
林嶔(2021)。詞嵌入模型與其深度學習應用。檢自:https://linchin.ndmctsgh.edu.tw/Deep%20Learning-Theory%20and%20Practice/Lesson%2013/Lesson_13.html#(1)
邵軒磊(2019)。機器學「習」:以文字探勘法探索習近平時期之大外宣戰略。中國大陸研究,62(4),133-157。
邵軒磊、曾元顯(2018)。文字探勘技術輔助主題分析--以「中國大陸研究」期刊為例。問題與研究,57,29-62。
張奕萱(2021)。運用數位人文工具進行網路論壇之檔案主題及情感探勘〔未出版之碩士論文〕。國立政治大學圖書資訊與檔案學研究所。
郭文平(2020)。語料庫輔助的媒體論述分析:以台灣平面媒體中國夢報導為語料的實證研究。資訊社會研究,38,51-92。
陳志銘(2021)。類神經網路分類器(課堂講義)。檢自:https://moodle-demo-course.dlll.nccu.edu.tw/course/view.php?id=15
陳志銘(2021)。社會網絡分析(課堂講義)。檢自:https://moodle-demo-course.dlll.nccu.edu.tw/course/view.php?id=15
陳育正、孫懋嘉、顧志文與林立偉(2020)。由社群媒體的觀點論習近平主政後對臺統戰策略對我國民眾的影響:以對臺31項措施為例。中國大陸研究,63(2),111-150。
陳良駒、傅振華、楊誌瑋(2010)。詞彙共現分析在中國大陸信息作戰領域發展之實證研究。中國大陸研究,53(2),111-145。
陳勇汀(2021)。巨量資料之文字探勘實作。檢自:https://docs.google.com/document/d/e/2PACX-1vTELeEVBh_yOKaQPqgVRc-bM7Tcc3AYJtYl6O7QZR6uwksbHwzLGywvfvvmd0UMn-SbMX4ycbvHpNhq/pub
陳迪、程朗、王志鋒、熊錦鵬、張玉茹、梨高贊(2021)。論壇情感挖掘研究粽述:現狀、挑戰與趨勢。計算機工程與應用,57(17),17-28。
陳雅文(1995)。圖書館學與資訊科學大辭典。檢自:https://terms.naer.edu.tw/detail/1683205/
陶治中、陳亭愷(2016)。社群運算應用於網路輿情情感傾向分析之研究-實施國道計程電子收費政策為例。運輸學刊,28(3),295-334。
陶治中、簡睿志(2016)。三元決策理論應用於社群媒體挖掘之情感分析-以 UBER 在臺營運話題為例。運輸計劃季刊,45(4),301-330。
曾元顯(2012)。圖書館學與資訊科學大辭典。檢自:https://terms.naer.edu.tw/detail/1678993/
程嵐嵐、何丕廉、孫越桓(2005)。基於朴素貝葉斯模型的中文關鍵詞提取算法研究。計算機應用,25(12),2780-2782。
項潔、涂豐恩(2011)。從保存到創造:開啟數位人文研究,國立臺灣大學出版中心。
項潔、翁稷安(2012)。數位人文要義:尋找類型與軌跡。國立臺灣大學出版中心。
項潔、薛弼心(2018)。科技部「數位人文推廣計畫」概述。人文與社會科學簡訊,19(2),86-92。
黃韋菱(2020)。數位人文系統中之檔案加值應用研究〔未出版之碩士論文〕。國立政治大學圖書資訊與檔案學研究所。
黃筠芝(2020)。檔案主題新聞之數位人文研究〔未出版之碩士論文〕。國立政治大學圖書資訊與檔案學研究所。
褚乃慈(2020)。台灣獨立樂團歌詞與樂迷留言內容之情緒分析。〔未出版之博士論文〕。世新大學資訊傳播學系。
劉嘉薇(2017)。網路統獨的聲量研究:大數據的分析。政治科學論叢,71,113-166。
闕河嘉、陳光華(2016)。庫博中文獨立語料庫分析工具之開發與應用。數位人文研究與技藝第六輯,285-313。
黎彥彣(2019)。基於多方面的情感分析模型之共同處理方法〔未出版之碩士論文〕。國立臺灣科技大學電機工程系研究所。
薛化元、江子陽(2020)。轉型正義的數位人文取徑嘗試:以傅正在自由中國有關黨產議題文章為例。黨產研究,5,175-201。
薛理桂(2012)揭開檔案的神秘面紗: 後典藏時代的檔案推廣與應用。全國新書資訊月刊,101(5),48-49。
鄭君、馬曉君、華強(2014)。社會網絡分析工具Ucinet和Gephi的比較研究。情報理論與實踐,37(8),133-138。

二、西文部份
Ashok N. Srivastava, Mehran Sahami (2009).Text Mining Classification, Clustering, and Applications.London: Chapman and Hall/CRC.
Berry, David M.(2012).Understanding Digital Humanities. London: Palgrave MacMillan.
Blake, C. (2011). Text mining. Annual Review of Information Science and Technology, 45(1), 121-155.
Dave, Kushal, Lawrence S. and Pennock D. “Mining the Peanut Gallery: Opinion Extraction and Semantic Classification of Product Reviews.” In Proceedings of the 12th International Conference on World Wide Web, WWW 2003, pp. 519-528, 2003.
Duriau, Reger, & Pfarrer, (2007). A Content Analysis of the Content Analysis Literature in Organization Studies: Research Themes, Data Sources, and Methodological Refinements.Organization Research Methods,10:5–34.Retrieved from https://www.terry.uga.edu/contentanalysis/research-and-methodology.php
Feldman, R., & Sanger, J. (2007). The text mining handbook: advanced approaches in analyzing unstructured data. Cambridge University Press.
Grimmer, J., & Stewart, B. (2013). Text as Data: The Promise and Pitfalls of Automatic Content Analysis Methods for Political Texts. Political Analysis, 21(3), 267-297. doi:10.1093/pan/mps028
Hajrizi, R., & Nuçi, K.P. (2020). Aspect-Based Sentiment Analysis in Education Domain. ArXiv, abs/2010.01429. 
Jin-Cheon Na, Tun Thura Thet, Arie Hans Nasution, Fauzi Munif Hassan(2022). A Sentiment-Based Digital Library of Movie Review Documents Using Fedora.Canadian Journal of Information and Library Science ,35(3):307-337.
Olga Kolchyna, Tharsis T. P. Souza, Philip Treleaven, Tomaso Aste.Twitter Sentiment Analysis: Lexicon Method, Machine Learning Method and Their Combination.Handbook of Sentiment Analysis in Finance. Mitra, G. and Yu, X. (Eds.)
Park, Sejung; Bier, Lindsey M.; Park, Han Woo (2021). The effects of infotainment on public reaction to North Korea using hybrid text mining: Content analysis, machine learning-based sentiment analysis, and co-word analysis. Profesional de la información, v. 30, n. 3, e300306.
Patrik Svensson . Humanities Computing as Digital humanities[EB/OL]. [2018-11-29]. http:// digitalhumanities.org/dhq/vol/3/3/000065/000065.html.
Rahmad Agus Dwianto, Achmad Nurmandi,& Salahudin Salahudin.The Sentiments Analysis of Donald Trump and Jokowi’s Twitters on Covid-19 Policy Dissemination.Webology, 18(1), 388-405.
Rosenzweig, R. (2003). Scarcity or Abundance? Preserving the Past in a Digital Era. American Historical Review 108(3), 735-762.Russell, J. A. (1980). A Circumplex Model of Affect. Journal of Personality and Social Psychology, 39(6), 1161–1178. doi: 10.1037/h0077714
Sultan M. Al-Daihania, Alan Abrahams. Analysis of Academic Libraries` Facebook Posts: Text and Data Analytics. The Journal of Academic Librarianship, 44(2), 1-10.
zh_TW
dc.identifier.doi (DOI) 10.6814/NCCU202201280en_US