題名 股市趨勢預測之研究 -財經評論文本情感分析
Predict the trend in the stock by Sentiment analyzing financial posts
作者 蔡宇祥
Tsai, Yu Shiang
貢獻者 姜國輝
Johannes K. Chiang
Tsai, Yu Shiang
關鍵詞 情感分析
日期 2016
上傳時間 22-Aug-2016 10:44:33 (UTC+8)
摘要 根據過去研究指出,社群網站上的貼文訊息會對群眾情緒造成影響,進而影響股市波動,故對於投資者而言,如果能快速分析大量社群網站的財經文本來推測投資情緒進而預測股市走勢,將可提升投資獲利。
描述 碩士
資料類型 thesis
姜國輝 Johannes K. Chiang
蔡宇祥 Tsai, Yu Shiang
dc.creator (作者) 蔡宇祥zh_TW
2016 22-Aug-2016 10:44:33 (UTC+8)
dc.identifier (Other Identifiers) G0103356002en_US
dc.identifier.uri (URI)
dc.description (描述) 碩士zh_TW
dc.description (描述) 國立政治大學zh_TW
dc.description (描述) 資訊管理學系zh_TW
dc.description (描述) 103356002zh_TW
dc.description.abstract (摘要) 根據過去研究指出,社群網站上的貼文訊息會對群眾情緒造成影響,進而影響股市波動,故對於投資者而言,如果能快速分析大量社群網站的財經文本來推測投資情緒進而預測股市走勢,將可提升投資獲利。
dc.description.tableofcontents 第一章、 概論 5
     1、 研究背景 5
     2、 研究動機 8
     3、 研究目的 9
     第二章、 文獻探討 10
     1、 情感分析 10
     1.1 情感分析的定義 10
     1.2 情感分析的方法 11
     1.3 情感分析與股價之相關性研究 13
     2、 Apache Spark 14
     3、 Word2Vec 16
     4、 主題模型(Sentiment Analysis) 18
     4.1 TF-IDF 18
     4.1 K-means 19
     4.2 Latent Dirichlet allocation(隱含狄利克雷分布) 19
     5、 文字分類(Text Classification) 23
     5.1 支援向量機(Support Vector Machine, SVM) 24
     第三章、 研究方法 26
     1、 資料蒐集(Data Collection) 28
     2、 文本前處理(Document Preprocessing) 29
     2.1 中文斷詞(Segmentation/Tokenization) 29
     2.2 詞性標注(Part-of-Speech Tagging) 29
     2.3 否定詞處理(Negation Process) 30
     2.4 詞性過濾(POS Filtering) 31
     2.5 字詞頻率計算 31
     3、 Word2vec 32
     4、 文本主題標註(Sentiment Orientation) 32
     4.1 找出文本熱門議題詞 32
     4.2 建立向量空間模型(Vector Space Model) 33
     4.3 透過K-means建立主題模型 35
     4.4 透過LDA建立主題模型 35
     4.5 判斷文本主題 36
     5、 情緒指標標註 36
     5.1 建立財經種子詞集 37
     5.2 情緒指數計算 38
     5.3 情緒傾向標註 38
     6、 分類模型建立與分類成效衡量(Classification) 39
     6.1 監督式學習的分類演算法 39
     6.2 分類的效果衡量 39
     7、 視覺化分析 41
     第四章、 研究結果 42
     1、 實驗資料擷取結果 42
     2、 文本類別標注結果 43
     3、 財經文本判斷結果 45
     4、 分類模型實驗結果 51
     5、 視覺化分析結果 51
     第五章、 結論與建議 57
     1、 結論 57
     2、 未來研究與建議 59
     參考文獻 60
2011393 bytes
application/pdf
dc.source.uri (資料來源)
dc.subject (關鍵詞) 情感分析zh_TW
dc.subject (關鍵詞) Word2veczh_TW
dc.subject (關鍵詞) LDA主題模型zh_TW
dc.subject (關鍵詞) K-meanszh_TW
dc.subject (關鍵詞) 上海股價指數zh_TW
dc.title (題名) 股市趨勢預測之研究 -財經評論文本情感分析zh_TW
dc.title (題名) Predict the trend in the stock by Sentiment analyzing financial postsen_US
dc.type (資料類型) thesisen_US
