Publications-Theses

Article View/Open

Publication Export

Google ScholarTM

NCCU Library

Citation Infomation

Related Publications in TAIR

題名 透過文字探勘技術探討各校高階經營管理(EMBA)學程之特性-以九校國立大學為例
Analyzing the Profiles of EMBA Program by Text Mining Methodology - A Case of Nine EMBA Programs
作者 林庭竹
Lin, Ting Chu
貢獻者 楊建民
林庭竹
Lin, Ting Chu
關鍵詞 文字探勘
高階經營管理學程
EMBA
Word2Vec
特徵輪廓
日期 2016
上傳時間 20-Jul-2016 17:16:06 (UTC+8)
摘要 近年來,臺灣高階經營管理(EMBA)學程市場逐漸飽和,預計就讀EMBA的企業經理人比例趨緩,再加上兩岸三地EMBA學程崛起,都將影響臺灣EMBA的發展。因此,本研究認為可根據供應面與需求面來進行檢視,分析出目前臺灣EMBA供需兩大層面,由各校教師與學生所嶄露的特徵輪廓,使臺灣的EMBA邁向具有各校特色的適性化學程。
在第一階段研究過程中,選取臺灣九校國立頂尖大學所設立的EMBA,作為研究對象。利用Python撰寫爬蟲程式,蒐集九校EMBA教師與學生的文章標題與概要,其中教師文本總計23033篇,學生文本總計7342篇。運用Jieba對文本斷詞後,以14個管理學別視為供應面,需求面則是根據政府訂立的12個職業別,來做為目標字詞,透過Word2Vec模型計算管理學別與教師、職業別與學生文本兩大目標字詞的關聯詞,最後獲得各目標字詞20個關聯詞的詞集。而第二階段透過第一階段所呈現的關聯詞,進一步計算與教師和學生文本字詞的Cosine相似度,來辨別各校教師與學生間所呈現的供需面之共同特徵,代表該EMBA之特質。
第一階段研究結果顯示,Word2Vec模型透過特徵向量辨別關聯詞時,可準確辨別出與目標字詞具有相同涵義或相互關聯的字詞,且所找出的20個關聯字詞與目標字詞的Cosine相似度也多大於0.7,因此透過Word2Vec模型建立目標字詞之擴增詞集具有相當高的準確性。而第二階段透過第一階段所呈現的關聯詞所計算的供需面Cosine相似度之排序,可發現各校EMBA由教師與學生成員文本與各目標字詞的相似度排序皆有所不同,因此各學程可透過其差異性作為特色指標,發展出適性化學程,提高臺灣企業經理人就讀EMBA之意願。
參考文獻 Aurora, Chen, & Noeleen, Doherty. (2013).The perceptions of an EMBA experience in China: an exploratory study. Journal of Management Development, 32(7), 780-795.
Xue, B., Fu, C., & Shaobin, Z.(2014). A Study on Sentiment Computing and
Classification of Sina Weibo with Word2vec. In Big Data (BigData Congress),
2014 IEEE International Congress on, pp. 358-363. IEEE.
Blei, D., M. (2012).Probabilistic Topic Models. Communications of the ACM, 55(4), 77-84.
Cotner, J., Jones, R., & Kashlak, R. (2003).Effectively Integrating an International Field Study into the EMBA Curriculum. Journal of Teaching in International Business, 15(1), 5-20.
Note. From Document Warehousing and Text Mining: Techniques for Improving Business Operations, Marketing, and Sales, by Dan Sullivan, 2001.John Wiley & Sons, Inc., New York, NY, USA (2001).
Wolf, L., Hanani, Y., Bar, K., & Dershowitz, N. (2014).Joint word2vec networks for
bilingual semantic representations.International Journal of Computational
Linguistics and Applications, 5(1), 27-42. Oren, M., Ido, D., & Jacob, G.(2015). Modeling Word Meaning in Context with Substitute Vectors.In Human Language Technologies: The 2015 Annual Conference of the North American Chapter of the ACL.
Scharolta Katharina Siencnik. (2015). Adapting word2vec to Named Entity Recognition. In Proceedings of the 20th Nordic Conference of Computational Linguistics (NODALIDA 2015), pages 239-243, Vilnius, Lithuania.
William, J. (2005). Adventures in creating an outdoor leadership challenge course for an EMBA program. Journal of Management Education, 29(2), 284-300.
Yangqiu, S., & Dan R.(2015).Unsupervised Sparse Vector Densification for Short Text Similarity.In NAACL, 5 2015.
尹其言。2010。應用文件分群與文字探勘技術於機器學習領域趨勢分析以SSCI資料庫為例。長榮大學學報14(2),1-16。
何恩。2007。基於主題分析的強健性語言模型調適。碩士論文。國立臺灣大學資訊工程研究所。
吳昀錚。2008。利用文字探勘技術預測台股加權指數之漲跌趨勢。碩士論文。國立中央大學資訊管理研究所。
林頌堅。2014。以主題模型方法為基礎的資訊計量學領域研究主題分析。教育資料與圖書館學1(4),499-523。
邵子安。2012。基於文字探勘的專利分析與預測。博碩士論文。國立清華大學通訊工程研究所。
高怡雯。2002。國內外EMBA班課程設計之研究。碩士論文。國立政治大學企業管理研究所。
梁翊群。2013。主題模型於情感分析之研究。碩士論文。國立成功大學資訊管理研究所。
郭孟家。2011。結合機率主題模型之模糊概念群集於文字探勘。碩士論文。國立成功大學資訊管理研究所。
陳吉德。2015。主題模型化之半監督學習法於短文本流之主題標籤推薦。碩士論文。國立成功大學資訊工程研究所。
陳政瑜。2015。基於文字探勘技術探討司法裁判書之撰寫一致性:以刑事訴訟停止羈押聲請裁定書為例。碩士論文。臺灣大學資訊管理學研究所。
陳美棻。2013。基於矩陣分解及隱含主題模型之部落格文章推薦。碩士論文。國立交通大學資訊管理研究所。
陳泰銓。2015。基於隱含主題模型與詞彙本體之線上問答服務回答機制。碩士論文。國立交通大學資訊管理研究所。
陳裕菘、謝邦昌、李勝輝、陳郁婷。2014。運用文字探勘與資料採礦技術建立匯率預測模型-以人民幣兌新台幣為例。Journal of Data Analysis 9(1),133-146。
楊正銘。2004。以文字探勘技術應用於疾病分類之輔助系統-以出入院病歷摘要為例。碩士論文。臺北醫學大學醫學資訊研究所。
楊育宗。2015。基於文字、圖片及影像對社群平台訊息進行情緒辨識的初步研究。碩士論文。國立臺灣大學資訊工程研究所。
溫品竹。基於Word2Vec詞向量的網路情緒文和流行音樂媒合方法之研究。The 2015 Conference on Computational Linguistics and Speech Processing ROCLING。
鄒函升。2013。新聞輿情與民意偵測追蹤之研究-大資料之研究取向。碩士論文。國立政治大學資訊管理研究所。
雷秉翰。2013。辨別含有可疑內容網路產品評論之研究。碩士論文。國立中央大學企業管理研究所。
劉正邦。2015。基於協同主題模型與主題熱門分析之個人化新聞推薦。碩士論文。國立交通大學資訊管理研究所。
劉澤。2015。以文字探勘為基礎之財務風險分析方法研究。碩士論文。國立政治大學資訊科學學系。
劉燕萍。2011。臺灣EMBA學生能力調查分析之研究。碩士論文。長榮大學高階管理碩士在職專班(EMBA)。
戴瑜廷。2015。應用文字探勘之自動化新聞文本分析以探討社會對新聞事件之反應。碩士論文。國立清華大學服務科學研究所。
鍾任明、李維平、吳澤民。2007。運用文字探勘於日內股價漲跌趨勢預測之研究。中華管理評論國際學報10(1)。
簡新騰。2014。運用網路文字探勘技術萃取品牌忠誠度之探討-以智慧型手機為例。碩士論文。國立中山大學高階經營碩士班。
羅劭鼎。2010。網路文字探勘運用於分析筆記型電腦網路口碑之研究-以台灣為例。碩士論文。國立臺東大學社會科教育學系。
Word2vec: Neural Word Embeddings in Java. Retrieved 2016, from http://deeplearning4j.org/word2vec
學門專長分類表。【資料檔】。中華民國科技部。
行業職業就業指南(104年版)。【資料檔】。中華民國勞動部。
九校學生論文。民國105年,取自:臺灣碩博士論文加值系統:http://ndltd.ncl.edu.tw/
九校教師文章。民國105年,取自:臺灣學術機構典藏:http://tair.org.tw/
描述 碩士
國立政治大學
資訊管理學系
104356015
資料來源 http://thesis.lib.nccu.edu.tw/record/#G0104356015
資料類型 thesis
dc.contributor.advisor 楊建民zh_TW
dc.contributor.author (Authors) 林庭竹zh_TW
dc.contributor.author (Authors) Lin, Ting Chuen_US
dc.creator (作者) 林庭竹zh_TW
dc.creator (作者) Lin, Ting Chuen_US
dc.date (日期) 2016en_US
dc.date.accessioned 20-Jul-2016 17:16:06 (UTC+8)-
dc.date.available 20-Jul-2016 17:16:06 (UTC+8)-
dc.date.issued (上傳時間) 20-Jul-2016 17:16:06 (UTC+8)-
dc.identifier (Other Identifiers) G0104356015en_US
dc.identifier.uri (URI) http://nccur.lib.nccu.edu.tw/handle/140.119/99340-
dc.description (描述) 碩士zh_TW
dc.description (描述) 國立政治大學zh_TW
dc.description (描述) 資訊管理學系zh_TW
dc.description (描述) 104356015zh_TW
dc.description.abstract (摘要) 近年來,臺灣高階經營管理(EMBA)學程市場逐漸飽和,預計就讀EMBA的企業經理人比例趨緩,再加上兩岸三地EMBA學程崛起,都將影響臺灣EMBA的發展。因此,本研究認為可根據供應面與需求面來進行檢視,分析出目前臺灣EMBA供需兩大層面,由各校教師與學生所嶄露的特徵輪廓,使臺灣的EMBA邁向具有各校特色的適性化學程。
在第一階段研究過程中,選取臺灣九校國立頂尖大學所設立的EMBA,作為研究對象。利用Python撰寫爬蟲程式,蒐集九校EMBA教師與學生的文章標題與概要,其中教師文本總計23033篇,學生文本總計7342篇。運用Jieba對文本斷詞後,以14個管理學別視為供應面,需求面則是根據政府訂立的12個職業別,來做為目標字詞,透過Word2Vec模型計算管理學別與教師、職業別與學生文本兩大目標字詞的關聯詞,最後獲得各目標字詞20個關聯詞的詞集。而第二階段透過第一階段所呈現的關聯詞,進一步計算與教師和學生文本字詞的Cosine相似度,來辨別各校教師與學生間所呈現的供需面之共同特徵,代表該EMBA之特質。
第一階段研究結果顯示,Word2Vec模型透過特徵向量辨別關聯詞時,可準確辨別出與目標字詞具有相同涵義或相互關聯的字詞,且所找出的20個關聯字詞與目標字詞的Cosine相似度也多大於0.7,因此透過Word2Vec模型建立目標字詞之擴增詞集具有相當高的準確性。而第二階段透過第一階段所呈現的關聯詞所計算的供需面Cosine相似度之排序,可發現各校EMBA由教師與學生成員文本與各目標字詞的相似度排序皆有所不同,因此各學程可透過其差異性作為特色指標,發展出適性化學程,提高臺灣企業經理人就讀EMBA之意願。
zh_TW
dc.description.tableofcontents 第一章 緒論 1
第一節 研究背景與動機 1
第二節 研究目的 2
第二章 文獻探討 3
第一節 高階經營管理(EMBA)學程 3
第二節 文字探勘(Text Mining) 5
第三節 Word2Vec文字向量化 7
第四節 小結 8
第三章 研究方法與設計 9
第一節 第一階段:供應面 11
3.1.1 資料蒐集 11
3.1.2 資料前處理 13
3.1.3 Jieba斷詞 13
3.1.4 Word2Vec 關聯詞模型 14
第二節 第一階段:需求面 17
3.2.1 資料蒐集 17
3.2.2 資料前處理 20
3.2.3 Jieba斷詞 20
3.2.4 Word2Vec 關聯詞模型 20
第三節 第二階段 21
3.3.1 供應面 21
3.3.2 需求面 22
第四章 研究結果 23
第一節 第一階段研究結果 23
第二節 第二階段研究結果 34
4.2.1. 供應面 34
4.2.2. 需求面 43
第五章 結論與未來展望 52
第一節 結論與建議 52
第二節 未來研究方向 54
參考文獻 56
zh_TW
dc.format.extent 1231222 bytes-
dc.format.mimetype application/pdf-
dc.source.uri (資料來源) http://thesis.lib.nccu.edu.tw/record/#G0104356015en_US
dc.subject (關鍵詞) 文字探勘zh_TW
dc.subject (關鍵詞) 高階經營管理學程zh_TW
dc.subject (關鍵詞) EMBAzh_TW
dc.subject (關鍵詞) Word2Veczh_TW
dc.subject (關鍵詞) 特徵輪廓zh_TW
dc.title (題名) 透過文字探勘技術探討各校高階經營管理(EMBA)學程之特性-以九校國立大學為例zh_TW
dc.title (題名) Analyzing the Profiles of EMBA Program by Text Mining Methodology - A Case of Nine EMBA Programsen_US
dc.type (資料類型) thesisen_US
dc.relation.reference (參考文獻) Aurora, Chen, & Noeleen, Doherty. (2013).The perceptions of an EMBA experience in China: an exploratory study. Journal of Management Development, 32(7), 780-795.
Xue, B., Fu, C., & Shaobin, Z.(2014). A Study on Sentiment Computing and
Classification of Sina Weibo with Word2vec. In Big Data (BigData Congress),
2014 IEEE International Congress on, pp. 358-363. IEEE.
Blei, D., M. (2012).Probabilistic Topic Models. Communications of the ACM, 55(4), 77-84.
Cotner, J., Jones, R., & Kashlak, R. (2003).Effectively Integrating an International Field Study into the EMBA Curriculum. Journal of Teaching in International Business, 15(1), 5-20.
Note. From Document Warehousing and Text Mining: Techniques for Improving Business Operations, Marketing, and Sales, by Dan Sullivan, 2001.John Wiley & Sons, Inc., New York, NY, USA (2001).
Wolf, L., Hanani, Y., Bar, K., & Dershowitz, N. (2014).Joint word2vec networks for
bilingual semantic representations.International Journal of Computational
Linguistics and Applications, 5(1), 27-42. Oren, M., Ido, D., & Jacob, G.(2015). Modeling Word Meaning in Context with Substitute Vectors.In Human Language Technologies: The 2015 Annual Conference of the North American Chapter of the ACL.
Scharolta Katharina Siencnik. (2015). Adapting word2vec to Named Entity Recognition. In Proceedings of the 20th Nordic Conference of Computational Linguistics (NODALIDA 2015), pages 239-243, Vilnius, Lithuania.
William, J. (2005). Adventures in creating an outdoor leadership challenge course for an EMBA program. Journal of Management Education, 29(2), 284-300.
Yangqiu, S., & Dan R.(2015).Unsupervised Sparse Vector Densification for Short Text Similarity.In NAACL, 5 2015.
尹其言。2010。應用文件分群與文字探勘技術於機器學習領域趨勢分析以SSCI資料庫為例。長榮大學學報14(2),1-16。
何恩。2007。基於主題分析的強健性語言模型調適。碩士論文。國立臺灣大學資訊工程研究所。
吳昀錚。2008。利用文字探勘技術預測台股加權指數之漲跌趨勢。碩士論文。國立中央大學資訊管理研究所。
林頌堅。2014。以主題模型方法為基礎的資訊計量學領域研究主題分析。教育資料與圖書館學1(4),499-523。
邵子安。2012。基於文字探勘的專利分析與預測。博碩士論文。國立清華大學通訊工程研究所。
高怡雯。2002。國內外EMBA班課程設計之研究。碩士論文。國立政治大學企業管理研究所。
梁翊群。2013。主題模型於情感分析之研究。碩士論文。國立成功大學資訊管理研究所。
郭孟家。2011。結合機率主題模型之模糊概念群集於文字探勘。碩士論文。國立成功大學資訊管理研究所。
陳吉德。2015。主題模型化之半監督學習法於短文本流之主題標籤推薦。碩士論文。國立成功大學資訊工程研究所。
陳政瑜。2015。基於文字探勘技術探討司法裁判書之撰寫一致性:以刑事訴訟停止羈押聲請裁定書為例。碩士論文。臺灣大學資訊管理學研究所。
陳美棻。2013。基於矩陣分解及隱含主題模型之部落格文章推薦。碩士論文。國立交通大學資訊管理研究所。
陳泰銓。2015。基於隱含主題模型與詞彙本體之線上問答服務回答機制。碩士論文。國立交通大學資訊管理研究所。
陳裕菘、謝邦昌、李勝輝、陳郁婷。2014。運用文字探勘與資料採礦技術建立匯率預測模型-以人民幣兌新台幣為例。Journal of Data Analysis 9(1),133-146。
楊正銘。2004。以文字探勘技術應用於疾病分類之輔助系統-以出入院病歷摘要為例。碩士論文。臺北醫學大學醫學資訊研究所。
楊育宗。2015。基於文字、圖片及影像對社群平台訊息進行情緒辨識的初步研究。碩士論文。國立臺灣大學資訊工程研究所。
溫品竹。基於Word2Vec詞向量的網路情緒文和流行音樂媒合方法之研究。The 2015 Conference on Computational Linguistics and Speech Processing ROCLING。
鄒函升。2013。新聞輿情與民意偵測追蹤之研究-大資料之研究取向。碩士論文。國立政治大學資訊管理研究所。
雷秉翰。2013。辨別含有可疑內容網路產品評論之研究。碩士論文。國立中央大學企業管理研究所。
劉正邦。2015。基於協同主題模型與主題熱門分析之個人化新聞推薦。碩士論文。國立交通大學資訊管理研究所。
劉澤。2015。以文字探勘為基礎之財務風險分析方法研究。碩士論文。國立政治大學資訊科學學系。
劉燕萍。2011。臺灣EMBA學生能力調查分析之研究。碩士論文。長榮大學高階管理碩士在職專班(EMBA)。
戴瑜廷。2015。應用文字探勘之自動化新聞文本分析以探討社會對新聞事件之反應。碩士論文。國立清華大學服務科學研究所。
鍾任明、李維平、吳澤民。2007。運用文字探勘於日內股價漲跌趨勢預測之研究。中華管理評論國際學報10(1)。
簡新騰。2014。運用網路文字探勘技術萃取品牌忠誠度之探討-以智慧型手機為例。碩士論文。國立中山大學高階經營碩士班。
羅劭鼎。2010。網路文字探勘運用於分析筆記型電腦網路口碑之研究-以台灣為例。碩士論文。國立臺東大學社會科教育學系。
Word2vec: Neural Word Embeddings in Java. Retrieved 2016, from http://deeplearning4j.org/word2vec
學門專長分類表。【資料檔】。中華民國科技部。
行業職業就業指南(104年版)。【資料檔】。中華民國勞動部。
九校學生論文。民國105年,取自:臺灣碩博士論文加值系統:http://ndltd.ncl.edu.tw/
九校教師文章。民國105年,取自:臺灣學術機構典藏:http://tair.org.tw/
zh_TW