學術產出-Theses

Article View/Open

Publication Export

Google ScholarTM

政大圖書館

Citation Infomation

  • No doi shows Citation Infomation
題名 應用文字探勘分析網路團購商品群集之研究 -以美食類商品為例
The study of analyzing group-buying goods clusters by using text mining – exemplified by the group-buying foods
作者 趙婉婷
貢獻者 楊建民
趙婉婷
關鍵詞 文字探勘
團購
最近鄰居法
kNN分群
Text Mining
Group-buying
k-Nearest Neighbors
kNN clustering
日期 2011
上傳時間 30-Oct-2012 11:21:15 (UTC+8)
摘要 網路團購消費模式掀起一陣風潮,隨著網路團購市場接受度提高,現今以團購方式進行購物的消費模式不斷增加,團購商品品項也日益繁多。為了使網路團購消費者更容易找到感興趣的團購商品,本研究將針對團購商品進行群集分析。

本研究以國內知名團購網站「愛合購」為例,以甜點蛋糕分類下的熱門美食團購商品為主,依商品名稱找尋該商品的顧客團購網誌文章納入資料庫中。本研究從熱門度前1000項的產品中找到268項產品擁有顧客團購網誌586篇,透過文字探勘技術從中擷取產品特徵相關資訊,並以「k最近鄰居法」為基礎建置kNN分群器,以進行群集分析。本研究依不同的k值以及分群門檻值進行分群,並對大群集進行階段式分群,單項群集進行質心合併,以尋求較佳之分群結果。

研究結果顯示,268項團購商品經過kNN分群器進行四個階段的群集分析後可獲得28個群集,群內相似度從未分群時的0.029834提升至0.177428。在經過第一階段的分群後,可將商品分為3個主要大群集,即「麵包類」、「蛋糕類」以及「其他口感類」。在進行完四個階段的分群後,「麵包類」可分為2種類型的群集,即『麵包類產品』以及『擁有麵包特質的產品』,而「蛋糕類」則是可依口味區分為不同的蛋糕群集。產品重要特徵詞彙不像一般文章的關鍵字詞會重複出現於文章中,因此在特徵詞彙過濾時應避免刪減過多的產品特徵詞彙。群集特性可由詞彙權重前20%之詞彙依人工過濾及商品出現頻率挑選出產品特徵代表詞來做描繪。研究所獲得之分群結果除了提供團購消費者選擇產品時參考外,也可幫助團購網站業者規劃更適切的行銷活動。本研究亦提出一些未來研究方向。
Group-buying is prevailing, the items of merchandise diverse recently. In order to let consumer find the commodities they are interested in, the research focus on the cluster analysis about group-buying products and clusters products by the features of them.

We catch the blogs of products posted by customers, via text mining to retrieve the features of products, and then establish the kNN clustering device to cluster them. This research sets different threshold values to test, and multiply clusters big groups, and merges small groups by centroid, we expect to obtain the best quality cluster.

From the results, 268 items of group-buying foods can be divided into 28 clusters, and the mean of Intra-Similarity also can be improved. The 28 clusters can be categorized to three main clusters:Bread, Cake, and Other mouthfeel foods. We can define and name each cluster by catch the top twenty percent of the keywords in each cluster. The results of this paper could help buyers find similar commodities which they like, and also help sellers make the great marketing activity plan.
參考文獻 中文文獻
1.呂培仕,「口碑定義架構的發展:口碑文獻回顧1950~2008」,國立台灣科技大學企業管理學系,碩士論文,2010。

2.巫啟台,「文件之關聯資訊萃取及其概念圖自動建構」,國立成功大學資訊工程學系碩博士班,碩士論文,2002。

3.林淑婉,「影響網路團購再購意願因素之研究」,大同大學事業經營所,碩士論文,2010。

4.張家蓁,「資料採礦應用於消費者網路團購因素探勘之研究」,淡江大學管理科學研究所企業經營碩士在職專班,碩士論文,2010。

5.張瑜修,「消費者參與辦公室團購影響因素之研究-以宜蘭縣上班族為例」,佛光大學管理學系,碩士論文,2011。

6.曾元顯,「數位文件之資訊組織與主題分析自動化之技術與應用」,台北市立圖書館館訊,2002年,第二十卷,第二期,23-35。

7.喻欣凱,「運用支援向量機與文字探勘於股價漲跌趨勢之預測」,輔仁大學資訊管理學系,碩士論文,2008。

8.莊隆泰,「群體採購中間商系統之研究」,國立中山大學資訊管理研究所,碩士論文,2010。

9.詹益發,「網站部落格之顧客口碑評論分析研究-以台灣咖啡飲料市場為例」,元智大學資訊管理學系,碩士論文,2009。

10.楊惠琴,「網路合購知覺風險與合購意向影響因素之研究」,東吳大學國際貿易學系,碩士論文,2006。

11.廖婉如,「應用MOA理論探討團購主購者之忠誠行為-以知識交換為中介」,國立臺北大學企業管理學系,碩士論文,2010。

12.潘倧偉,「口碑與從眾行為對團購意圖之影響—以團購美食為例」,南台科技大學行銷與流通管理系,碩士論文,2010。

13.盧惠芬,「結合從眾行為探討影響網路團購購買意願因素」,中原大學國際貿易研究所,碩士論文,2010。

14.戴尚學,「運用事件偵測與追蹤技術於中文多文件摘要之研究」,國立雲林科技大學資訊管理研究所,碩士論文,2003。

15.戴維德,「使用最近鄰近分類法─以網路銀行為例」,南台科技大學國際企業系,碩士論文,2006。


英文文獻
1.Allen, V. L. (1965). Situational Factors in. Advances in Experimental and Social Psychology, Vol 2, ed. Leonard Berkowitz. New York, NY: Academic Press, 133-175.

2.Anand, K. S., & Aron, R. (2003). Group-buying on the Web: a comparison of price-discovery mechanisms. Management Science, 49(11), 1546-1562.

3.Arndt, J. (1967). Role of product-related conversations in the diffusion of a new product. Journal of Marketing research, 291–295.

4.Chen, K. J., Kiu, S. H. (1992). Word Identification for Mandarin Chinese Sentences. Fifth International Conference on Computational Linguistics, pp.101-107.

5.Cover, T., & Hart, P. (1967). Nearest neighbor pattern classification. Information Theory, IEEE Transactions on, 13(1), 21–27.

6.Godes, D., Mayzlin, D., Chen, Y., Das, S., Dellarocas, C., Pfeiffer, B., Libai, B., Sen, S., Shi, M., Verlegh, P., et al. (2005). The Firm’s Management of Social Interactions. Marketing Letters, 16(3-4) 415-428

7.Hanson, W. A. (2000). Principles of Internet Marketing. Ohio: South-Western College Publishing.

8.Larkey, L. S., & Croft, W. B. (1996). Combining classifiers in text categorization. Proceedings of the 19th annual international

9.Macinnis, H. (1997), Consumer Behavior, New York: Houghton Mifflin Company.

10.Nie, Jian-Yun, Brisebois, Martin & Ren, Xiaobo (1996). On Chinese Text Retrieval. Conference Proceedings of SIGIR, pp.225-233.

11.Salton, G., Wong, A., Yang, C. S. (1975). A Vector Space Model for Automatic Indexing. Communications of the ACM, v.18 n.11, pp.613-620.

12.Salton, G., McGill, M. (1983). Introduction to Modern Information Retrieval,New York: McGraw-Hill.

13.Salton, G. (1989). Automatic Text Processing. Addison-Wesley, Reading, Mass.

14.Snyder, P. (2004, Jun 28). Wanted: Standards for Viral Marketing. Brandweek. 45, 21-21

15.Sproat, R, Shih , C., 1990. A Statistical Method for Finding Word Boundaries in Chinese Text. Computer Processing of Chinese and Oriental Languages, pp.336-351.

16.Wilkie, W. L. (1994), Consumer Behavior, 3rd ed., New York: John Wiley and Sons Inc.

17.Yang, Y., Carbonell, J.G., Brown, R., Pierce, T., Archibald, B. T. & Liu, X. (1999). Learning Approaches for Detecting and Tracking News Events. IEEE Intelligent Systems, v.14 n.4, pp.32-43.


網路資料
1.CKIP中文斷詞系統,中央研究院(2012),取自http://ckipsvr.iis.sinica.edu.tw/。

2.「資策會MIC網友上網購物行為模式調查 搜尋特定商品、自行比價、瀏覽部落格、查詢訂單 」(2007.07.19),資策會(2012),
取自 http://mic.iii.org.tw/pop/micnews4_op_new.asp?sno=334&cred=2007/7/19,2007。

3.蘇文彬 ,「MIC:逾2成受訪網友去年曾網路團購 」,iThome online,取自 http://www.ithome.com.tw/itadm/article.php?c=65725,2011。
描述 碩士
國立政治大學
資訊管理研究所
99356003
100
資料來源 http://thesis.lib.nccu.edu.tw/record/#G0099356003
資料類型 thesis
dc.contributor.advisor 楊建民zh_TW
dc.contributor.author (Authors) 趙婉婷zh_TW
dc.creator (作者) 趙婉婷zh_TW
dc.date (日期) 2011en_US
dc.date.accessioned 30-Oct-2012 11:21:15 (UTC+8)-
dc.date.available 30-Oct-2012 11:21:15 (UTC+8)-
dc.date.issued (上傳時間) 30-Oct-2012 11:21:15 (UTC+8)-
dc.identifier (Other Identifiers) G0099356003en_US
dc.identifier.uri (URI) http://nccur.lib.nccu.edu.tw/handle/140.119/54560-
dc.description (描述) 碩士zh_TW
dc.description (描述) 國立政治大學zh_TW
dc.description (描述) 資訊管理研究所zh_TW
dc.description (描述) 99356003zh_TW
dc.description (描述) 100zh_TW
dc.description.abstract (摘要) 網路團購消費模式掀起一陣風潮,隨著網路團購市場接受度提高,現今以團購方式進行購物的消費模式不斷增加,團購商品品項也日益繁多。為了使網路團購消費者更容易找到感興趣的團購商品,本研究將針對團購商品進行群集分析。

本研究以國內知名團購網站「愛合購」為例,以甜點蛋糕分類下的熱門美食團購商品為主,依商品名稱找尋該商品的顧客團購網誌文章納入資料庫中。本研究從熱門度前1000項的產品中找到268項產品擁有顧客團購網誌586篇,透過文字探勘技術從中擷取產品特徵相關資訊,並以「k最近鄰居法」為基礎建置kNN分群器,以進行群集分析。本研究依不同的k值以及分群門檻值進行分群,並對大群集進行階段式分群,單項群集進行質心合併,以尋求較佳之分群結果。

研究結果顯示,268項團購商品經過kNN分群器進行四個階段的群集分析後可獲得28個群集,群內相似度從未分群時的0.029834提升至0.177428。在經過第一階段的分群後,可將商品分為3個主要大群集,即「麵包類」、「蛋糕類」以及「其他口感類」。在進行完四個階段的分群後,「麵包類」可分為2種類型的群集,即『麵包類產品』以及『擁有麵包特質的產品』,而「蛋糕類」則是可依口味區分為不同的蛋糕群集。產品重要特徵詞彙不像一般文章的關鍵字詞會重複出現於文章中,因此在特徵詞彙過濾時應避免刪減過多的產品特徵詞彙。群集特性可由詞彙權重前20%之詞彙依人工過濾及商品出現頻率挑選出產品特徵代表詞來做描繪。研究所獲得之分群結果除了提供團購消費者選擇產品時參考外,也可幫助團購網站業者規劃更適切的行銷活動。本研究亦提出一些未來研究方向。
zh_TW
dc.description.abstract (摘要) Group-buying is prevailing, the items of merchandise diverse recently. In order to let consumer find the commodities they are interested in, the research focus on the cluster analysis about group-buying products and clusters products by the features of them.

We catch the blogs of products posted by customers, via text mining to retrieve the features of products, and then establish the kNN clustering device to cluster them. This research sets different threshold values to test, and multiply clusters big groups, and merges small groups by centroid, we expect to obtain the best quality cluster.

From the results, 268 items of group-buying foods can be divided into 28 clusters, and the mean of Intra-Similarity also can be improved. The 28 clusters can be categorized to three main clusters:Bread, Cake, and Other mouthfeel foods. We can define and name each cluster by catch the top twenty percent of the keywords in each cluster. The results of this paper could help buyers find similar commodities which they like, and also help sellers make the great marketing activity plan.
en_US
dc.description.tableofcontents 誌謝 I
摘要 II
Abstract III
圖目錄 VI
表目錄 VII
第一章 緒論 1
  第一節 研究背景與動機 1
  第二節 研究目的 2
第二章 文獻探討 3
  第一節 團購 3
    2.1.1 團購的定義與類型 3
    2.1.2 影響消費者團購意願 4
  第二節 文字探勘 6
    2.2.1 文字探勘定義 6
    2.2.2 斷詞處理 7
    2.2.3 權重計算及特徵詞選取 9
    2.2.4 向量空間模型 10
  第三節 群集分析 12
    2.3.1 應用於團購領域之相關文獻探討 12
    2.3.2 k最近鄰居法的原理及運作方式 12
第三章 研究方法與設計 15
  第一節 研究架構 15
  第二節 資料處理 16
    3.2.1 蒐集資料 16
    3.2.2 中文斷詞 17
    3.2.3 特徵詞萃取 18
  第三節 kNN分群 20
    3.3.1 kNN分群器運作原理 21
    3.3.2 建置詞彙-文件矩陣 21
    3.3.3 文件相似度計算 22
    3.3.4 kNN分群器 22
    3.3.5 分群規則 23
  第四節 評估方法 24
第四章 實驗結果 26
  第一節 各階段分群結果 26
    4.1.1 第一階段分群 26
    4.1.2 第二階段分群 27
    4.1.3 第三階段分群 34
    4.1.4 第四階段分群 40
  第二節 群集結構 43
第五章 結論與未來展望 47
  第一節 結論與建議 47
  第二節 未來研究方向 48
參考文獻 50
zh_TW
dc.language.iso en_US-
dc.source.uri (資料來源) http://thesis.lib.nccu.edu.tw/record/#G0099356003en_US
dc.subject (關鍵詞) 文字探勘zh_TW
dc.subject (關鍵詞) 團購zh_TW
dc.subject (關鍵詞) 最近鄰居法zh_TW
dc.subject (關鍵詞) kNN分群zh_TW
dc.subject (關鍵詞) Text Miningen_US
dc.subject (關鍵詞) Group-buyingen_US
dc.subject (關鍵詞) k-Nearest Neighborsen_US
dc.subject (關鍵詞) kNN clusteringen_US
dc.title (題名) 應用文字探勘分析網路團購商品群集之研究 -以美食類商品為例zh_TW
dc.title (題名) The study of analyzing group-buying goods clusters by using text mining – exemplified by the group-buying foodsen_US
dc.type (資料類型) thesisen
dc.relation.reference (參考文獻) 中文文獻
1.呂培仕,「口碑定義架構的發展:口碑文獻回顧1950~2008」,國立台灣科技大學企業管理學系,碩士論文,2010。

2.巫啟台,「文件之關聯資訊萃取及其概念圖自動建構」,國立成功大學資訊工程學系碩博士班,碩士論文,2002。

3.林淑婉,「影響網路團購再購意願因素之研究」,大同大學事業經營所,碩士論文,2010。

4.張家蓁,「資料採礦應用於消費者網路團購因素探勘之研究」,淡江大學管理科學研究所企業經營碩士在職專班,碩士論文,2010。

5.張瑜修,「消費者參與辦公室團購影響因素之研究-以宜蘭縣上班族為例」,佛光大學管理學系,碩士論文,2011。

6.曾元顯,「數位文件之資訊組織與主題分析自動化之技術與應用」,台北市立圖書館館訊,2002年,第二十卷,第二期,23-35。

7.喻欣凱,「運用支援向量機與文字探勘於股價漲跌趨勢之預測」,輔仁大學資訊管理學系,碩士論文,2008。

8.莊隆泰,「群體採購中間商系統之研究」,國立中山大學資訊管理研究所,碩士論文,2010。

9.詹益發,「網站部落格之顧客口碑評論分析研究-以台灣咖啡飲料市場為例」,元智大學資訊管理學系,碩士論文,2009。

10.楊惠琴,「網路合購知覺風險與合購意向影響因素之研究」,東吳大學國際貿易學系,碩士論文,2006。

11.廖婉如,「應用MOA理論探討團購主購者之忠誠行為-以知識交換為中介」,國立臺北大學企業管理學系,碩士論文,2010。

12.潘倧偉,「口碑與從眾行為對團購意圖之影響—以團購美食為例」,南台科技大學行銷與流通管理系,碩士論文,2010。

13.盧惠芬,「結合從眾行為探討影響網路團購購買意願因素」,中原大學國際貿易研究所,碩士論文,2010。

14.戴尚學,「運用事件偵測與追蹤技術於中文多文件摘要之研究」,國立雲林科技大學資訊管理研究所,碩士論文,2003。

15.戴維德,「使用最近鄰近分類法─以網路銀行為例」,南台科技大學國際企業系,碩士論文,2006。


英文文獻
1.Allen, V. L. (1965). Situational Factors in. Advances in Experimental and Social Psychology, Vol 2, ed. Leonard Berkowitz. New York, NY: Academic Press, 133-175.

2.Anand, K. S., & Aron, R. (2003). Group-buying on the Web: a comparison of price-discovery mechanisms. Management Science, 49(11), 1546-1562.

3.Arndt, J. (1967). Role of product-related conversations in the diffusion of a new product. Journal of Marketing research, 291–295.

4.Chen, K. J., Kiu, S. H. (1992). Word Identification for Mandarin Chinese Sentences. Fifth International Conference on Computational Linguistics, pp.101-107.

5.Cover, T., & Hart, P. (1967). Nearest neighbor pattern classification. Information Theory, IEEE Transactions on, 13(1), 21–27.

6.Godes, D., Mayzlin, D., Chen, Y., Das, S., Dellarocas, C., Pfeiffer, B., Libai, B., Sen, S., Shi, M., Verlegh, P., et al. (2005). The Firm’s Management of Social Interactions. Marketing Letters, 16(3-4) 415-428

7.Hanson, W. A. (2000). Principles of Internet Marketing. Ohio: South-Western College Publishing.

8.Larkey, L. S., & Croft, W. B. (1996). Combining classifiers in text categorization. Proceedings of the 19th annual international

9.Macinnis, H. (1997), Consumer Behavior, New York: Houghton Mifflin Company.

10.Nie, Jian-Yun, Brisebois, Martin & Ren, Xiaobo (1996). On Chinese Text Retrieval. Conference Proceedings of SIGIR, pp.225-233.

11.Salton, G., Wong, A., Yang, C. S. (1975). A Vector Space Model for Automatic Indexing. Communications of the ACM, v.18 n.11, pp.613-620.

12.Salton, G., McGill, M. (1983). Introduction to Modern Information Retrieval,New York: McGraw-Hill.

13.Salton, G. (1989). Automatic Text Processing. Addison-Wesley, Reading, Mass.

14.Snyder, P. (2004, Jun 28). Wanted: Standards for Viral Marketing. Brandweek. 45, 21-21

15.Sproat, R, Shih , C., 1990. A Statistical Method for Finding Word Boundaries in Chinese Text. Computer Processing of Chinese and Oriental Languages, pp.336-351.

16.Wilkie, W. L. (1994), Consumer Behavior, 3rd ed., New York: John Wiley and Sons Inc.

17.Yang, Y., Carbonell, J.G., Brown, R., Pierce, T., Archibald, B. T. & Liu, X. (1999). Learning Approaches for Detecting and Tracking News Events. IEEE Intelligent Systems, v.14 n.4, pp.32-43.


網路資料
1.CKIP中文斷詞系統,中央研究院(2012),取自http://ckipsvr.iis.sinica.edu.tw/。

2.「資策會MIC網友上網購物行為模式調查 搜尋特定商品、自行比價、瀏覽部落格、查詢訂單 」(2007.07.19),資策會(2012),
取自 http://mic.iii.org.tw/pop/micnews4_op_new.asp?sno=334&cred=2007/7/19,2007。

3.蘇文彬 ,「MIC:逾2成受訪網友去年曾網路團購 」,iThome online,取自 http://www.ithome.com.tw/itadm/article.php?c=65725,2011。
zh_TW