學術產出-Theses

Article View/Open

Publication Export

Google ScholarTM

政大圖書館

Citation Infomation

  • No doi shows Citation Infomation
題名 資料採礦預測系統之建構-以雲端運算為系統之主軸概念
The construction of data mining forecasting system-conception based on cloud computing
作者 廖婉婷
貢獻者 鄭宇庭<br>蔡紋琦<br>謝邦昌
廖婉婷
關鍵詞 資料採礦
雲端運算
預測
data mining
cloud computing
forecasting
日期 2010
上傳時間 5-Sep-2013 15:13:07 (UTC+8)
摘要 隨著網際網路越來越發達,資料量的膨脹速度也超乎想像,因此資料採礦的技術已是不可或缺的,而雲端運算產業也將是未來的趨勢。本研究以雲端運算的概念,透過VBA(Visual basic for application)、軟體R以及Excel的增益集-RExcel,建構一個資料採礦分析之預測(Forecasting)系統的介面。考慮將本研究所建的系統大眾化,即便使用者未具備足夠的統計知識,也可以簡易的操作本系統。因此本研究建構使用簡單且方便的資料採礦之預測(Forecasting)系統。

本研究的資料採礦之預測系統裡面包含了五種資料採礦分析的預測方法,包括了迴歸分析(Regression analysis)、分類迴歸樹(C & R tree)、時間序列分析(Time series analysis)、類神經網路(Neural net)以及羅吉斯迴歸分析(Logistic regression analysis),其中本系統的羅吉斯迴歸分析又細分為兩種,有二元羅吉斯迴歸分析(Dichotomous logistic)和多元羅吉斯迴歸分析(Polytomous logistic)。本研究的資料採礦之預測系統操作簡易,使用者只需要選取所要預測的目標變數和欲加入建模的解釋變數即可分析,系統可以自行判斷目標變數所屬的類別對資料做後續分析。




關鍵字:資料採礦、雲端運算、預測
As the Internet developed increasingly, the amount of data grow in unimaginable speed. Therefore, data mining techniques is essential, and cloud computing industry will be the future trend. This study which bases on the concept of cloud computing builds a data mining forecasting analysis system through VBA, the R language and add-ins of Excel –RExcel. The system which is builded in this study is convenient and easy. The user can operate the system easily, even if the user does not have sufficient statistical knowledge. Accordingly, this study constructs the simple and easy data mining analysis system of the forecasting.

In this study, the data mining analysis system of the forecasting contains five methods of data mining analysis : regression analysis, classification and classification & regression tree, time series analysis, neural network and logistic regression analysis. And logistic regression analysis could be separated two parts, Dichotomous logistic and Polytomous logistic . In this study, the data mining forecasting system is easy to operate, and the user need only select the target variable and explanatory variables which they need. In addition, the system could determine which categories of target variable.



Keyword:data mining、cloud computing、forecasting
參考文獻 中文文獻
江高舉(2010),跟我學ExcelVBA應用,台北市:碁峯資訊。
何東隆、李美真(2002),Excel2002VBA與進階應用,台北市:文魁資訊。
林育竹(2009),雲端運算的概念與運用,2010年01月05號,取自:中華民國資訊軟體協會e化部落 。
林姿華(2009),全世界漫步在雲端-淺談科技新知識『雲端運算』,國立高雄師範大學工業科技教育學系碩士班研究生。
林建甫(2006),R:統計計算與程式語言,取自:http://web.ntpu.edu.tw/~cflin。
范榮靖、王思勻(2009),雲威力>趨勢科技董事長張明正:雲端不只是技術,更改變商業模式,遠見雜誌,2009年9月號。
洪士吉(1999),操作輕鬆巨集通:Excel VBA巨集逐步操作指引,台北市:旗標出版社 。
桂思強(1995),深造ExcelVBA,台北市:博碩顧問有限公司 。
陳緯航(2009),雲端技術的另一片天空-雲端運算發展現況與應用趨勢,拓普產業研究所焦點報告。
陳景祥(2010),R軟體:應用統計方法,台北市:東華書局。
黃重憲(2009),淺談雲端運算(Cloud computing),國立台灣大學計算機集資訊網路中心電子報,第0008期。
http://eblog.cisanet.org.tw/post/Cloud-Computing.aspx。
黃俊英(1991),多變量分析(第四版),台北市:中國經濟企業研究所。
廖建翔(2003),Visual Basic軟體設計實務暑期課程(含資料庫應用與Excel應用),目標行銷研究學程。
蔡士源(2004),ExcelVBA語法字典,台北市:文魁資訊。
鄭順林(2004),資料採礦簡介。取自:國立成功大學統計系http://www.stat.ncku.edu.tw/faculty_private/sljeng/Datamining/introduction.htm。
謝邦昌、鄭宇庭、蘇志雄(2009),Dataminig概述,新北市:中華資料採礦協會。
瀨戶 遙(2002),嗯!Excel VBA我也會PRO,新北市:碩博文化。
鐘樹人(譯)(2003),格網:打破個人電腦運算的界線,科學人雜誌,2003年5月號。
Excel Home(2010),最新ExcelVBA活用範例大辭典,新北市:博碩文化。

英文文獻
Berry, M. J. A. and G. Linoff (1997), Data Mining Technique for Marketing, Sale, and Customer Support, Wiley Computer.
Crawley, M. J. (2007), The R book.. Chichester, West Sussex, England ; Hoboken, N.J. : Wiley.
Heiberger, R. M. and E. Neuwirth(2009), R through Excel. New York : Springer.
Jelen, B. and T. Syrstand(2008), VBA and macros for Microsoft Office Excel2007. Indianapolis, Ins. : Que.
Kleniner, K.(2008),Cloud Computing on the Rise-The World Mind is Upon Us, http://singularityhub.com/2008/07/29/cloud-computing-on-the-rise-the-world-mind-is-upon-us/.
Maindonald, J. H. and W. J. Braun(2007), Data analysis and graphics using R : an example-based approach(2nd edition).Cambridge, U.K. ; New York : Cambridge University Press.
Paradis, E.(2005), R for beginners. [Electronic version].
Witten, I. H. and F. Eibe(2005), Data miming : practical machine learning tools and techniques. Amsterdam, The Netherlands ; Boston, Mass. : Morgan Kaufman.
Westphal, C. R. and T. Blaxton(1998), Data miming solutions : methods and tools for solving real-world problems. New York : John Wiley & Sons.

相關網站
維基百科 http://zh.wikipedia.org/wiki/Wikipedia:%E9%A6%96%E9%A1%B5。
東方國際網路開發 http://dofan.weebly.com/。
諾頓防毒(Norton)http://www.nortonopscenter.com/?lang=tw。
甲骨文http://www.oracle.com。
X-POS雲通商務網 http://www.xpos.tw/。
精誠資訊 http://www.systex.com.tw/。
淡江大學Net-Stat http://netstat.stat.tku.edu.tw/。
iThome http://www.ithome.com.tw/itadm/channel.php?tab=1。
CRISP-DM http://www.crisp-dm.org/。
描述 碩士
國立政治大學
統計研究所
98354015
99
資料來源 http://thesis.lib.nccu.edu.tw/record/#G0098354015
資料類型 thesis
dc.contributor.advisor 鄭宇庭<br>蔡紋琦<br>謝邦昌zh_TW
dc.contributor.author (Authors) 廖婉婷zh_TW
dc.creator (作者) 廖婉婷zh_TW
dc.date (日期) 2010en_US
dc.date.accessioned 5-Sep-2013 15:13:07 (UTC+8)-
dc.date.available 5-Sep-2013 15:13:07 (UTC+8)-
dc.date.issued (上傳時間) 5-Sep-2013 15:13:07 (UTC+8)-
dc.identifier (Other Identifiers) G0098354015en_US
dc.identifier.uri (URI) http://nccur.lib.nccu.edu.tw/handle/140.119/60443-
dc.description (描述) 碩士zh_TW
dc.description (描述) 國立政治大學zh_TW
dc.description (描述) 統計研究所zh_TW
dc.description (描述) 98354015zh_TW
dc.description (描述) 99zh_TW
dc.description.abstract (摘要) 隨著網際網路越來越發達,資料量的膨脹速度也超乎想像,因此資料採礦的技術已是不可或缺的,而雲端運算產業也將是未來的趨勢。本研究以雲端運算的概念,透過VBA(Visual basic for application)、軟體R以及Excel的增益集-RExcel,建構一個資料採礦分析之預測(Forecasting)系統的介面。考慮將本研究所建的系統大眾化,即便使用者未具備足夠的統計知識,也可以簡易的操作本系統。因此本研究建構使用簡單且方便的資料採礦之預測(Forecasting)系統。

本研究的資料採礦之預測系統裡面包含了五種資料採礦分析的預測方法,包括了迴歸分析(Regression analysis)、分類迴歸樹(C & R tree)、時間序列分析(Time series analysis)、類神經網路(Neural net)以及羅吉斯迴歸分析(Logistic regression analysis),其中本系統的羅吉斯迴歸分析又細分為兩種,有二元羅吉斯迴歸分析(Dichotomous logistic)和多元羅吉斯迴歸分析(Polytomous logistic)。本研究的資料採礦之預測系統操作簡易,使用者只需要選取所要預測的目標變數和欲加入建模的解釋變數即可分析,系統可以自行判斷目標變數所屬的類別對資料做後續分析。




關鍵字:資料採礦、雲端運算、預測
zh_TW
dc.description.abstract (摘要) As the Internet developed increasingly, the amount of data grow in unimaginable speed. Therefore, data mining techniques is essential, and cloud computing industry will be the future trend. This study which bases on the concept of cloud computing builds a data mining forecasting analysis system through VBA, the R language and add-ins of Excel –RExcel. The system which is builded in this study is convenient and easy. The user can operate the system easily, even if the user does not have sufficient statistical knowledge. Accordingly, this study constructs the simple and easy data mining analysis system of the forecasting.

In this study, the data mining analysis system of the forecasting contains five methods of data mining analysis : regression analysis, classification and classification & regression tree, time series analysis, neural network and logistic regression analysis. And logistic regression analysis could be separated two parts, Dichotomous logistic and Polytomous logistic . In this study, the data mining forecasting system is easy to operate, and the user need only select the target variable and explanatory variables which they need. In addition, the system could determine which categories of target variable.



Keyword:data mining、cloud computing、forecasting
en_US
dc.description.tableofcontents 第一章 緒論 1
第一節 研究動機 1
第二節 研究目的 2
第三節 研究流程 3
第二章 文獻探討 5
第一節 雲端運算概述 5
一、 何謂雲端運算 5
二、 雲端運算的演化 7
三、 雲端運算的服務 8
第二節 資料採礦概述 12
一、 何謂資料採礦 12
二、 資料採礦流程 13
三、 資料採礦的功能 16
四、 資料採礦的應用 17
第三節 相關文獻之探討 19
第三章 研究方法 24
第一節 研究概念與架構 24
第二節 研究工具之簡介 26
一、 VBA之簡介 26
二、 R之簡介 29
三、 RExcel之簡介 32
第三節 預測功能介紹 33
第四節 系統設計架構 40
第四章 實例分析 42
第一節 系統作業環境 42
第二節 系統執行流程 44
第三節 系統實例操作 50
一、 時間數列型之目標變數實例分析 50
二、 數字型之目標變數實例分析(非時間數列) 56
三、 類別型之目標變數實例分析 62
第五章 結論與建議 89
第一節 結論 89
第二節 建議 91
參考文獻 93















圖目次
圖1-1 研究流程圖 4
圖2-1 雲端運算架構圖....................................................................................6
圖2-2 CRISP-DM 流程圖 14
圖2-3 雲端運算分散式資料庫管理 19
圖2-4 Niksun 資料倉儲架構 22
圖2-5 淡江大學Net-Stat的網頁 23
圖3-1 研究方法概念圖.................................................................................25
圖3-2 Excel VBA框架模型 28
圖3-3 Excel的Visual Basic編輯器 29
圖3-4 R軟體之程式編輯視窗 31
圖3-5 R工作示意圖 31
圖3-6 神經元示意圖 38
圖3-7 類神經網路架構 39
圖3-8 系統設計架構示意圖 41
圖4-1 上傳資料之圖示.................................................................................44
圖4-2 上傳欲分析資料之介面 45
圖4-3 讀檔視窗 45
圖4-4 檢視上傳資料 46
圖4-5 資料採礦功能之選擇 47
圖4-6 資料採礦之預測功能介面 47
圖4-7 系統之目標變數判別流程圖 49
圖4-8 上傳欲分析資料之介面 51
圖4-9 讀取檔案 51
圖4-10 檢視上傳資料之頁面 52
圖4-11 資料採礦功能之選擇 52
圖4-12 變數選擇 53
圖4-13 結果頁面預覽選擇 54
圖4-14 資料頁面 54
圖4-15 時間序列分析頁面 55
圖4-16 上傳欲分析資料之介面 57
圖4-17 讀取Babies資料檔 57
圖4-18 檢視上傳資料之頁面 58
圖4-19 資料採礦功能之選擇 58
圖4-20 變數選擇 59
圖4-21 結果頁面預覽選擇 60
圖4-22 資料頁面 60
圖4-23 迴歸分析分析頁面 61
圖4-24 分類迴歸樹分析頁面 61
圖4-25 上傳欲分析資料之介面 64
圖4-26 讀取Babies1資料檔 64
圖4-27 檢視上傳資料 65
圖4-28 資料採礦功能之選擇 65
圖4-29 變數選擇 66
圖4-30 結果頁面預覽選擇 67
圖4-31 資料頁面 67
圖4-32 類神經網路分析頁面 68
圖4-33 二元分類羅吉斯迴歸分析頁面 68
圖4-34 上傳欲分析資料之介面 70
圖4-35 讀取 iris1資料檔 71
圖4-36 檢視上傳資料 71
圖4-37 資料採礦功能之選擇 72
圖4-38 變數選擇 72
圖4-39 結果頁面預覽選擇 73
圖4-40 資料頁面 74
圖4-41 類神經網路分析頁面 74
圖4-42 多元分類羅吉斯迴歸分析頁面 75
圖4-43 上傳欲分析資料之介面 77
圖4-44 讀取Babies2資料檔 77
圖4-45 檢視上傳資料 78
圖4-46 資料採礦功能之選擇 78
圖4-47 變數選擇 79
圖4-48 結果頁面預覽選擇 80
圖4-49 資料頁面 80
圖4-50 類神經網路分析頁面 81
圖4-51 二元分類羅吉斯迴歸分析頁面 81
圖4-52 上傳欲分析資料 83
圖4-53 上傳iris資料檔 83
圖4-54 檢視上傳資料 84
圖4-55 選擇資料採礦功能 84
圖4-56 變數選擇 85
圖4-57 結果頁面預覽選擇 86
圖4-58 資料頁面 86
圖4-59 類神經網路分析頁面 87
圖4-60 多元分類羅吉斯迴歸分析頁面 87
表目錄
表2-1 雲端運算服務主要介紹 10
表2-2 各科技大廠雲端運算應用之比較 11
表2-3 資料採礦在各領域的應用 18
表2-4 X-POS雲通商務網的三種雲端採礦 20
表3-1 常用連接R軟體的VBA指令與指令簡介 .....................................32
表4-1 建構模型列.........................................................................................48
表4-2 lynx資料檔 50
表4-3 Babies資料檔 56
表4-4 Babies1資料檔 63
表4-5 iris1資料集 70
表4-6 Babies2資料檔 76
表4-7 iris資料集 82
zh_TW
dc.format.extent 4303218 bytes-
dc.format.mimetype application/pdf-
dc.language.iso en_US-
dc.source.uri (資料來源) http://thesis.lib.nccu.edu.tw/record/#G0098354015en_US
dc.subject (關鍵詞) 資料採礦zh_TW
dc.subject (關鍵詞) 雲端運算zh_TW
dc.subject (關鍵詞) 預測zh_TW
dc.subject (關鍵詞) data miningen_US
dc.subject (關鍵詞) cloud computingen_US
dc.subject (關鍵詞) forecastingen_US
dc.title (題名) 資料採礦預測系統之建構-以雲端運算為系統之主軸概念zh_TW
dc.title (題名) The construction of data mining forecasting system-conception based on cloud computingen_US
dc.type (資料類型) thesisen
dc.relation.reference (參考文獻) 中文文獻
江高舉(2010),跟我學ExcelVBA應用,台北市:碁峯資訊。
何東隆、李美真(2002),Excel2002VBA與進階應用,台北市:文魁資訊。
林育竹(2009),雲端運算的概念與運用,2010年01月05號,取自:中華民國資訊軟體協會e化部落 。
林姿華(2009),全世界漫步在雲端-淺談科技新知識『雲端運算』,國立高雄師範大學工業科技教育學系碩士班研究生。
林建甫(2006),R:統計計算與程式語言,取自:http://web.ntpu.edu.tw/~cflin。
范榮靖、王思勻(2009),雲威力>趨勢科技董事長張明正:雲端不只是技術,更改變商業模式,遠見雜誌,2009年9月號。
洪士吉(1999),操作輕鬆巨集通:Excel VBA巨集逐步操作指引,台北市:旗標出版社 。
桂思強(1995),深造ExcelVBA,台北市:博碩顧問有限公司 。
陳緯航(2009),雲端技術的另一片天空-雲端運算發展現況與應用趨勢,拓普產業研究所焦點報告。
陳景祥(2010),R軟體:應用統計方法,台北市:東華書局。
黃重憲(2009),淺談雲端運算(Cloud computing),國立台灣大學計算機集資訊網路中心電子報,第0008期。
http://eblog.cisanet.org.tw/post/Cloud-Computing.aspx。
黃俊英(1991),多變量分析(第四版),台北市:中國經濟企業研究所。
廖建翔(2003),Visual Basic軟體設計實務暑期課程(含資料庫應用與Excel應用),目標行銷研究學程。
蔡士源(2004),ExcelVBA語法字典,台北市:文魁資訊。
鄭順林(2004),資料採礦簡介。取自:國立成功大學統計系http://www.stat.ncku.edu.tw/faculty_private/sljeng/Datamining/introduction.htm。
謝邦昌、鄭宇庭、蘇志雄(2009),Dataminig概述,新北市:中華資料採礦協會。
瀨戶 遙(2002),嗯!Excel VBA我也會PRO,新北市:碩博文化。
鐘樹人(譯)(2003),格網:打破個人電腦運算的界線,科學人雜誌,2003年5月號。
Excel Home(2010),最新ExcelVBA活用範例大辭典,新北市:博碩文化。

英文文獻
Berry, M. J. A. and G. Linoff (1997), Data Mining Technique for Marketing, Sale, and Customer Support, Wiley Computer.
Crawley, M. J. (2007), The R book.. Chichester, West Sussex, England ; Hoboken, N.J. : Wiley.
Heiberger, R. M. and E. Neuwirth(2009), R through Excel. New York : Springer.
Jelen, B. and T. Syrstand(2008), VBA and macros for Microsoft Office Excel2007. Indianapolis, Ins. : Que.
Kleniner, K.(2008),Cloud Computing on the Rise-The World Mind is Upon Us, http://singularityhub.com/2008/07/29/cloud-computing-on-the-rise-the-world-mind-is-upon-us/.
Maindonald, J. H. and W. J. Braun(2007), Data analysis and graphics using R : an example-based approach(2nd edition).Cambridge, U.K. ; New York : Cambridge University Press.
Paradis, E.(2005), R for beginners. [Electronic version].
Witten, I. H. and F. Eibe(2005), Data miming : practical machine learning tools and techniques. Amsterdam, The Netherlands ; Boston, Mass. : Morgan Kaufman.
Westphal, C. R. and T. Blaxton(1998), Data miming solutions : methods and tools for solving real-world problems. New York : John Wiley & Sons.

相關網站
維基百科 http://zh.wikipedia.org/wiki/Wikipedia:%E9%A6%96%E9%A1%B5。
東方國際網路開發 http://dofan.weebly.com/。
諾頓防毒(Norton)http://www.nortonopscenter.com/?lang=tw。
甲骨文http://www.oracle.com。
X-POS雲通商務網 http://www.xpos.tw/。
精誠資訊 http://www.systex.com.tw/。
淡江大學Net-Stat http://netstat.stat.tku.edu.tw/。
iThome http://www.ithome.com.tw/itadm/channel.php?tab=1。
CRISP-DM http://www.crisp-dm.org/。
zh_TW