學術產出-Theses

Article View/Open

Publication Export

Google ScholarTM

政大圖書館

Citation Infomation

  • No doi shows Citation Infomation
題名 從電子化政府建立政府統計知識挖掘系統模型架構之研究~以內政統計為例
Research into a System Framework for Knowledge Discovery in the Context of Statistics Tasks within e-Government – on Examples of Interior Statistic
作者 江欣容
Chiang, Hsin Jung
貢獻者 姜國輝
Johannes, Chiang
江欣容
Chiang, Hsin Jung
關鍵詞 電子化政府
資料挖掘
知識發現
知識管理
決策支援系統
高階主管系統
政府統計
Electronic Government
Data Mining
Knowledge Discovery
Knowledge Management
Decision Support System
Executive Information System
Government Statistics
日期 2003
上傳時間 14-Sep-2009 09:09:10 (UTC+8)
摘要 各國政府為提高國際競爭優勢,紛紛積極推動「電子化政府」。我國電子化政府建設自八十六年起開始推動,迄今已經行政院擴大為e-Taiwan計畫。電子化政府推動之業務電腦化,帶動政府業務資訊系統的快速發展,其彙集而成之大型資料庫,為政府統計工作帶來莫大的發展契機。
     
      本研究從電子化政府的過程、內政業務行政程序、知識挖掘及採勘方法,提出參考資料模型,可能的統計軟體工具以及電子化政府中知識發現的實驗架構。再者,本研究藉臺閩地區外籍與大陸配偶結婚登記資料集,運用各種群集分析如K-means、ANN、TwoStep等,並利用我國人口數時間序列採用多模式方法進行人口預測,並將前述分析結果回饋資料庫,最後,作者實現一個知識發現系統雛型,其中包含了前端資料庫、資料集、知識庫以及EIS使用介面。
     
      本研究成果總結如下:(1)資料挖掘工作產出之知識,除真實呈現社會現象外,亦作為政府政策之指南;(2)在本研究發展之系統中,新興資料挖掘技術及傳統資料分析方法,二者相輔相成;(3)某些資料挖掘技術適合相符的資料型態,例如文中人口預測資料較適合指數平滑法勝於ANN,亦即,我們可以籍由多模式分析比較其結果,來達到更佳的效果;(4)藉由知識庫模型的建立達成知識創造、共享與管理的目標;(5)資料挖掘工作可以回饋改善資訊系統或業務缺失。
In order to enhance international competitive advantages, most of the government authorities over the world are engaging in realizing their e-Government platforms. The ROC Government began to develope its e-Government- Infrastructure since 1997, and up-to-date is expanding the e-Taiwan Project as a whole by Executive Yuan. The computerization of administration processes within various government agencies push forward fast development of administration information systems via handling administrative works and lead to utmost opportunities for the government statistics by means of very large databases.
     
      Starting from a survey on developements of e-Government, administrative processes for interior affairs, and knowledge mining as well as discovery techniques, this study brings out reference data models, potential statistical softwaretools, and an experimental framework as a whole for knowledge discovery in the context of e-Government. In the next step, this study experiments with applying clustering techniques such as K-means, ANN, and Twostep on datamart regarding marriage of foreigners ( including citizens from Mainland China ) in Taiwan, and with employeeing multi-modes approach on population forecasting. The results of aforementioned analysises are feed into backend database. At last, this author carries out a prototype of knowledge discovery system which includes front-end data base, data marts, knowledge base and interfaces to EIS.
     
      The results of the research can be summarized as following: 1.Knowledge derived by means of data mining is capable to represent social events / affairs as well as to serve as a kind of guideline for developing government ploicies. 2. The modern data-ming techniques and classical data-analysis approaches complement with each other in the system developed in this research. 3. Certain mining technique is suitable of corresponding data pattern, for example, expotential smoothing is more suitable for our population data than ANN, which means that we may often achieve better result by multi-mode analysis and comprison with the outputs of different modes. 4. Knowledge creation, sharing, and management can be achieved by means of the knowledge discovery processes on the framework developed in this research. 5. We can figure out errorful raw data in the mining output and feedback to the data source to improve its quality.
參考文獻 中文部分
1.電子化政府推動方案(九十至九十三年度),行政院研究發展考核委員會,九十年四月
2.「電子化政府報告書(九十一年度)-電子化政府之挑戰與契機」,行政院研究發展考核委員會,民國九十二年
3.政府再造運動,行政院研究發展考核委員會主任委員暨筆小組召集人 魏啟林編撰,晨星出版
4.數位化政府,賴世培、項靖、宋餘俠、曾章瑞、馮震宇、吳秀光、詹中原,空中大學印行
5.「統計實務」,宋欽增、李慶泉,民國七十九年九月
6.戶政e網通計畫 內政部戶政司
7.地政e網通計畫 內政部地政司
8.全國建築管理建置計畫 內政部營建署
9.營建知識管理系統計畫 內政部營建署
10.防救災資訊系統 內政部消防署
11.資料採礦理論與實務 客戶關係管理的技巧與科學, Michael J. A. Berry, Gordon S. Linoff, 吳旭志、賴淑貞 譯
12.資料採礦 顅客關係管理暨電子行銷之應用, Michael J. A. Berry, Gordon S. Linoff, 彭文正 博士 譯
13.資料採礦之簡易系統-以流行病學為例 政治大學統計學研究所碩士論文,90年5月,羅家蓉 撰
14.KDD系統-以民國八十三年至八十八年之死亡資料庫為例 政治大學統計學研究所碩士論文,90年5月,陳怡伶 撰
15.資料探勘 Data Mining A Tutorial-Based Primer, Richard J. Roiger, Michael W. Geatz著, 曾新穆、李建億譯, 東華
16.Data Mining 概述 – 以Clementine 7.0 為例, 韋端,鄭宇庭,鄧家駒,匡宏波,謝邦昌編著
17.SQL 2000 Analysis Service資料採礦服務, 尹相志, 維科
18.中華民國臺灣地區民國91年至140年人口推計, 行政院經濟建設委員會
19.計量經濟與時間序列分析SAS/ETS之運用,周文賢
20.人口統計,范子華
21.時間數列分析的SPSS使用手冊,陳耀茂,鼎茂
22.類神經網路概論, 蔡瑞煌, 三民
23.決策支援系統, 梁定澎, 松崗
英文部分
1.Advances in Knowledge Discovery and Data Mining, Usama M. Fayyad,Gregory Piatetsky-Shapiro, Padhraic Smyth, and Ramasamy Uthurusamy, AAAI Press/THE MIT Press.
2.Data Warehousing, Data Mining, and OLAP, Alex Berson ,Stephen J. Smith
3.An Overview of Data Mining at Dun & Bradstreet, DIGWhite Paper 95/01, Data Intelligence Group Pilot Software, http://www.thearling.com/
4.A Comparison of Leading Data Mining Tools, John F. Elder IV & Dean W. Abbott Elder Research, 4th International Conference on Knowledge Discovery & Data Mining, 1998
5.An Overview of Data Mining Techniques, Alex Berson, Stephen Smith, and Kurt Thearling, http://www.thearling.com/text/dmtechniques/dmtechniques.htm
6.Data Mining Product Features, EXCLUSIVE ORE® INC., http://www.xore.com/prodtable.html
7.Management Knowledge Building Blocks for Success, Gilbert Probst Steffen Raub Kai Romhardt
8.How to Build a More Cost-Effective and Flexible Warehouse, R.A. Moeller
描述 碩士
國立政治大學
資訊管理研究所
89356026
92
資料來源 http://thesis.lib.nccu.edu.tw/record/#G0089356026
資料類型 thesis
dc.contributor.advisor 姜國輝zh_TW
dc.contributor.advisor Johannes, Chiangen_US
dc.contributor.author (Authors) 江欣容zh_TW
dc.contributor.author (Authors) Chiang, Hsin Jungen_US
dc.creator (作者) 江欣容zh_TW
dc.creator (作者) Chiang, Hsin Jungen_US
dc.date (日期) 2003en_US
dc.date.accessioned 14-Sep-2009 09:09:10 (UTC+8)-
dc.date.available 14-Sep-2009 09:09:10 (UTC+8)-
dc.date.issued (上傳時間) 14-Sep-2009 09:09:10 (UTC+8)-
dc.identifier (Other Identifiers) G0089356026en_US
dc.identifier.uri (URI) https://nccur.lib.nccu.edu.tw/handle/140.119/31047-
dc.description (描述) 碩士zh_TW
dc.description (描述) 國立政治大學zh_TW
dc.description (描述) 資訊管理研究所zh_TW
dc.description (描述) 89356026zh_TW
dc.description (描述) 92zh_TW
dc.description.abstract (摘要) 各國政府為提高國際競爭優勢,紛紛積極推動「電子化政府」。我國電子化政府建設自八十六年起開始推動,迄今已經行政院擴大為e-Taiwan計畫。電子化政府推動之業務電腦化,帶動政府業務資訊系統的快速發展,其彙集而成之大型資料庫,為政府統計工作帶來莫大的發展契機。
     
      本研究從電子化政府的過程、內政業務行政程序、知識挖掘及採勘方法,提出參考資料模型,可能的統計軟體工具以及電子化政府中知識發現的實驗架構。再者,本研究藉臺閩地區外籍與大陸配偶結婚登記資料集,運用各種群集分析如K-means、ANN、TwoStep等,並利用我國人口數時間序列採用多模式方法進行人口預測,並將前述分析結果回饋資料庫,最後,作者實現一個知識發現系統雛型,其中包含了前端資料庫、資料集、知識庫以及EIS使用介面。
     
      本研究成果總結如下:(1)資料挖掘工作產出之知識,除真實呈現社會現象外,亦作為政府政策之指南;(2)在本研究發展之系統中,新興資料挖掘技術及傳統資料分析方法,二者相輔相成;(3)某些資料挖掘技術適合相符的資料型態,例如文中人口預測資料較適合指數平滑法勝於ANN,亦即,我們可以籍由多模式分析比較其結果,來達到更佳的效果;(4)藉由知識庫模型的建立達成知識創造、共享與管理的目標;(5)資料挖掘工作可以回饋改善資訊系統或業務缺失。
zh_TW
dc.description.abstract (摘要) In order to enhance international competitive advantages, most of the government authorities over the world are engaging in realizing their e-Government platforms. The ROC Government began to develope its e-Government- Infrastructure since 1997, and up-to-date is expanding the e-Taiwan Project as a whole by Executive Yuan. The computerization of administration processes within various government agencies push forward fast development of administration information systems via handling administrative works and lead to utmost opportunities for the government statistics by means of very large databases.
     
      Starting from a survey on developements of e-Government, administrative processes for interior affairs, and knowledge mining as well as discovery techniques, this study brings out reference data models, potential statistical softwaretools, and an experimental framework as a whole for knowledge discovery in the context of e-Government. In the next step, this study experiments with applying clustering techniques such as K-means, ANN, and Twostep on datamart regarding marriage of foreigners ( including citizens from Mainland China ) in Taiwan, and with employeeing multi-modes approach on population forecasting. The results of aforementioned analysises are feed into backend database. At last, this author carries out a prototype of knowledge discovery system which includes front-end data base, data marts, knowledge base and interfaces to EIS.
     
      The results of the research can be summarized as following: 1.Knowledge derived by means of data mining is capable to represent social events / affairs as well as to serve as a kind of guideline for developing government ploicies. 2. The modern data-ming techniques and classical data-analysis approaches complement with each other in the system developed in this research. 3. Certain mining technique is suitable of corresponding data pattern, for example, expotential smoothing is more suitable for our population data than ANN, which means that we may often achieve better result by multi-mode analysis and comprison with the outputs of different modes. 4. Knowledge creation, sharing, and management can be achieved by means of the knowledge discovery processes on the framework developed in this research. 5. We can figure out errorful raw data in the mining output and feedback to the data source to improve its quality.
en_US
dc.description.tableofcontents 目 錄
     表 目 錄 II
     圖 目 錄 IV
     第一章 緒論 1
     第1節 我國電子化政府的推動 1
     第2節 政府的統計工作及電子化政府帶來的衝擊及發展契機 2
     第3節 研究目的 3
     第4節 論文架構 3
     第二章 文獻探討 5
     第1節 電子化政府 5
     第2節 內政業務電子化概況 7
     第3節 知識挖掘(Knowledge Discovery) 10
     第三章 研究設計及方法 35
     第1節 研究資料來源說明 35
     第2節 研究架構圖 35
     第3節 研究限制 39
     第4節 本研究使用的軟體 39
     第四章 研究結果(一)知識模型之建立 40
     第1節 國籍別結婚登記資料分析(以91年結婚登記按發生日期統計資料為例) 40
     第2節 人口預測 53
     第五章 研究結果(二)知識挖掘模式庫之建模與部署 66
     第1節 知識挖掘系統模式庫建置架構圖 66
     第2節 模式庫的建置 67
     第3節 知識展示與應用-主管查詢之建置 71
     第六章 結論與建議 72
     第1節 結論 72
     第2節 實質環境的限制 73
     第3節 後續研究者之建議 74
     參考文獻: 76
     
     表 目 錄
     表2-1 內政業務電子化政府推動方案 7
     表2-2 Data mining演進步驟 14
     表2-3資料倉儲與操作型資料庫比較表 16
     表2-4 Data Mining任務表(一) 17
     表2-5 Data Mining任務表(二) 18
     表2-6 Data Mining常用技術列表(一) 19
     表2-7 Data Mining常用技術列表(二) 20
     表2-8 常用時間序列分析方法 28
     表2-9 Data Mining軟體 29
     表2-10 Data Mining產品特性表 30
     表3-1 知識庫模型管理類別 36
     表3-2 知識庫模型儲存欄位內容及屬性 37
     表4-1 結婚動態統計資料項目內容 40
     表4-2代碼轉換對照表 41
     表4-3 Clementine7.0 暫時及最終採礦結果儲存區 43
     表4-4 Clementine7.0 資料分析 44
     表4-5 Clementine7.0資料前處理 45
     表4-6 Clementine7.0資料轉換 46
     表4-7 Clementine7.0進行資料挖掘 46
     表4-8 Clementine7.0模型結果解釋及描述 46
     表4-9 91年外籍與大陸新娘分群結果 48
     表4-10 91年外籍與大陸新郎分群結果 50
     表4-11 91年外籍與大陸配偶樣型描述對照表 51
     表4-12 人口數Yt與時間Pearson相關係數檢定 62
     表4-13 不同模型推估人口分析表 65
     
     
     圖 目 錄
     
     圖2-1 基本架構圖 6
     圖2-2主要內政資訊系統/資料庫關係圖 8
     圖2-3 KDD process 12
     圖2-4決策樹 23
     圖2-5 K-means 演算法計算流程 24
     圖2-6 E-M演算法計算流程 25
     圖2-7 網路架構圖 26
     圖2-8 iDA系統架構圖 32
     圖2-9 Analysis Service 系統架構圖 34
     圖3-1 研究架構圖 38
     圖4-1 外籍與大陸配偶群集分析專案模型 42
     圖4-2 Clementine 7.0 專案管理區 43
     圖4-3 外籍與大陸新娘夫*妻年齡散佈圖 48
     圖4-4 外籍與大陸新郎夫*妻年齡散佈圖 50
     圖4-5 行政院經濟建設委員會人口推估流程圖 54
     圖4-6 86年1月至93年5月人口成長圖 54
     圖4-7 86年1月至93年5月人口趨勢圖 55
     圖4-8 86年1月至93年5月人口ACF圖分析 56
     圖4-9 86年1月至93年5月以人口Partial ACF圖分析 57
     圖4-10 86年1月至93年5月人口季節變動分析 58
     圖4-11 人口推測資料採礦模型圖 59
     圖4-12 類神經網路架構圖 63
     圖4-13 各種時間序列模型學習與預測結果圖 64
     圖5-1知識挖掘系統與其模式庫建置架構圖 66
     圖5-2內政統計知識挖掘系統模式庫介面 67
     圖5-3內政統計知識挖掘系統模式維護介面 68
     圖5-4內政統計知識挖掘系統模式新增介面 68
     圖5-5內政統計知識挖掘系統模式查詢介面 69
     圖5-6內政統計知識挖掘系統模式修改介面(一) 69
     圖5-7內政統計知識挖掘系統模式修改介面(二) 70
     圖5-8內政統計知識挖掘系統模式刪除介面 70
     圖5-9內政統計知識挖掘系統主管查詢介面 71
     圖6-1知識挖掘系統模式庫中之資料存取權限控管機制 74
zh_TW
dc.language.iso en_US-
dc.source.uri (資料來源) http://thesis.lib.nccu.edu.tw/record/#G0089356026en_US
dc.subject (關鍵詞) 電子化政府zh_TW
dc.subject (關鍵詞) 資料挖掘zh_TW
dc.subject (關鍵詞) 知識發現zh_TW
dc.subject (關鍵詞) 知識管理zh_TW
dc.subject (關鍵詞) 決策支援系統zh_TW
dc.subject (關鍵詞) 高階主管系統zh_TW
dc.subject (關鍵詞) 政府統計zh_TW
dc.subject (關鍵詞) Electronic Governmenten_US
dc.subject (關鍵詞) Data Miningen_US
dc.subject (關鍵詞) Knowledge Discoveryen_US
dc.subject (關鍵詞) Knowledge Managementen_US
dc.subject (關鍵詞) Decision Support Systemen_US
dc.subject (關鍵詞) Executive Information Systemen_US
dc.subject (關鍵詞) Government Statisticsen_US
dc.title (題名) 從電子化政府建立政府統計知識挖掘系統模型架構之研究~以內政統計為例zh_TW
dc.title (題名) Research into a System Framework for Knowledge Discovery in the Context of Statistics Tasks within e-Government – on Examples of Interior Statisticen_US
dc.type (資料類型) thesisen
dc.relation.reference (參考文獻) 中文部分zh_TW
dc.relation.reference (參考文獻) 1.電子化政府推動方案(九十至九十三年度),行政院研究發展考核委員會,九十年四月zh_TW
dc.relation.reference (參考文獻) 2.「電子化政府報告書(九十一年度)-電子化政府之挑戰與契機」,行政院研究發展考核委員會,民國九十二年zh_TW
dc.relation.reference (參考文獻) 3.政府再造運動,行政院研究發展考核委員會主任委員暨筆小組召集人 魏啟林編撰,晨星出版zh_TW
dc.relation.reference (參考文獻) 4.數位化政府,賴世培、項靖、宋餘俠、曾章瑞、馮震宇、吳秀光、詹中原,空中大學印行zh_TW
dc.relation.reference (參考文獻) 5.「統計實務」,宋欽增、李慶泉,民國七十九年九月zh_TW
dc.relation.reference (參考文獻) 6.戶政e網通計畫 內政部戶政司zh_TW
dc.relation.reference (參考文獻) 7.地政e網通計畫 內政部地政司zh_TW
dc.relation.reference (參考文獻) 8.全國建築管理建置計畫 內政部營建署zh_TW
dc.relation.reference (參考文獻) 9.營建知識管理系統計畫 內政部營建署zh_TW
dc.relation.reference (參考文獻) 10.防救災資訊系統 內政部消防署zh_TW
dc.relation.reference (參考文獻) 11.資料採礦理論與實務 客戶關係管理的技巧與科學, Michael J. A. Berry, Gordon S. Linoff, 吳旭志、賴淑貞 譯zh_TW
dc.relation.reference (參考文獻) 12.資料採礦 顅客關係管理暨電子行銷之應用, Michael J. A. Berry, Gordon S. Linoff, 彭文正 博士 譯zh_TW
dc.relation.reference (參考文獻) 13.資料採礦之簡易系統-以流行病學為例 政治大學統計學研究所碩士論文,90年5月,羅家蓉 撰zh_TW
dc.relation.reference (參考文獻) 14.KDD系統-以民國八十三年至八十八年之死亡資料庫為例 政治大學統計學研究所碩士論文,90年5月,陳怡伶 撰zh_TW
dc.relation.reference (參考文獻) 15.資料探勘 Data Mining A Tutorial-Based Primer, Richard J. Roiger, Michael W. Geatz著, 曾新穆、李建億譯, 東華zh_TW
dc.relation.reference (參考文獻) 16.Data Mining 概述 – 以Clementine 7.0 為例, 韋端,鄭宇庭,鄧家駒,匡宏波,謝邦昌編著zh_TW
dc.relation.reference (參考文獻) 17.SQL 2000 Analysis Service資料採礦服務, 尹相志, 維科zh_TW
dc.relation.reference (參考文獻) 18.中華民國臺灣地區民國91年至140年人口推計, 行政院經濟建設委員會zh_TW
dc.relation.reference (參考文獻) 19.計量經濟與時間序列分析SAS/ETS之運用,周文賢zh_TW
dc.relation.reference (參考文獻) 20.人口統計,范子華zh_TW
dc.relation.reference (參考文獻) 21.時間數列分析的SPSS使用手冊,陳耀茂,鼎茂zh_TW
dc.relation.reference (參考文獻) 22.類神經網路概論, 蔡瑞煌, 三民zh_TW
dc.relation.reference (參考文獻) 23.決策支援系統, 梁定澎, 松崗zh_TW
dc.relation.reference (參考文獻) 英文部分zh_TW
dc.relation.reference (參考文獻) 1.Advances in Knowledge Discovery and Data Mining, Usama M. Fayyad,Gregory Piatetsky-Shapiro, Padhraic Smyth, and Ramasamy Uthurusamy, AAAI Press/THE MIT Press.zh_TW
dc.relation.reference (參考文獻) 2.Data Warehousing, Data Mining, and OLAP, Alex Berson ,Stephen J. Smithzh_TW
dc.relation.reference (參考文獻) 3.An Overview of Data Mining at Dun & Bradstreet, DIGWhite Paper 95/01, Data Intelligence Group Pilot Software, http://www.thearling.com/zh_TW
dc.relation.reference (參考文獻) 4.A Comparison of Leading Data Mining Tools, John F. Elder IV & Dean W. Abbott Elder Research, 4th International Conference on Knowledge Discovery & Data Mining, 1998zh_TW
dc.relation.reference (參考文獻) 5.An Overview of Data Mining Techniques, Alex Berson, Stephen Smith, and Kurt Thearling, http://www.thearling.com/text/dmtechniques/dmtechniques.htmzh_TW
dc.relation.reference (參考文獻) 6.Data Mining Product Features, EXCLUSIVE ORE® INC., http://www.xore.com/prodtable.htmlzh_TW
dc.relation.reference (參考文獻) 7.Management Knowledge Building Blocks for Success, Gilbert Probst Steffen Raub Kai Romhardtzh_TW
dc.relation.reference (參考文獻) 8.How to Build a More Cost-Effective and Flexible Warehouse, R.A. Moellerzh_TW