學術產出-Theses

Article View/Open

Publication Export

Google ScholarTM

政大圖書館

Citation Infomation

  • No doi shows Citation Infomation
題名 導入資料採礦技術於營業稅智慧型選案之查核
Application of data mining techniques in business tax case selection
作者 曾雨慈
貢獻者 鄭宇庭
曾雨慈
關鍵詞 營業稅
逃漏稅
資料採礦
日期 2010
上傳時間 29-Sep-2011 16:46:20 (UTC+8)
摘要 營業稅佔全國賦稅實徵淨額總計的百分之十以上,僅次於營利事業所得稅及綜合所得稅,為國家重要稅收來源。由於營業人常利用各種方式來逃漏營業稅,使得國家稅收連年短徵,加上稽查人員人力不足且查核人員流動率高使得查核經驗無法傳承,故本研究欲在現行的選案制度下,建立一套營業稅智慧型選案查核作業流程,使得查核人員能夠更有效率且準確的進行查核,遏止營業人心存僥倖和觀望,杜絕逃漏稅情事,以增加國家稅收。
      本研究導入資料採礦技術,以98年度零稅率冒退為例,以該年度營業人為主要的研究對象,透過本研究所建構之建模標準流程,分別利用C5.1、CHAID、QUEST、C&R Tree、羅吉斯迴歸及類神經網路等六種方法建立冒退機率模型,並加以評估及比較其預測能力。研究結果發現,經評估確立以冒退對非冒退人數之比例為1:2之下,使用C5.1分類樹技術建模的效果最佳,共有十個變數納入分類規則中,其中影響營業人冒退之最重要的變數為「應退稅額」,並產生54個判斷營業人冒退之規則。
     透過本研究建立之嚴謹的建模標準流程,所產之冒退規則模型,經驗證後,此模型具有一定的穩定性與預測效力,在模型整體正確率(Accuracy)平均而言約有90%之預測率、反查率(Recall)平均而言約有85%之預測率及F-measure平均而言約有80%之預測率,故本研究所建構之建模標準流程確實能夠在國稅局冒退查核流程實務中加以應用。相信本研究所建立之建模標準流程,可提供國稅局查核人員於未來查核逃漏之際,無論是何種查核項目,皆可按此流程,達到有效率且準確的查核結果,進而杜絕逃漏稅情事,方能增加國家稅收。
參考文獻 中文文獻:
1. 田倚權、何永鑫(2004),「營業稅違章型態及案例之研究」,財政部台灣省中
區國稅局93 年度列管研究發展報告。
2. 吳德章(1988),「我國營業稅逃漏型態及防制方法之研究」,私立中國文化大
學經濟研究所碩士論文。
3. 吳進照(2003),「類神經網路於營利事業所得稅選案之應用」,國立中央大學
資訊工程研究所碩士論文。
4. 吳慶輝(2006),「資料探勘技術於營利事業所得稅逃漏稅選查之應用」,國立
中正大學會計與資訊科技研究所碩士論文。
5. 林坤淵(2002),「營利事業所得逃漏稅預測模式之比較研究」,國立交通大學
經營管理研究所碩士論文。
6. 林惠英(2006),「應用資料探勘技術於營業稅逃漏稅選案之研究」,國立中正
大學會計與資訊科技研究所碩士論文。
7. 施肇華(2002),我國營利事業所得稅查核方式暨一般逃漏稅查緝方法之研
究,私立中原大學會計研究所碩士論文。
8. 陳彥文(2003),「類神經網路之應用-以營業稅選案模型為例」,私立銘傳大學
資訊管理學系碩士論文。
9. 陳佳樟(2007),「導入資料採礦技術於新巴賽爾協定下企業信用模型-以製造
業為例」,國立政治大學統計研究所碩士論文。
10. 陳雨農(2010),「應用資料採礦技術於數位相機產業消費者行為研究」,國立
政治大學統計研究所碩士論文。
11. 張玉霜(2004),「類神經網路應用於綜合所得稅選案查核之研究」,國立成功
大學工業與資訊管理學研究所碩士論文。
12. 楊永欽(2002),「預測模型在稅務選案上之比較」,私立靜宜大學會計學研究
所碩士論文。
13. 黃炎輝、何添義(2006),「營建業稅務法規與會計處理」,稅旬文化出版事業公司。
14. 黃傳益(2008),「使用資料探勘技術於稅務資料中判斷虛設行號之研究」,國
立成功大學工學院工程管理專班碩士論文。
15. 謝燿隆(2004),「運用資料探勘技術探討執行業務所得選案機制」,國立成功
大學工學院工程管理專班碩士論文。
16. 謝邦昌、鄭宇庭、蘇志雄(2009),「Data Mining概述-以Clementine 12.0為例」,
中華資料採礦協會。
17. 羅浩禎(2009),「應用資料採礦技術建置中小企業傳統產業之信用評等系
統」,國立政治大學統計研究所碩士論文。
英文文獻:
1. Breiman L., J. H. Friedman, R. A. Olshen and C. J. Stone (1984), “Classification and Regression Tree”, Wadsworth, California.
2. Freeman, J. A. and D. M. Skapura (1992), “ Neural Networks Algorithms, Applications, and Programming Techniques”, Addison-Wesley Publishing Company: New York.
3. Loh, W. Y. and Y. S. Shih (1997), “Split selection methods for classification trees”, Statistica Sinica, Vol. 7, 1997, pp.815-840.
4. McClelland, J. L., D. E. Rumelhart and the PDP Research Group (1986), “Parallel Distribution Processing: Explorations in the Microstructure of Cognition ”, Vol. 2, Psychological and Biological Models. Cambridge, MA: MIT Press.
5. Perreault, W. D. and H. C. Barksdale (1980), “A model-free approach for analysis of complex contingency data in survey research”, Journal of Marketing Research, Vol. 17 (November), 503-515.
6. Quinlan, J. R. (1979), “Discovering rules from large collections of examples: a case study”, In Michie, D., editor, Expert Systems in the Microelectronic Age. Edinburgh University Press, Edinburgh Scotland.
7. Whitney, A. (1971), “A direct method of nonparametric measurement selection.IEEE Trans ”, Computer, 20:1100-1103.
描述 碩士
國立政治大學
統計研究所
98354013
99
資料來源 http://thesis.lib.nccu.edu.tw/record/#G0983540131
資料類型 thesis
dc.contributor.advisor 鄭宇庭zh_TW
dc.contributor.author (Authors) 曾雨慈zh_TW
dc.creator (作者) 曾雨慈zh_TW
dc.date (日期) 2010en_US
dc.date.accessioned 29-Sep-2011 16:46:20 (UTC+8)-
dc.date.available 29-Sep-2011 16:46:20 (UTC+8)-
dc.date.issued (上傳時間) 29-Sep-2011 16:46:20 (UTC+8)-
dc.identifier (Other Identifiers) G0983540131en_US
dc.identifier.uri (URI) http://nccur.lib.nccu.edu.tw/handle/140.119/50812-
dc.description (描述) 碩士zh_TW
dc.description (描述) 國立政治大學zh_TW
dc.description (描述) 統計研究所zh_TW
dc.description (描述) 98354013zh_TW
dc.description (描述) 99zh_TW
dc.description.abstract (摘要) 營業稅佔全國賦稅實徵淨額總計的百分之十以上,僅次於營利事業所得稅及綜合所得稅,為國家重要稅收來源。由於營業人常利用各種方式來逃漏營業稅,使得國家稅收連年短徵,加上稽查人員人力不足且查核人員流動率高使得查核經驗無法傳承,故本研究欲在現行的選案制度下,建立一套營業稅智慧型選案查核作業流程,使得查核人員能夠更有效率且準確的進行查核,遏止營業人心存僥倖和觀望,杜絕逃漏稅情事,以增加國家稅收。
      本研究導入資料採礦技術,以98年度零稅率冒退為例,以該年度營業人為主要的研究對象,透過本研究所建構之建模標準流程,分別利用C5.1、CHAID、QUEST、C&R Tree、羅吉斯迴歸及類神經網路等六種方法建立冒退機率模型,並加以評估及比較其預測能力。研究結果發現,經評估確立以冒退對非冒退人數之比例為1:2之下,使用C5.1分類樹技術建模的效果最佳,共有十個變數納入分類規則中,其中影響營業人冒退之最重要的變數為「應退稅額」,並產生54個判斷營業人冒退之規則。
     透過本研究建立之嚴謹的建模標準流程,所產之冒退規則模型,經驗證後,此模型具有一定的穩定性與預測效力,在模型整體正確率(Accuracy)平均而言約有90%之預測率、反查率(Recall)平均而言約有85%之預測率及F-measure平均而言約有80%之預測率,故本研究所建構之建模標準流程確實能夠在國稅局冒退查核流程實務中加以應用。相信本研究所建立之建模標準流程,可提供國稅局查核人員於未來查核逃漏之際,無論是何種查核項目,皆可按此流程,達到有效率且準確的查核結果,進而杜絕逃漏稅情事,方能增加國家稅收。
zh_TW
dc.description.tableofcontents 摘要 I
     目錄 IIV
     表次 V
     圖次 VI
     第一章 緒論 1
     第一節 研究背景與動機 1
     第二節 研究目的 3
     第三節 研究流程 5
     第二章 文獻探討 6
     第一節 營業稅介紹 6
     第二節 資料探勘 14
     第三節 探討應用資料探勘技術於選案模式之相關研究 17
     第三章 研究方法 19
     第一節 資料來源與介紹 19
     第二節 研究流程 19
     第三節 研究方法 23
     第四章 實證分析 37
     第一節 變數處理及選取建模變數 37
     第二節 抽樣比例配置與模型比較 41
     第三節 建置冒退規則模型 45
     第四節 模型評估及驗證 64
     第五節 查核與回饋 65
     第五章 結論與建議 66
     第一節 結論 66
     第二節 建議 67
     參考文獻 68
     附錄 71
zh_TW
dc.language.iso en_US-
dc.source.uri (資料來源) http://thesis.lib.nccu.edu.tw/record/#G0983540131en_US
dc.subject (關鍵詞) 營業稅zh_TW
dc.subject (關鍵詞) 逃漏稅zh_TW
dc.subject (關鍵詞) 資料採礦zh_TW
dc.title (題名) 導入資料採礦技術於營業稅智慧型選案之查核zh_TW
dc.title (題名) Application of data mining techniques in business tax case selectionen_US
dc.type (資料類型) thesisen
dc.relation.reference (參考文獻) 中文文獻:zh_TW
dc.relation.reference (參考文獻) 1. 田倚權、何永鑫(2004),「營業稅違章型態及案例之研究」,財政部台灣省中zh_TW
dc.relation.reference (參考文獻) 區國稅局93 年度列管研究發展報告。zh_TW
dc.relation.reference (參考文獻) 2. 吳德章(1988),「我國營業稅逃漏型態及防制方法之研究」,私立中國文化大zh_TW
dc.relation.reference (參考文獻) 學經濟研究所碩士論文。zh_TW
dc.relation.reference (參考文獻) 3. 吳進照(2003),「類神經網路於營利事業所得稅選案之應用」,國立中央大學zh_TW
dc.relation.reference (參考文獻) 資訊工程研究所碩士論文。zh_TW
dc.relation.reference (參考文獻) 4. 吳慶輝(2006),「資料探勘技術於營利事業所得稅逃漏稅選查之應用」,國立zh_TW
dc.relation.reference (參考文獻) 中正大學會計與資訊科技研究所碩士論文。zh_TW
dc.relation.reference (參考文獻) 5. 林坤淵(2002),「營利事業所得逃漏稅預測模式之比較研究」,國立交通大學zh_TW
dc.relation.reference (參考文獻) 經營管理研究所碩士論文。zh_TW
dc.relation.reference (參考文獻) 6. 林惠英(2006),「應用資料探勘技術於營業稅逃漏稅選案之研究」,國立中正zh_TW
dc.relation.reference (參考文獻) 大學會計與資訊科技研究所碩士論文。zh_TW
dc.relation.reference (參考文獻) 7. 施肇華(2002),我國營利事業所得稅查核方式暨一般逃漏稅查緝方法之研zh_TW
dc.relation.reference (參考文獻) 究,私立中原大學會計研究所碩士論文。zh_TW
dc.relation.reference (參考文獻) 8. 陳彥文(2003),「類神經網路之應用-以營業稅選案模型為例」,私立銘傳大學zh_TW
dc.relation.reference (參考文獻) 資訊管理學系碩士論文。zh_TW
dc.relation.reference (參考文獻) 9. 陳佳樟(2007),「導入資料採礦技術於新巴賽爾協定下企業信用模型-以製造zh_TW
dc.relation.reference (參考文獻) 業為例」,國立政治大學統計研究所碩士論文。zh_TW
dc.relation.reference (參考文獻) 10. 陳雨農(2010),「應用資料採礦技術於數位相機產業消費者行為研究」,國立zh_TW
dc.relation.reference (參考文獻) 政治大學統計研究所碩士論文。zh_TW
dc.relation.reference (參考文獻) 11. 張玉霜(2004),「類神經網路應用於綜合所得稅選案查核之研究」,國立成功zh_TW
dc.relation.reference (參考文獻) 大學工業與資訊管理學研究所碩士論文。zh_TW
dc.relation.reference (參考文獻) 12. 楊永欽(2002),「預測模型在稅務選案上之比較」,私立靜宜大學會計學研究zh_TW
dc.relation.reference (參考文獻) 所碩士論文。zh_TW
dc.relation.reference (參考文獻) 13. 黃炎輝、何添義(2006),「營建業稅務法規與會計處理」,稅旬文化出版事業公司。zh_TW
dc.relation.reference (參考文獻) 14. 黃傳益(2008),「使用資料探勘技術於稅務資料中判斷虛設行號之研究」,國zh_TW
dc.relation.reference (參考文獻) 立成功大學工學院工程管理專班碩士論文。zh_TW
dc.relation.reference (參考文獻) 15. 謝燿隆(2004),「運用資料探勘技術探討執行業務所得選案機制」,國立成功zh_TW
dc.relation.reference (參考文獻) 大學工學院工程管理專班碩士論文。zh_TW
dc.relation.reference (參考文獻) 16. 謝邦昌、鄭宇庭、蘇志雄(2009),「Data Mining概述-以Clementine 12.0為例」,zh_TW
dc.relation.reference (參考文獻) 中華資料採礦協會。zh_TW
dc.relation.reference (參考文獻) 17. 羅浩禎(2009),「應用資料採礦技術建置中小企業傳統產業之信用評等系zh_TW
dc.relation.reference (參考文獻) 統」,國立政治大學統計研究所碩士論文。zh_TW
dc.relation.reference (參考文獻) 英文文獻:zh_TW
dc.relation.reference (參考文獻) 1. Breiman L., J. H. Friedman, R. A. Olshen and C. J. Stone (1984), “Classification and Regression Tree”, Wadsworth, California.zh_TW
dc.relation.reference (參考文獻) 2. Freeman, J. A. and D. M. Skapura (1992), “ Neural Networks Algorithms, Applications, and Programming Techniques”, Addison-Wesley Publishing Company: New York.zh_TW
dc.relation.reference (參考文獻) 3. Loh, W. Y. and Y. S. Shih (1997), “Split selection methods for classification trees”, Statistica Sinica, Vol. 7, 1997, pp.815-840.zh_TW
dc.relation.reference (參考文獻) 4. McClelland, J. L., D. E. Rumelhart and the PDP Research Group (1986), “Parallel Distribution Processing: Explorations in the Microstructure of Cognition ”, Vol. 2, Psychological and Biological Models. Cambridge, MA: MIT Press.zh_TW
dc.relation.reference (參考文獻) 5. Perreault, W. D. and H. C. Barksdale (1980), “A model-free approach for analysis of complex contingency data in survey research”, Journal of Marketing Research, Vol. 17 (November), 503-515.zh_TW
dc.relation.reference (參考文獻) 6. Quinlan, J. R. (1979), “Discovering rules from large collections of examples: a case study”, In Michie, D., editor, Expert Systems in the Microelectronic Age. Edinburgh University Press, Edinburgh Scotland.zh_TW
dc.relation.reference (參考文獻) 7. Whitney, A. (1971), “A direct method of nonparametric measurement selection.IEEE Trans ”, Computer, 20:1100-1103.zh_TW