學術產出-Theses

Article View/Open

Publication Export

Google ScholarTM

政大圖書館

Citation Infomation

  • No doi shows Citation Infomation
題名 基因晶片資料的三種正規化方法介紹與比較
作者 紀翔譯
貢獻者 薛慧敏
紀翔譯
關鍵詞 正規化
變異數分析模型
MA圖
Loess非線性函數
錯誤發現率
型二錯誤率
日期 2002
上傳時間 2009-09-14
摘要 基因晶片實驗包含了複雜的實驗步驟,在每個步驟都可能因為技術不佳或是人為疏失而產生系統誤差。而「正規化」(Normalization)是一個專業術語,指的就是將系統誤差自資料處理中移除的過程。由於正規化過程在基因晶片的資料處理上佔有非常重要的地位,所以新的正規化方法也不停的被提出。Kerr, Martin, 和Churchill(2000)提出了利用變異數分析模型(ANOVA model)來估計系統誤差的方法;Yang, Dudoit, Luu, and Speed(2001)提出了利用MA圖和Loess非線性函數來消除染劑差異的方法;Kerr, Afshari, Bennett, Bushel, Martinez, Walker, Churchill(2001)提出了結合先前的變異數分析模型和MA圖的新方法;Tsai, Hsueh, Chen(2002)提出了利用Loess非線性函數來估計變異數模型中晶片和基因間的交互作用以及染劑和基因間的交互作用的方法。有鑒於正規化方法眾多,但是每種方法的操作方式和使用上的優、缺點並沒有整合性的介紹和比較,本論文將詳細介紹上述正規化方法,並實際處理TCDD研究實驗的資料。接著利用模擬的資料來計算出三種正規化方法處理前、後的錯誤發現率(False Discovery Rate;FDR)和型二錯誤率(False Negative Rate;FNR)的變化情形,藉此比較三種正規化方法在使用上的優劣。
     
     
     
     
     
     關鍵字:正規化(Normalization),變異數分析模型(ANOVA model),MA圖,Loess非線性函數,錯誤發現率(False Discovery Rate;FDR),型二錯誤率(False Negative Rate;FNR)
參考文獻 1. Benjamini, Y. and Hochberg, Y. (1995) “Controlling the false discovery rate: A practical and powerful approach to multiple testing”. J. R. Statistical Soc. Ser. B-Methodological, 57, 289-300.
2. Kerr, M. K., Martin, M. and Churchill, G. A.(2000)“Analysis of variance for gene expression microarray data”. Journal of Computational Biology, 7, 819-837.
3. Kerr, M. K., Afshari, C. A., Bennett, L., Bushel, P., Martinez, J., Walker, N. J. and Churchill, G. A. (2001) “Statistical Analysis of a Gene Expression Microarray Experiment with Replication”. Statistica Sinica, 12, 203-218.
4. Nadon, R. and Shoemaker, J. (2002) “Statistical issues with microarrays: processing and analysis”. Trends in Genetics, 18, 265-271.
5. Tsai, C., Hsueh, H., Chen, J. J. (2002)“A Generalized Additive Model for Microarray Gene Expression Data Analysis”. Submitted.
6. Yang, Y. H., Dudoit, S., Luu, P. and Speed, T. P. (2001) “Normalization for cDNA microarray data”. In M. L. Bittner, Y. Chen, A. N. Dorsel, and E. R. Dougherty (eds), Microarrays: Optical Technologies and Informatics, Proceedings of SPIE, Vol. 4266, 141-152.
7. Gary Churchill’s Statistical Genetics Group http://www.jax.org/staff/churchill/labsite/index.html
8. 生物晶片資訊站 http://www.biochipmaster.com/
9. 交通大學生物科技諮詢網 http://biotech.life.nctu.edu.tw/index.php
描述 碩士
國立政治大學
統計研究所
90354010
91
資料來源 http://thesis.lib.nccu.edu.tw/record/#G0090354010
資料類型 thesis
dc.contributor.advisor 薛慧敏zh_TW
dc.contributor.author (Authors) 紀翔譯zh_TW
dc.creator (作者) 紀翔譯zh_TW
dc.date (日期) 2002en_US
dc.date.accessioned 2009-09-14-
dc.date.available 2009-09-14-
dc.date.issued (上傳時間) 2009-09-14-
dc.identifier (Other Identifiers) G0090354010en_US
dc.identifier.uri (URI) https://nccur.lib.nccu.edu.tw/handle/140.119/30876-
dc.description (描述) 碩士zh_TW
dc.description (描述) 國立政治大學zh_TW
dc.description (描述) 統計研究所zh_TW
dc.description (描述) 90354010zh_TW
dc.description (描述) 91zh_TW
dc.description.abstract (摘要) 基因晶片實驗包含了複雜的實驗步驟,在每個步驟都可能因為技術不佳或是人為疏失而產生系統誤差。而「正規化」(Normalization)是一個專業術語,指的就是將系統誤差自資料處理中移除的過程。由於正規化過程在基因晶片的資料處理上佔有非常重要的地位,所以新的正規化方法也不停的被提出。Kerr, Martin, 和Churchill(2000)提出了利用變異數分析模型(ANOVA model)來估計系統誤差的方法;Yang, Dudoit, Luu, and Speed(2001)提出了利用MA圖和Loess非線性函數來消除染劑差異的方法;Kerr, Afshari, Bennett, Bushel, Martinez, Walker, Churchill(2001)提出了結合先前的變異數分析模型和MA圖的新方法;Tsai, Hsueh, Chen(2002)提出了利用Loess非線性函數來估計變異數模型中晶片和基因間的交互作用以及染劑和基因間的交互作用的方法。有鑒於正規化方法眾多,但是每種方法的操作方式和使用上的優、缺點並沒有整合性的介紹和比較,本論文將詳細介紹上述正規化方法,並實際處理TCDD研究實驗的資料。接著利用模擬的資料來計算出三種正規化方法處理前、後的錯誤發現率(False Discovery Rate;FDR)和型二錯誤率(False Negative Rate;FNR)的變化情形,藉此比較三種正規化方法在使用上的優劣。
     
     
     
     
     
     關鍵字:正規化(Normalization),變異數分析模型(ANOVA model),MA圖,Loess非線性函數,錯誤發現率(False Discovery Rate;FDR),型二錯誤率(False Negative Rate;FNR)
zh_TW
dc.description.tableofcontents 第一章 緒論 ...............................................1
     第二章 三種正規化方法 ..................................... 5
     2-1 第一種方法:ANOVA .................................. 5
     2-2 MA ................................................. 7
     2-3 第二種方法:MA+ANOVA ............................. 10
     2-4 第三種方法:ANOVA(Loess) ........................ 10
     2-5 三種正規化方法的比較 .............................. 13
     第三章 模擬 .............................................. 15
     3-1 各因子及交互作用的影響的設定 ...................... 18
     3-2 基因的影響間是相關的 .............................. 19
     3-3 AG或DG是G的函數 ................................... 21
     3-4 各主要因子的影響改為隨機產生 ...................... 23
     3-4-1 基因的影響改為隨機產生 ......................... 23
     3-4-2 染劑的影響改為隨機產生 ......................... 26
     3-4-3 晶片的影響改為隨機產生 ......................... 29
     3-5 比較四種基因的生成方式 .......................... 32
     3-5-1 基因的影響皆為0 ................................ 34
     3-5-2 基因的影響為(0.00,0.00,0.02,0.02
     ,....,9.96,9.96,9.98,9.98) .... 36
     3-5-3 基因的影響為(9.98,9.98,9.96,9.96
     ,….,0.02,0.02,0.00,0.00) ................. 38
     3-5-4 基因的影響由N(4.99 , 2.89)隨機產生 …. 40
     第四章 結論 ............................................ 42
     參考文獻 ................................................ 44
     附錄 .................................................... 45
zh_TW
dc.language.iso en_US-
dc.source.uri (資料來源) http://thesis.lib.nccu.edu.tw/record/#G0090354010en_US
dc.subject (關鍵詞) 正規化zh_TW
dc.subject (關鍵詞) 變異數分析模型zh_TW
dc.subject (關鍵詞) MA圖zh_TW
dc.subject (關鍵詞) Loess非線性函數zh_TW
dc.subject (關鍵詞) 錯誤發現率zh_TW
dc.subject (關鍵詞) 型二錯誤率zh_TW
dc.title (題名) 基因晶片資料的三種正規化方法介紹與比較zh_TW
dc.type (資料類型) thesisen
dc.relation.reference (參考文獻) 1. Benjamini, Y. and Hochberg, Y. (1995) “Controlling the false discovery rate: A practical and powerful approach to multiple testing”. J. R. Statistical Soc. Ser. B-Methodological, 57, 289-300.zh_TW
dc.relation.reference (參考文獻) 2. Kerr, M. K., Martin, M. and Churchill, G. A.(2000)“Analysis of variance for gene expression microarray data”. Journal of Computational Biology, 7, 819-837.zh_TW
dc.relation.reference (參考文獻) 3. Kerr, M. K., Afshari, C. A., Bennett, L., Bushel, P., Martinez, J., Walker, N. J. and Churchill, G. A. (2001) “Statistical Analysis of a Gene Expression Microarray Experiment with Replication”. Statistica Sinica, 12, 203-218.zh_TW
dc.relation.reference (參考文獻) 4. Nadon, R. and Shoemaker, J. (2002) “Statistical issues with microarrays: processing and analysis”. Trends in Genetics, 18, 265-271.zh_TW
dc.relation.reference (參考文獻) 5. Tsai, C., Hsueh, H., Chen, J. J. (2002)“A Generalized Additive Model for Microarray Gene Expression Data Analysis”. Submitted.zh_TW
dc.relation.reference (參考文獻) 6. Yang, Y. H., Dudoit, S., Luu, P. and Speed, T. P. (2001) “Normalization for cDNA microarray data”. In M. L. Bittner, Y. Chen, A. N. Dorsel, and E. R. Dougherty (eds), Microarrays: Optical Technologies and Informatics, Proceedings of SPIE, Vol. 4266, 141-152.zh_TW
dc.relation.reference (參考文獻) 7. Gary Churchill’s Statistical Genetics Group http://www.jax.org/staff/churchill/labsite/index.htmlzh_TW
dc.relation.reference (參考文獻) 8. 生物晶片資訊站 http://www.biochipmaster.com/zh_TW
dc.relation.reference (參考文獻) 9. 交通大學生物科技諮詢網 http://biotech.life.nctu.edu.tw/index.phpzh_TW