dc.contributor | 國立政治大學統計學系 | en_US |
dc.contributor | 行政院國家科學委員會 | en_US |
dc.creator (作者) | 薛慧敏 | zh_TW |
dc.date (日期) | 2007 | en_US |
dc.date.accessioned | 30-Aug-2012 09:58:58 (UTC+8) | - |
dc.date.available | 30-Aug-2012 09:58:58 (UTC+8) | - |
dc.date.issued (上傳時間) | 30-Aug-2012 09:58:58 (UTC+8) | - |
dc.identifier.uri (URI) | http://nccur.lib.nccu.edu.tw/handle/140.119/53389 | - |
dc.description.abstract (摘要) | 96學年度 檢定線性判別分析中單一變數的顯著性 在二元分類上,AUC(接受者操作特徵函數線下面積)常用來評估分類準則的判別力。當資料中包含大量變數時,如基因表現陣列資料或蛋白質譜資料,則變數選取為必要且重要的工作。此時,我們假設資料中有兩個變數,並且考慮線性判別函數。在常態假設下,經過推導得知,加入第二個變數所增進的AUC增加量將與兩個變數的有效作用量(effective size)的比值以及變數間的相關係數有密切關係。本年度的研究將針對此加入變數的增益效果的顯著性,提出相關統計檢定方法。第一個方法為在常態分配假設下的參數(parametric)檢定方法,第二個方法則依據AUC的無母數估計量以及以重抽樣(resampling)方法來決定對應的臨界值。我們將運用電腦模擬來研究此些方法的檢定力。 未來期望將這些檢定方法運用在有多個變數的資料上,以進行變數選取工作。 97學年度 線性判別分析的特徵選取:在基因體資料上的運用 在基因體實驗中,如基因表現陣列資料或蛋白質譜資料,我們可以同時獲得大量的特徵變數的觀測值。從資料中偵測出有顯著差異表現量的特徵,與由此進一步發展分類準則為實驗的倆個主要的目的。本年度計畫將以AUC(接受者操作特徵函數線下面積)為準則,發展一個特徵選取策略。利用前年度研究計劃發展的檢定方法,我們將依序檢定經過排序的特徵,並且選取可顯著增加AUC的特徵於後續的分類準則中。此策略將被運用在一組實際的蛋白質質譜儀資料上,我們將透過這組實際資料來比較不同的特徵選取方法的表現。 | en_US |
dc.language.iso | en_US | - |
dc.relation (關聯) | 基礎研究 | en_US |
dc.relation (關聯) | 學術補助 | en_US |
dc.relation (關聯) | 研究期間:9608~ 9707 | en_US |
dc.relation (關聯) | 研究經費:678仟元 | en_US |
dc.subject (關鍵詞) | 數學;Joint confidence region; Optimal sample fraction of case to control; Retrospective logistic regression model; Sample size determination;Two-stage sequential procedure | en_US |
dc.title (題名) | 基因體資料中的特徵選取(I) | zh_TW |
dc.title.alternative (其他題名) | A Statistical Procedure of Feature Selection in a Genomic Study | en_US |
dc.type (資料類型) | report | en |