學術產出-學位論文

文章檢視/開啟

書目匯出

Google ScholarTM

政大圖書館

引文資訊

TAIR相關學術產出

題名 具有額外或不足變異的群集類別資料之研究
A Study of Modelling Categorical Data with Overdispersion or Underdispersion
作者 蘇聖珠
Su, Sheng-Chu
貢獻者 陳麗霞
蘇聖珠
Su, Sheng-Chu
關鍵詞 群集類別資料
群內相關性
額外變異
不足變異
Dirichlet-Multinomial模式
最大概似估計式
廣義最小平方估計式
categorical data
intra-cluster correlation
overdispersion
underdispersion
Dirichlet-Multinomial model
maximum-likelihood estimation
generalized least squares estimation
日期 2000
上傳時間 14-四月-2016 13:57:32 (UTC+8)
摘要 進行調查時,最後的抽樣單位常是從不同的群集取得的,而同一群集內的樣本對象,因背景類似而對於某些問題常會傾向相同或類似的反應,研究者若忽略這種群內相關性,仍以獨立性樣本進行分析時,因其共變異數矩陣通常會與多項模式的共變異數矩陣相差懸殊,而造成所謂的額外變異或不足變異的現象。本文在不同的情況下,提出了Dirichlet-Multinomial模式(簡稱DM模式)、擴展的DM模式、以及兩種平均數-共變異數矩陣模式,以適當的彙整所有的群集資料。並討論DM與EDM模式中相關之參數及格機率之最大概似估計法,且分別對此兩種平均數-共變異數矩陣模式,提出求導廣義最小平方估計的程序。此外,也針對幾種特殊的二維表及三維表結構,探討對應的參數及格機率之估計方法。並提出計算簡易的Score統計檢定量以判斷群內相關(intra-cluster correlation)之存在性,及判斷資料集具有額外或不足變異,而對於不同母體的群內相關同質性檢定亦提出討論。
This paper presents a modelling method of analyzing categorical data with overdispersion or underdispersion. In many studies, data are collected from differ clusters, and members within the same cluster behave similary. Thus, the responses of members within the same cluster are not independent and the multinomial distribution is not the correct distribution for the observed counts. Therefore, the covariance matrix of the sample proportion vector tends to be much different from that of the multinomial model. We discuss four different models to fit counts data with overdispersion or underdispersion feature, witch include Dirichlet-Multinomial model (DM model), extended DM model (EDM model), and two mean-covariance models. Method of maximum-likelihood estimation is discussed for DM and EDM models. Procedures to derive generalized least squares estimates are proposed for the two mean-covariance models respectively. As to the cell probabilities, we also discuss how to estimate them under several special structures of two-way and three-way tables. More easily evaluated Score test statistics are derived for the DM and EDM models to test the existence of the intra-cluster correlation. And the test of homogeneity of intra-cluster correlation among several populations is also derived.
描述 博士
國立政治大學
統計學系
資料來源 http://thesis.lib.nccu.edu.tw/record/#A2002000642
資料類型 thesis
dc.contributor.advisor 陳麗霞zh_TW
dc.contributor.author (作者) 蘇聖珠zh_TW
dc.contributor.author (作者) Su, Sheng-Chuen_US
dc.creator (作者) 蘇聖珠zh_TW
dc.creator (作者) Su, Sheng-Chuen_US
dc.date (日期) 2000en_US
dc.date.accessioned 14-四月-2016 13:57:32 (UTC+8)-
dc.date.available 14-四月-2016 13:57:32 (UTC+8)-
dc.date.issued (上傳時間) 14-四月-2016 13:57:32 (UTC+8)-
dc.identifier (其他 識別碼) A2002000642en_US
dc.identifier.uri (URI) http://nccur.lib.nccu.edu.tw/handle/140.119/84410-
dc.description (描述) 博士zh_TW
dc.description (描述) 國立政治大學zh_TW
dc.description (描述) 統計學系zh_TW
dc.description.abstract (摘要) 進行調查時,最後的抽樣單位常是從不同的群集取得的,而同一群集內的樣本對象,因背景類似而對於某些問題常會傾向相同或類似的反應,研究者若忽略這種群內相關性,仍以獨立性樣本進行分析時,因其共變異數矩陣通常會與多項模式的共變異數矩陣相差懸殊,而造成所謂的額外變異或不足變異的現象。本文在不同的情況下,提出了Dirichlet-Multinomial模式(簡稱DM模式)、擴展的DM模式、以及兩種平均數-共變異數矩陣模式,以適當的彙整所有的群集資料。並討論DM與EDM模式中相關之參數及格機率之最大概似估計法,且分別對此兩種平均數-共變異數矩陣模式,提出求導廣義最小平方估計的程序。此外,也針對幾種特殊的二維表及三維表結構,探討對應的參數及格機率之估計方法。並提出計算簡易的Score統計檢定量以判斷群內相關(intra-cluster correlation)之存在性,及判斷資料集具有額外或不足變異,而對於不同母體的群內相關同質性檢定亦提出討論。zh_TW
dc.description.abstract (摘要) This paper presents a modelling method of analyzing categorical data with overdispersion or underdispersion. In many studies, data are collected from differ clusters, and members within the same cluster behave similary. Thus, the responses of members within the same cluster are not independent and the multinomial distribution is not the correct distribution for the observed counts. Therefore, the covariance matrix of the sample proportion vector tends to be much different from that of the multinomial model. We discuss four different models to fit counts data with overdispersion or underdispersion feature, witch include Dirichlet-Multinomial model (DM model), extended DM model (EDM model), and two mean-covariance models. Method of maximum-likelihood estimation is discussed for DM and EDM models. Procedures to derive generalized least squares estimates are proposed for the two mean-covariance models respectively. As to the cell probabilities, we also discuss how to estimate them under several special structures of two-way and three-way tables. More easily evaluated Score test statistics are derived for the DM and EDM models to test the existence of the intra-cluster correlation. And the test of homogeneity of intra-cluster correlation among several populations is also derived.en_US
dc.description.tableofcontents 封面頁
證明書
致謝詞
論文摘要
目錄
第一章 緒論
1.1 研究動機與目的
1.2 文獻回顧
1.3 研究方法
1.4 章節架構
第二章 群集類別資料集與DM及EDM模式
2.1 群集類別資料集與DM分配
2.2 多個母體的DM模式架構
2.3 擴展的DM模式
第三章 群內相關係數之檢定
3.1 群內相關存在性之檢定
3.1.1 單一母體的群內相關存在性之檢定
3.1.2 多個母體的群內相關存在性之檢定
3.2 額外或不足變異之檢定
3.3 群內相關係數之同質性檢定
3.4 實例
第四章 DM及EDM模式下類別機率的估計
4.1 類別機率的最大概似估計式
4.1.1 當群內相關係數為已知時
4.1.2 當群內相關係數為未知時
4.2 特殊型態的列聯表格機率之估計
4.2.1 二維列聯表
4.2.1.1 獨立性結構
4.2.1.2 對稱性結構
4.2.2 三維列聯表
4.2.2.1 相互獨立性結構
4.2.2.2 聯合獨立性結構
4.2.2.3 條件獨立性結構
4.2.2.4 無三階交互作用
4.2.2.5 對稱性結構
4.3 數值分析法
4.4 實例
第五章 額外變異模式下類別機率的估計
5.1 額外變異模式
5.1.1 EW及EMK模式
5.1.2 EW及EMK模式的差異
5.2 EW模式之參數估計
5.2.1 類別機率的估計
5.2.2 變異因子的估計
5.2.3 參數之近似分配及模式之適合度檢定
5.3 EMK模式之參數估計
5.4 特殊型態的列聯表格機率之估計
5.4.1 二維列聯表
5.4.1.1 獨立性結構
5.4.1.2 對稱性結構
5.4.2 三維列聯表
5.4.2.1 相互獨立性結構
5.4.2.2 聯合獨立性結構
5.4.2.3 條件獨立性結構
5.4.2.4 無三階交互作用
5.4.2.5 對稱性結構
5.5 實例
第六章 模擬研究
6.1 利用DM分配產生群集類別資料集
6.2 樣本大小配置對同質性檢定的影響
6.2.1 參數的範圍設定
6.2.2 模擬結果
6.3 模擬比較最大概似估計值與動差估計值
第七章 結論
附錄
附錄一 最大概似法之訊息矩陣
附錄二 求解最陡上升法程式之MATLAB程式
附錄三 模擬群集類別資料之程式
附錄四 卡方同質性檢定下,群集數與群內樣本數的配置模擬
附錄五 最大概似估計值與動差估計值之比較模擬
參考文獻
zh_TW
dc.source.uri (資料來源) http://thesis.lib.nccu.edu.tw/record/#A2002000642en_US
dc.subject (關鍵詞) 群集類別資料zh_TW
dc.subject (關鍵詞) 群內相關性zh_TW
dc.subject (關鍵詞) 額外變異zh_TW
dc.subject (關鍵詞) 不足變異zh_TW
dc.subject (關鍵詞) Dirichlet-Multinomial模式zh_TW
dc.subject (關鍵詞) 最大概似估計式zh_TW
dc.subject (關鍵詞) 廣義最小平方估計式zh_TW
dc.subject (關鍵詞) categorical dataen_US
dc.subject (關鍵詞) intra-cluster correlationen_US
dc.subject (關鍵詞) overdispersionen_US
dc.subject (關鍵詞) underdispersionen_US
dc.subject (關鍵詞) Dirichlet-Multinomial modelen_US
dc.subject (關鍵詞) maximum-likelihood estimationen_US
dc.subject (關鍵詞) generalized least squares estimationen_US
dc.title (題名) 具有額外或不足變異的群集類別資料之研究zh_TW
dc.title (題名) A Study of Modelling Categorical Data with Overdispersion or Underdispersionen_US
dc.type (資料類型) thesisen_US