Publications-Theses
Article View/Open
Publication Export
-
Google ScholarTM
NCCU Library
Citation Infomation
Related Publications in TAIR
題名 使用貝氏 EMM 分析排序資料
Ranking Data Analysis by Bayesian Extended Mallows Model作者 陳俊宇
Chen, Jyun-Yu貢獻者 翁久幸
Weng, Chiu-Hsing
陳俊宇
Chen, Jyun-Yu關鍵詞 排序聚合
貝氏估計
網路搜尋引擎
Extend Mallows Model
Mallows Model日期 2024 上傳時間 5-Aug-2024 13:59:40 (UTC+8) 摘要 排序是常見的資料型態,利用排序聚合方法 (rank aggregation) 集結數個排序,以得到一個更可靠的聚合排序更是重要的課題。本論文建立在Li et al. (2020) 所提出的 Extended Mallows Model (EMM),一種用於分析排序資料的機率模型,EMM 在聚合排序的同時還可以衡量不同排序的差異。本文提出貝氏方法估計 EMM 的參數,發現貝氏估計相對於 Expectation Conditional Maximization (ECM) 演算法 (Meng and Rubin, 1993) 所迭代出的最大概似估計對起始值較不敏感,且可以藉由 MCMC 採樣值推論參數的不確定性。我們也嘗試了不同數量的起始值以觀察 ECM 的表現,發現當起始值數量增加,某些參數的最大概似估計的 MSE 會降低,但估計的排序與真實排序的 Kendall’s tau 距離卻略微上升。在實際資料分析的部分,本文比較不同網路搜尋引擎的差異,並聚合不同的 搜尋結果。我們也分析 NBA Team Ranking 資料集 (Deng et al., 2014),並與其他方法做比較。 參考文獻 JC de Borda. M’emoire sur les’ elections au scrutin. Histoire de l’Acad’emie Royale des Sci- ences, 1781. Ke Deng, Simeng Han, Kate J Li, and Jun S Liu. Bayesian aggregation of order-based rank data. Journal of the American Statistical Association, 109(507):1023–1039, 2014. Cynthia Dwork, Ravi Kumar, Moni Naor, and Dandapani Sivakumar. Rank aggregation methods for the web. In Proceedings of the 10th international conference on World Wide Web, pages 613–622, 2001. Bradley Efron. Bootstrap methods: another look at the jackknife. In Breakthroughs in Statistics: Methodology and Distribution, pages 569–593. Springer, 1992. Michael A Fligner and Joseph S Verducci. Distance based ranking models. Journal of the Royal Statistical Society: Series B (Methodological), 48(3):359–369, 1986. Raivo Kolde, Sven Laur, Priit Adler, and Jaak Vilo. Robust rank aggregation for gene list integration and meta-analysis. Bioinformatics, 28(4):573–580, 2012. Han Li, Minxuan Xu, Jun S. Liu, and Xiaodan Fan. ExtMallows: An Extended Mallows Model and Its Hierarchical Version for Ranked Data Aggregation, 2018. URL https://CRAN. R-project.org/package=ExtMallows. R package version 0.1.0. Han Li, Minxuan Xu, Jun S Liu, and Xiaodan Fan. An extended mallows model for ranked data aggregation. Journal of the American Statistical Association, 115(530):730–746, 2020. Colin L Mallows. Non-null ranking models. i. Biometrika, 44(1/2):114–130, 1957. Xiao-Li Meng and Donald B Rubin. Maximum likelihood estimation via the ecm algorithm: A general framework. Biometrika, 80(2):267–278, 1993. Louis L Thurstone. A law of comparative judgment. Psychological Review, 101(2):266, 1994. Wanchuang Zhu. PAMA: Rank Aggregation with Partition Mallows Model, 2021. URL https: //CRAN.R-project.org/package=PAMA. R package version 1.2.0. Wanchuang Zhu, Yingkai Jiang, Jun S Liu, and Ke Deng. Partition–mallows model and its inference for rank aggregation. Journal of the American Statistical Association, 118(541): 343–359, 2023. 描述 碩士
國立政治大學
統計學系
111354016資料來源 http://thesis.lib.nccu.edu.tw/record/#G0111354016 資料類型 thesis dc.contributor.advisor 翁久幸 zh_TW dc.contributor.advisor Weng, Chiu-Hsing en_US dc.contributor.author (Authors) 陳俊宇 zh_TW dc.contributor.author (Authors) Chen, Jyun-Yu en_US dc.creator (作者) 陳俊宇 zh_TW dc.creator (作者) Chen, Jyun-Yu en_US dc.date (日期) 2024 en_US dc.date.accessioned 5-Aug-2024 13:59:40 (UTC+8) - dc.date.available 5-Aug-2024 13:59:40 (UTC+8) - dc.date.issued (上傳時間) 5-Aug-2024 13:59:40 (UTC+8) - dc.identifier (Other Identifiers) G0111354016 en_US dc.identifier.uri (URI) https://nccur.lib.nccu.edu.tw/handle/140.119/152777 - dc.description (描述) 碩士 zh_TW dc.description (描述) 國立政治大學 zh_TW dc.description (描述) 統計學系 zh_TW dc.description (描述) 111354016 zh_TW dc.description.abstract (摘要) 排序是常見的資料型態,利用排序聚合方法 (rank aggregation) 集結數個排序,以得到一個更可靠的聚合排序更是重要的課題。本論文建立在Li et al. (2020) 所提出的 Extended Mallows Model (EMM),一種用於分析排序資料的機率模型,EMM 在聚合排序的同時還可以衡量不同排序的差異。本文提出貝氏方法估計 EMM 的參數,發現貝氏估計相對於 Expectation Conditional Maximization (ECM) 演算法 (Meng and Rubin, 1993) 所迭代出的最大概似估計對起始值較不敏感,且可以藉由 MCMC 採樣值推論參數的不確定性。我們也嘗試了不同數量的起始值以觀察 ECM 的表現,發現當起始值數量增加,某些參數的最大概似估計的 MSE 會降低,但估計的排序與真實排序的 Kendall’s tau 距離卻略微上升。在實際資料分析的部分,本文比較不同網路搜尋引擎的差異,並聚合不同的 搜尋結果。我們也分析 NBA Team Ranking 資料集 (Deng et al., 2014),並與其他方法做比較。 zh_TW dc.description.tableofcontents 第一章、緒論 1 第二章、文獻探討回顧 3 第 一 節、最佳化方法 3 第 二 節、加權最佳化方法與交叉熵蒙地卡羅法 4 第 三 節、BARD 模型 5 第 四 節、Mallows 模型 5 第 五 節、Partition-Mallows Model (PAMA) 7 第 六 節、Extended Mallows Model (EMM) 8 第三章、研究方法 10 第 一 節、EMM 的貝式估計方法 10 第 二 節、EMM 的參數檢定方法 13 第四章、模擬實驗 14 第 一 節、實驗 1 設定 14 第 二 節、實驗 1 結果 16 第 三 節、實驗 2 設定 20 第 四 節、實驗 2 結果 21 第五章、實際資料分析 24 第 一 節、網路搜尋引擎比較 24 1 關鍵字:web search engine 24 2 關鍵字: 台灣地震 29 第 二 節、NBA Team Ranking 資料集 34 1 資料集 34 2 分析結果 36 第六章、結論 41 參考文獻 42 zh_TW dc.format.extent 2023031 bytes - dc.format.mimetype application/pdf - dc.source.uri (資料來源) http://thesis.lib.nccu.edu.tw/record/#G0111354016 en_US dc.subject (關鍵詞) 排序聚合 zh_TW dc.subject (關鍵詞) 貝氏估計 zh_TW dc.subject (關鍵詞) 網路搜尋引擎 zh_TW dc.subject (關鍵詞) Extend Mallows Model zh_TW dc.subject (關鍵詞) Mallows Model zh_TW dc.title (題名) 使用貝氏 EMM 分析排序資料 zh_TW dc.title (題名) Ranking Data Analysis by Bayesian Extended Mallows Model en_US dc.type (資料類型) thesis en_US dc.relation.reference (參考文獻) JC de Borda. M’emoire sur les’ elections au scrutin. Histoire de l’Acad’emie Royale des Sci- ences, 1781. Ke Deng, Simeng Han, Kate J Li, and Jun S Liu. Bayesian aggregation of order-based rank data. Journal of the American Statistical Association, 109(507):1023–1039, 2014. Cynthia Dwork, Ravi Kumar, Moni Naor, and Dandapani Sivakumar. Rank aggregation methods for the web. In Proceedings of the 10th international conference on World Wide Web, pages 613–622, 2001. Bradley Efron. Bootstrap methods: another look at the jackknife. In Breakthroughs in Statistics: Methodology and Distribution, pages 569–593. Springer, 1992. Michael A Fligner and Joseph S Verducci. Distance based ranking models. Journal of the Royal Statistical Society: Series B (Methodological), 48(3):359–369, 1986. Raivo Kolde, Sven Laur, Priit Adler, and Jaak Vilo. Robust rank aggregation for gene list integration and meta-analysis. Bioinformatics, 28(4):573–580, 2012. Han Li, Minxuan Xu, Jun S. Liu, and Xiaodan Fan. ExtMallows: An Extended Mallows Model and Its Hierarchical Version for Ranked Data Aggregation, 2018. URL https://CRAN. R-project.org/package=ExtMallows. R package version 0.1.0. Han Li, Minxuan Xu, Jun S Liu, and Xiaodan Fan. An extended mallows model for ranked data aggregation. Journal of the American Statistical Association, 115(530):730–746, 2020. Colin L Mallows. Non-null ranking models. i. Biometrika, 44(1/2):114–130, 1957. Xiao-Li Meng and Donald B Rubin. Maximum likelihood estimation via the ecm algorithm: A general framework. Biometrika, 80(2):267–278, 1993. Louis L Thurstone. A law of comparative judgment. Psychological Review, 101(2):266, 1994. Wanchuang Zhu. PAMA: Rank Aggregation with Partition Mallows Model, 2021. URL https: //CRAN.R-project.org/package=PAMA. R package version 1.2.0. Wanchuang Zhu, Yingkai Jiang, Jun S Liu, and Ke Deng. Partition–mallows model and its inference for rank aggregation. Journal of the American Statistical Association, 118(541): 343–359, 2023. zh_TW