Publications-Theses

Article View/Open

Publication Export

Google ScholarTM

NCCU Library

Citation Infomation

Related Publications in TAIR

題名 使用貝氏 EMM 分析排序資料
Ranking Data Analysis by Bayesian Extended Mallows Model
作者 陳俊宇
Chen, Jyun-Yu
貢獻者 翁久幸
Weng, Chiu-Hsing
陳俊宇
Chen, Jyun-Yu
關鍵詞 排序聚合
貝氏估計
網路搜尋引擎
Extend Mallows Model
Mallows Model
日期 2024
上傳時間 5-Aug-2024 13:59:40 (UTC+8)
摘要 排序是常見的資料型態,利用排序聚合方法 (rank aggregation) 集結數個排序,以得到一個更可靠的聚合排序更是重要的課題。本論文建立在Li et al. (2020) 所提出的 Extended Mallows Model (EMM),一種用於分析排序資料的機率模型,EMM 在聚合排序的同時還可以衡量不同排序的差異。本文提出貝氏方法估計 EMM 的參數,發現貝氏估計相對於 Expectation Conditional Maximization (ECM) 演算法 (Meng and Rubin, 1993) 所迭代出的最大概似估計對起始值較不敏感,且可以藉由 MCMC 採樣值推論參數的不確定性。我們也嘗試了不同數量的起始值以觀察 ECM 的表現,發現當起始值數量增加,某些參數的最大概似估計的 MSE 會降低,但估計的排序與真實排序的 Kendall’s tau 距離卻略微上升。在實際資料分析的部分,本文比較不同網路搜尋引擎的差異,並聚合不同的 搜尋結果。我們也分析 NBA Team Ranking 資料集 (Deng et al., 2014),並與其他方法做比較。
參考文獻 JC de Borda. M’emoire sur les’ elections au scrutin. Histoire de l’Acad’emie Royale des Sci- ences, 1781. Ke Deng, Simeng Han, Kate J Li, and Jun S Liu. Bayesian aggregation of order-based rank data. Journal of the American Statistical Association, 109(507):1023–1039, 2014. Cynthia Dwork, Ravi Kumar, Moni Naor, and Dandapani Sivakumar. Rank aggregation methods for the web. In Proceedings of the 10th international conference on World Wide Web, pages 613–622, 2001. Bradley Efron. Bootstrap methods: another look at the jackknife. In Breakthroughs in Statistics: Methodology and Distribution, pages 569–593. Springer, 1992. Michael A Fligner and Joseph S Verducci. Distance based ranking models. Journal of the Royal Statistical Society: Series B (Methodological), 48(3):359–369, 1986. Raivo Kolde, Sven Laur, Priit Adler, and Jaak Vilo. Robust rank aggregation for gene list integration and meta-analysis. Bioinformatics, 28(4):573–580, 2012. Han Li, Minxuan Xu, Jun S. Liu, and Xiaodan Fan. ExtMallows: An Extended Mallows Model and Its Hierarchical Version for Ranked Data Aggregation, 2018. URL https://CRAN. R-project.org/package=ExtMallows. R package version 0.1.0. Han Li, Minxuan Xu, Jun S Liu, and Xiaodan Fan. An extended mallows model for ranked data aggregation. Journal of the American Statistical Association, 115(530):730–746, 2020. Colin L Mallows. Non-null ranking models. i. Biometrika, 44(1/2):114–130, 1957. Xiao-Li Meng and Donald B Rubin. Maximum likelihood estimation via the ecm algorithm: A general framework. Biometrika, 80(2):267–278, 1993. Louis L Thurstone. A law of comparative judgment. Psychological Review, 101(2):266, 1994. Wanchuang Zhu. PAMA: Rank Aggregation with Partition Mallows Model, 2021. URL https: //CRAN.R-project.org/package=PAMA. R package version 1.2.0. Wanchuang Zhu, Yingkai Jiang, Jun S Liu, and Ke Deng. Partition–mallows model and its inference for rank aggregation. Journal of the American Statistical Association, 118(541): 343–359, 2023.
描述 碩士
國立政治大學
統計學系
111354016
資料來源 http://thesis.lib.nccu.edu.tw/record/#G0111354016
資料類型 thesis
dc.contributor.advisor 翁久幸zh_TW
dc.contributor.advisor Weng, Chiu-Hsingen_US
dc.contributor.author (Authors) 陳俊宇zh_TW
dc.contributor.author (Authors) Chen, Jyun-Yuen_US
dc.creator (作者) 陳俊宇zh_TW
dc.creator (作者) Chen, Jyun-Yuen_US
dc.date (日期) 2024en_US
dc.date.accessioned 5-Aug-2024 13:59:40 (UTC+8)-
dc.date.available 5-Aug-2024 13:59:40 (UTC+8)-
dc.date.issued (上傳時間) 5-Aug-2024 13:59:40 (UTC+8)-
dc.identifier (Other Identifiers) G0111354016en_US
dc.identifier.uri (URI) https://nccur.lib.nccu.edu.tw/handle/140.119/152777-
dc.description (描述) 碩士zh_TW
dc.description (描述) 國立政治大學zh_TW
dc.description (描述) 統計學系zh_TW
dc.description (描述) 111354016zh_TW
dc.description.abstract (摘要) 排序是常見的資料型態,利用排序聚合方法 (rank aggregation) 集結數個排序,以得到一個更可靠的聚合排序更是重要的課題。本論文建立在Li et al. (2020) 所提出的 Extended Mallows Model (EMM),一種用於分析排序資料的機率模型,EMM 在聚合排序的同時還可以衡量不同排序的差異。本文提出貝氏方法估計 EMM 的參數,發現貝氏估計相對於 Expectation Conditional Maximization (ECM) 演算法 (Meng and Rubin, 1993) 所迭代出的最大概似估計對起始值較不敏感,且可以藉由 MCMC 採樣值推論參數的不確定性。我們也嘗試了不同數量的起始值以觀察 ECM 的表現,發現當起始值數量增加,某些參數的最大概似估計的 MSE 會降低,但估計的排序與真實排序的 Kendall’s tau 距離卻略微上升。在實際資料分析的部分,本文比較不同網路搜尋引擎的差異,並聚合不同的 搜尋結果。我們也分析 NBA Team Ranking 資料集 (Deng et al., 2014),並與其他方法做比較。zh_TW
dc.description.tableofcontents 第一章、緒論 1 第二章、文獻探討回顧 3 第 一 節、最佳化方法 3 第 二 節、加權最佳化方法與交叉熵蒙地卡羅法 4 第 三 節、BARD 模型 5 第 四 節、Mallows 模型 5 第 五 節、Partition-Mallows Model (PAMA) 7 第 六 節、Extended Mallows Model (EMM) 8 第三章、研究方法 10 第 一 節、EMM 的貝式估計方法 10 第 二 節、EMM 的參數檢定方法 13 第四章、模擬實驗 14 第 一 節、實驗 1 設定 14 第 二 節、實驗 1 結果 16 第 三 節、實驗 2 設定 20 第 四 節、實驗 2 結果 21 第五章、實際資料分析 24 第 一 節、網路搜尋引擎比較 24 1 關鍵字:web search engine 24 2 關鍵字: 台灣地震 29 第 二 節、NBA Team Ranking 資料集 34 1 資料集 34 2 分析結果 36 第六章、結論 41 參考文獻 42zh_TW
dc.format.extent 2023031 bytes-
dc.format.mimetype application/pdf-
dc.source.uri (資料來源) http://thesis.lib.nccu.edu.tw/record/#G0111354016en_US
dc.subject (關鍵詞) 排序聚合zh_TW
dc.subject (關鍵詞) 貝氏估計zh_TW
dc.subject (關鍵詞) 網路搜尋引擎zh_TW
dc.subject (關鍵詞) Extend Mallows Modelzh_TW
dc.subject (關鍵詞) Mallows Modelzh_TW
dc.title (題名) 使用貝氏 EMM 分析排序資料zh_TW
dc.title (題名) Ranking Data Analysis by Bayesian Extended Mallows Modelen_US
dc.type (資料類型) thesisen_US
dc.relation.reference (參考文獻) JC de Borda. M’emoire sur les’ elections au scrutin. Histoire de l’Acad’emie Royale des Sci- ences, 1781. Ke Deng, Simeng Han, Kate J Li, and Jun S Liu. Bayesian aggregation of order-based rank data. Journal of the American Statistical Association, 109(507):1023–1039, 2014. Cynthia Dwork, Ravi Kumar, Moni Naor, and Dandapani Sivakumar. Rank aggregation methods for the web. In Proceedings of the 10th international conference on World Wide Web, pages 613–622, 2001. Bradley Efron. Bootstrap methods: another look at the jackknife. In Breakthroughs in Statistics: Methodology and Distribution, pages 569–593. Springer, 1992. Michael A Fligner and Joseph S Verducci. Distance based ranking models. Journal of the Royal Statistical Society: Series B (Methodological), 48(3):359–369, 1986. Raivo Kolde, Sven Laur, Priit Adler, and Jaak Vilo. Robust rank aggregation for gene list integration and meta-analysis. Bioinformatics, 28(4):573–580, 2012. Han Li, Minxuan Xu, Jun S. Liu, and Xiaodan Fan. ExtMallows: An Extended Mallows Model and Its Hierarchical Version for Ranked Data Aggregation, 2018. URL https://CRAN. R-project.org/package=ExtMallows. R package version 0.1.0. Han Li, Minxuan Xu, Jun S Liu, and Xiaodan Fan. An extended mallows model for ranked data aggregation. Journal of the American Statistical Association, 115(530):730–746, 2020. Colin L Mallows. Non-null ranking models. i. Biometrika, 44(1/2):114–130, 1957. Xiao-Li Meng and Donald B Rubin. Maximum likelihood estimation via the ecm algorithm: A general framework. Biometrika, 80(2):267–278, 1993. Louis L Thurstone. A law of comparative judgment. Psychological Review, 101(2):266, 1994. Wanchuang Zhu. PAMA: Rank Aggregation with Partition Mallows Model, 2021. URL https: //CRAN.R-project.org/package=PAMA. R package version 1.2.0. Wanchuang Zhu, Yingkai Jiang, Jun S Liu, and Ke Deng. Partition–mallows model and its inference for rank aggregation. Journal of the American Statistical Association, 118(541): 343–359, 2023.zh_TW