dc.contributor.advisor | 沈錳坤 | zh_TW |
dc.contributor.advisor | Shan, Man Kwan | en_US |
dc.contributor.author (作者) | 周晏如 | zh_TW |
dc.contributor.author (作者) | Chou, Yen Ju | en_US |
dc.creator (作者) | 周晏如 | zh_TW |
dc.creator (作者) | Chou, Yen Ju | en_US |
dc.date (日期) | 2016 | en_US |
dc.date.accessioned | 2-九月-2016 01:32:30 (UTC+8) | - |
dc.date.available | 2-九月-2016 01:32:30 (UTC+8) | - |
dc.date.issued (上傳時間) | 2-九月-2016 01:32:30 (UTC+8) | - |
dc.identifier (其他 識別碼) | G0101971001 | en_US |
dc.identifier.uri (URI) | http://nccur.lib.nccu.edu.tw/handle/140.119/101251 | - |
dc.description (描述) | 碩士 | zh_TW |
dc.description (描述) | 國立政治大學 | zh_TW |
dc.description (描述) | 資訊科學系碩士在職專班 | zh_TW |
dc.description (描述) | 101971001 | zh_TW |
dc.description.tableofcontents | 第一章 緒論 1 1.1 研究背景與動機 1 1.2 研究內容及方法 2 1.3 論文貢獻 2 1.4 論文架構 3 第二章 相關研究 4 2.1流行音樂歌詞在各時期的特色之相關學術研究 4 2.2流行音樂歌詞押韻相關學術研究 6 2.3修辭學相關學術研究 6 第三章 研究方法 10 3.1 資料來源 10 3.1.1魔鏡歌詞網 (Mojim.com) 10 3.1.2臺北之音HitFM聯播網 (www.hitoradio.com) 11 3.1.3教育部重編國語辭語修訂本 (Dict.revised.moe.edu.tw) 12 3.2 資料前處理 13 3.2.1 發音為非國語的歌詞處理 13 3.2.2 斷詞處理 14 3.2.3 重複歌詞判斷 14 3.3 歌名字數分析 16 3.4 使用語系分析 17 3.5 舊曲新唱分析 17 3.6 詞彙分析 18 3.6.1 詞彙頻率分析 18 3.6.2 詞彙相鄰關係分析 (Word Adjacency) 18 3.7 押韻分析 19 3.7.1 押韻類別定義:一韻到底、換韻、無韻、句首韻 19 3.7.2 利用Non-Trivial Repeating Pattern演算法判斷押韻 21 3.8 修辭分析 23 3.8.1 明喻、類字、疊字、疊句及對偶之定義 23 3.8.2 利用Non-Trivial Repeating Pattern演算法判斷類字、疊字及疊句 27 3.9歌詞風格自動分類 28 第四章 實驗 30 4.1 網站實作 30 4.1.1 架構 30 4.1.2 工具 31 4.1.3 資料庫 31 4.1.4 資料來源與資料的統計分析 33 4.2 詞彙分析結果 33 4.2.1 歷年歌詞之高頻辭 33 4.2.2 1960~ 2015逐年的高頻詞詞彙 38 4.2.3 特別詞彙之頻率分析 41 4.2.4詞彙相鄰關係分析結果 42 4.4 使用語系分析結果 45 4.5 舊曲新唱分析結果 46 4.6 風格分類結果與分析 49 4.7 押韻分析結果 51 4.8 修辭分析結果:明喻、類字、疊字、疊句及對偶 53 4.8.1 明喻 54 4.8.2 類字 55 4.8.3 疊字 56 4.8.4 疊句 57 4.8.5 對偶 58 4.9 作詞者的詞頻與詞彙相鄰分析:方文山、李宗盛、林夕 60 4.9.1 詞頻 60 4.9.2 詞彙相鄰 (Word Adjacency) 67 4.10 年代對使用語系的交叉分析 69 4.11 年代對作詞者作品數量的交叉分析:方文山、李宗盛及林夕 71 4.12 年代對押韻的交叉分析 73 4.13 年代對風格的交叉分析 73 4.14 風格對歌名字數的交叉分析 80 4.15 風格對使用語系的交叉分析 81 4.16 風格對押韻的交叉分析 81 4.17 風格對修辭的交叉分析 83 第五章 結論與未來研究方向 84 5.1 結論 84 5.2 未來研究方向 85 參考文獻 86 | zh_TW |
dc.description.tableofcontents | 華語流行歌詞一直是語言、文學、音樂或是文化研究等相關科系赤手可熱的研究題目,內容包含作詞者、修辭分析、風格、用韻及語言表達等,然由於歌詞數量龐大,難以全部以人工分析。 近年來,資訊科技日新月異不斷地進步,隨著Big Data議題受到注目,Data Mining在近年來相當熱門,然而針對華語流行歌詞的巨量資料探勘與分析研究並不多。因此,本論文研究以程式來自動化分析歌詞的樣式與特性,包括詞彙頻率、詞彙相鄰關係分析、歌名分析、使用語系分析、舊曲新唱、歌詞風格自動分類、用韻及修辭等,而研究資料係透過網路擷取知名網站內容,包含魔鏡歌詞網 (Mojim.com)、臺北之音HitFM聯播網 (www.hitoradio.com) 及教育部重編國語辭典,透過分析規則及以Non-Trivial Repeating Pattern等方法,來完成分析及系統實作。 透過華語流行歌詞的大量分析,探勘及了解各種歌詞的風格與特性,將可了解各種歌詞、作詞者的風格與特色,進而應用在歌詞資料的管理與查詢。 此外,本研究將八萬多首歌詞的各種分析資料設置成網站,提供予學術研究使用,希冀此研究資料能使華語流行歌詞相關研究研究,進行更深入地探討。Chinese popular music lyrics has been a popular topic for researchers who major in languages and literature, music or culture. Related studies include of lyricists, rhetoric methods, styles, rhyme and language expression. However, all these studies were performed by manual analysis. It is difficult to analyze large amount of lyrics manually. With advances in computer technology, big data and data mining techniques have been widely used in different kinds of data. However, to the best of our knowledge, none have been done on pattern mining from big data of lyrics of Chinese popular music. Therefore, the objective of this thesis is to discover patterns from tremendous lyrics data based on data mining techniques. We use data downloaded from www.mojim.com, http://dict.revised.moe.edu.tw/cbdic/ and http://www.hitoradio.com (Hit FM). Data mining methods are employed to find lyrics’ patterns and features, including frequent words, word adjacency, analysis of hit songs` names, lyrics’ language studies, cover song research, automatic style prediction, rhyme and rhetoric patterns. With the analysis of tremendous lyrics and data, the developed approaches of this thesis will be helpful for discovering distinguishing styles of lyrics and lyricists. | - |
dc.format.extent | 9038899 bytes | - |
dc.format.mimetype | application/pdf | - |
dc.source.uri (資料來源) | http://thesis.lib.nccu.edu.tw/record/#G0101971001 | en_US |
dc.subject (關鍵詞) | 巨量資料 | zh_TW |
dc.subject (關鍵詞) | 資料探勘 | zh_TW |
dc.subject (關鍵詞) | 流行音樂 | zh_TW |
dc.subject (關鍵詞) | 重複樣式探勘 | zh_TW |
dc.subject (關鍵詞) | 歌詞 | zh_TW |
dc.subject (關鍵詞) | Big Data | en_US |
dc.subject (關鍵詞) | Data Mining | en_US |
dc.subject (關鍵詞) | Popular Music | en_US |
dc.subject (關鍵詞) | Repeating Pattern Mining | en_US |
dc.subject (關鍵詞) | Lyrics | en_US |
dc.title (題名) | 由華語流行歌詞探勘歌詞的特徵樣式 | zh_TW |
dc.title (題名) | Mining Patterns from Lyrics of Chinese Popular Music | en_US |
dc.type (資料類型) | thesis | en_US |
dc.relation.reference (參考文獻) | [1] Jia-Lien Hsu, Chih-Chin Liu, and Arbee L.P. Chen, Discovering Non-Trivial Repeating Patterns in Music Data, IEEE Transactions on Multimedia, Vol. 3, No. 3, Sep. 2001. [2] Xiao Hu, J. Stephen Downie and Andreas F. Ehmann, Lyric Text Mining in Music Mood Classification, 10th International Society for Music Information Retrieval Conference (ISMIR), Oct. 2009. [3] Beth Logan, Andrew Kositsky, and Pedro Moreno, Semantic Analysis of Song Lyrics, IEEE International Conference on Multimedia and Expo, Vol. 2, June 2004. [4] Rudolf Mayer, Robert Neumayer and Andres Rauber, Rhyme and Style Features for Musical Genre Classification by Song Lyrics, 9th International Conference on Music Information Retrieval (ISMIR), Sep. 2008. [5] Seungwon Oh, Minsoo Hahn and Jinsul Kim, Music Mood Classification Using Intro and Refrain Parts of Lyrics, IEEE International Conference on Information Science and Applications, June 2013. [6] 曾慧佳,從流行歌曲看台灣社會,桂冠圖書公司,2000。 [7] 蔡宗陽,應用修辭學,萬卷樓圖書公司,2001。 [8] 黃麗貞,實用修辭學(增訂版),國家出版社,2004。 [9] 黃慶萱,修辭學(增訂三版),三民書局出版社,2005。 [10] 吳媺婉,台灣國語流行歌曲的修辭藝術(1949-2000),國立臺北教育大學語文教學碩士班論文,2005。 [11] 張雯禎,台灣流行歌詞中的隱喻:以愛情為主題(1990-2008),國立中正大學碩士班論文,2008。 [12] 劉祐銘,臺灣國語流行歌曲歌詞用韻研究(1998~2008),靜宜大學碩士班論文,2009。 [13] 施啟智,華語通俗音樂模組化數位音樂的構成、分析及應用,樹德科技大學碩士班論文,2009。 [14] 朱宜秦,流行音樂中作詞人性別主體性對作品觀點差異之研究,國立臺南藝術大學碩士班論文,2011。 [15] 謝櫻子,方文山華語詞作主題研究,國立新竹教育大學碩士班論文,2010。 [16] 馬占山,臺灣流行歌詞主題類型與語言表達研究(1999~2008)──以「Hit-FM年度百首單曲」為對象,國立臺灣師範大學碩士班論文,2013。 [17] 王奕舜,論敘事型音樂錄影帶和歌詞的改編與互文性-以金曲獎音樂錄影帶獎項為例(2010-2012) ,國立臺灣藝術大學碩士班論文,2013。 [18] 葉佩雯,為你寫一首歌:以資料探勘為基礎的自動作詞系統,國立政治大學資訊科學系大專生專題研究計畫報告,2015。 [19] 魔鏡歌詞網,Retrieved Oct. 1, 2015, from the World Wide Web,https://mojim.com/。 [20] 簡冠庭,HTML5 Word Cloud, Retrieved Jan. 10, 2016, from the World Wide Web,http://timdream.org/wordcloud/。 [21] 中央研究院資訊科學研究所, Retrieved Jan. 10, 2016, from the World Wide Web,http://www.iis.sinica.edu.tw/index_zh.html。 [22] 中文詞知識庫小組,Retrieved Mar. 15, 2016, from the World Wide Web,http://godel.iis.sinica.edu.tw/CKIP/。 [23] 教育部重編辭語修訂本,Retrieved Mar. 1, 2015, from the World Wide Web http://dict.revised.moe.edu.tw/ [24] 九酷音樂,Retrieved Mar. 10, 2016, from the World Wide Web,http://www.9ku.com/zhuanji/taste.htm。 [25]酷我音樂, Retrieved Mar. 10, 2016, from the World Wide Web,http://yinyue.kuwo.cn/yy/category.htm。 [26] 臺北之音HitFM聯播網,Retrieved June. 13, 2016, from the World Wide Web,http://www.hitoradio.com/。 | zh_TW |