Please use this identifier to cite or link to this item: https://ah.nccu.edu.tw/handle/140.119/56934


Title: 基於MPEG-7技術與使用群眾註記方法建置個人圖像檢索資料庫
Building Personal Image Retrieval Database with a MPEG-7 Based Crowdsourcing Annotation Methodology
Authors: 鄭博育
Cheng, Po Yu
Contributors: 郭正佩
陳聖智

Kuo, Pei Jeng
Chen, Sheng Chih

鄭博育
Cheng, Po Yu
Keywords: 社會化標籤
圖像檢索
MPEG-7
群體外包
情境感知
Social Tagging
Image Retrieval
MPEG-7
Crowdsourcing
Context-Awareness
Date: 2012
Issue Date: 2013-02-04 09:44:28 (UTC+8)
Abstract: 隨著個人數位影音紀錄裝置的日益普及,每個人所拍攝的照片與影片都是逐年快速地增加。然而在存放照片與影音檔案的經驗裡,當檔案的數量越來越多的時候,檔案管理以及如何快速地找出自己想要的照片便成了一大難題。除此之外,存放照片檔案的硬碟空間遭受自然災害與人為因素所造成的毀損,則是導致檔案遺失的情形發生。

圖像可以藉由註記標籤的方式加以檢索,而照片也能夠上傳到網路相簿加以分享與儲放,然而目前許多的網路個人相簿系統發現有以下幾項缺點:(1)情境感知(Context-Awareness)標籤不足,(2)缺少群眾註記標籤功能,(3)無法搜尋相簿裡的相片。於是本研究提出以MPEG-7為基礎的架構,擴增其XML文字標籤的方法加以描述每張照片的資訊,提供更豐富的標籤資訊以便於相片檢索的方法。

本研究的圖像資料庫檔案以智慧型手機做為主要的獲取來源,藉由智慧型手機的感知器(Sensor)提供自動註記標籤、協助註記標籤以及自行輸入內容的標籤。此外,系統也藉由Facebook社群平台,達到群眾註記標籤的功能。於是透過圖像註記標籤的方式,達到圖像檢索的目的。
With the growing popularity of personal digital photography and video recording devices, the number of photographs and videos each person takes increases tremendously every year. However, storing such large quantity of digital files can cause major problems in archive management and retrieval. The occurrences of natural disasters and man-made accidents also contribute to the increasing trend of archive loss in data and photograph storage devices.

Although images uploaded on web albums for storing and sharing can be retrieved using annotation tags, many network personal albums systems were found to have the following disadvantages: (1) lack of context-awareness tags; (2) lack of crowd-annotate tags functions, and (3) lack of annotated tags-search functions. Thus, this paper proposes a search architecture based on MPEG-7 and an expanded XML schema of the MPEG-7 architecture to describe photographic information and to provide richer information annotations for photograph retrieval.

This study uses images files obtained from smart phones to examine image retrieval through image-annotated tags. Four forms of annotation tags were examined: automatic annotations, semi-automatic annotations and user-generated annotations by smart phone sensors, as well as crowd-generated annotations on Facebook.com.
Reference: 一、 中文部份:
安守中(2005)。GPS定位原理及應用。台北:全華圖書。
吳啟明(2006)。設計專利資訊圖像檢索與呈現平台之設計與評估-以滑鼠新式樣專利為例。國立雲林科技大學工業設計所碩士論文。
李世忠(1993),使用者介面的探討,視聽教育雙月刊,第35卷,第1期,頁49-57。
李茂興、陳夢怡(譯)(2000)。心理學 : 適應環境的心靈(原作者:James S. Nairne)。臺北市 : 弘智文化。
李菁蓉、魏丕信、施郁芬、邱昭彰(1998)。人機介面設計。台北縣蘆洲市:國立空中大學。
李嘉紘、蘇裕盛、許家富、田政鉉(2008)。以影像特徵為基礎之互動式貝殼檢索系統。第七屆離島資訊技術與應用研討會論文集,頁 209-217。
拓墣產業研究所(2012)。數位相機產業創新趨勢與發展剖析。台北市:拓墣科技。
林淑芳、林麗娟(1995)。使用者介面-電腦輔助學習之認知要徑。視聽教育雙月刊,第37卷,第3期,頁18-27。
施政瑋(2007)。設計資料庫系統與CBIR於圖像搜尋及管理之整合應用。國立雲林科技大學設計運算研究所碩士論文。
張宇翔(2001)。MPEG-7在數位博物館物種影像查詢之應用。國立暨南國際大學資訊工程學系碩士論文。
張瑋鈴(2011)。影像內容檢索中以社群網絡演算法為基礎之多張影像搜尋。國立政治大學資訊科學系碩士論文。
黃子癸(2001)。以MPEG-7為基礎之蝴蝶影像形狀檢索。國立臺灣大學資訊工程學研究所碩士論文。
黃文彥(2008)。運用群眾外包模式的Web2.0 網站如何跨越鴻溝。國立政治大學科技管理研究所碩士論文。
廖國堯(2009)。支援Web 2.0環境下的影音檢索:以社會性標籤為基礎的擴充搜尋方法。國立嘉義大學資訊管理所碩士論文。
蓋索林(2011)。Google!Android 3手機應用程式設計入門(第四版)。台北:松崗。
藍永孝(2004)。建置語意式索引於圖像檢索系統。淡江大學資訊工程學系碩士論文。
羅耀宗(譯)(2011)。玩家外包:社群改變遊戲規則(原作者:J. Howe)。臺北市:天下文化。(原著出版年:2009)

二、 英文部份:
Bell, G., & Gemmell, J. (2010). Total Recall: How the E-Memory Revolution Will Change Everything. New York, NY: DUTTON.
Byrne, D., Lavelle, B., Doherty, A. R., Jones, G., & Smeaton, A. F. (2007). Using Bluetooth and GPS Metadata to Measure Event Similarity in SenseCam Images. Accepted for presentation at IMAI'07 - 5th International Conference on Intelligent Multimedia and Ambient Intelligence. Salt Lake City, Utah.
Ekman, P. (1992). Are there basic emotions? Psychological Review, 99, 350-353.
Ekman, P. (1994). Strong evidence for universals in facial expressions: A reply to Russell's mistaken critique. Psychological Bulletin, 115, 268-287.
Ekman, P., & Friesen, W. V. (1986). A new pan-cultural facial expression of emotion. Motivation and Emotion, 10,159-168.
Gemmell, J., Bell, G., Lueder, R., Drucker, S., & Wong, C. (2002). MyLifeBits: Fulfilling the Memex Vision. In Proc. of the tenth ACM international conference on Multimedia, 235-238.
Gupta, A. (1995). Visual information retrieval: A Virage perspective. Tech. Rep. TR95-01, Virage, Inc. , San Mateo, CA.
Hamm, J., Stone, B., Belkin, M., & Dennis, S. (2012). Automatic Annotation of Daily Activity from Smartphone-based Multisensory Streams. In Proc. of Fourth International Conference on Mobile Computing, Applications and Services (MOBICASE).
Howe, J. (2006, June). The Rise of Crowdsourcing. Wired Magazine, 14(06). Retrieved from http://www.wired.com/wired/archive/14.06/crowds.html
Kolbitsch, J., & Maurer, H. (2006). The growing Importance of E-Communities on The Web. Business Information Processing, 1, 19-37.
Kuo, P. J., Aoki, T., & Yasuda, H. (2004). Building Personal Digital Photograph Libraries: An Approach with Ontology-Based MPEG-7 Dozen Dimensional Digital Content Architecture. In Proc. of IEEE Computer Graphics International 2004 (CGI 2004), 482-489.
Kuo, P. J., Aoki, T., & Yasuda, H. (2004). MPEG-7 Based Dozen Dimensional Digital Content Architecture for Semantic Image Retrieval Services. In Proc. of e-Technology, e-Commerce and e-Service (EEE 2004), 517-524.
Kuo, P. J., Aoki, T., & Yasuda, H. (2005). Continuous Archiving of Personal Digital Photograph Collections with a MPEG-7 Based Dozen Dimensional Digital Content Architecture. In Proc. of Archiving 2005, 188-192.
Manjunath, B. S., Salembier, P., & T. Sikora (2002). Introduction to MPEG-7 : multimedia content description interface. Chichester, England : Wiley.
Marlow, C., Naaman, M., Boyd, D., & Davis, M. (2006). HT06, Tagging paper, taxonomy, Flickr, academic article, to read. In Proc. of the seventeenth conference on Hypertext and hypermedia, 31-40.
MediaLab, S. (2003). MPEG-7 White Paper, Sonera Medialab, In Proc. of Advances in Multimedia Information Processing-PCM 2004, 298-305.
Nack, F. (1999). Everything you wanted to know about MPEG-7: Part 1, Journal of MultiMedia, IEEE, 6, 65-77.
Nack, F. (1999). Everything you wanted to know about MPEG-7: Part 2, Journal of MultiMedia, IEEE, 6, 64-73.
Niblack, W., Barber, R., Equitz, W., Flickner, M., Glasman, E. H., Petkovic, D.,…Taubin, G. (1993). The QBIC Project: Querying Images by Content using Color, Texture, and Shape. In Proc. of Storage and Retrieval for Image and Video Databases, 173-187.
Nov, O., & Chen, Y., (2010,July). Why Do People Tag? Motivations for Photo Tagging. Communications of the ACM, 53, 128-131.
Smith, J. R., & Chang, S. F. (1996). Visualseek: A Fully Automated Content-Based Image Query System. In Proc. of the ACM International Multimedia Conference, 87-98.
Stvilia, B., & Jörgensen, C. (2009). User-generated collection-level Metadata in an online photo-sharing system. Journal of Library & Information Science Research, 31, 54-65.

三、 網頁資料部份:
comScore(2008, January 17). Google Sites’ Share of Online Video Market Expands to 31 Percent in November 2007, According to comScore Video Metrix. Retrieved from http://www.comscore.com/press/release.asp?press=2002
DIGITIMES(2010年11月23日)。2011年全球DSC產業展望:擴大釋單台廠邁向全球出貨量45%。取自:http://www.digitimes.com.tw/tw/rpt/rpt_show.asp?cnlid=3&pro=&proname=&cat=PCE&v=20101123-571&n=1
Eric S. Raymond(2007, May). The Cathedral and the Bazaar. Retrieval from http://www.catb.org/~esr/writings/cathedral-bazaar/cathedral-bazaar/ar01s04.html
EXIF官方網站(無日期)。EXIF.org。取自:http://www.exif.org/
Jonathan Good(2011, September 15). How many photos have ever been taken? Retrieval from http://blog.1000memories.com/94-number-of-photos-ever-taken-digital-and-analog-in-shoebox
Rick Armbrust(2012, July). Capturing Growth: Photo Apps and Open Graph. Retrieval from http://developers.facebook.com/blog/post/2012/07/17/capturing-growth--photo-apps-and-open-graph/
Sami Viitamaki(2007, May 6). The FLIRT Model of Croudsourcing – The Updated Model and Backgroud. Retrieved from http://www.samiviitamaki.com/?p=60
法新社(2011年5月26日)。智慧型手機加人拍照收信多。Yahoo奇摩新聞。取自:http://tw.news.yahoo.com/智慧型手機-加人拍照收信多-010508812.html
法新社(2012年11月10日)。全球智慧機用戶破10億人。世界新聞網。取自:http://www.worldjournal.com/view/full_tech/20787860/article-全球智慧機用戶--破10億人?instance=techbox
法新社(2012年8月29日)。調查-智慧型手機市占明年過半。Yahoo奇摩新聞。取自:http://tw.news.yahoo.com/調查-智慧型手機市占明年過半-035002066--finance.html
財團法人台灣網路資訊中心(2010年03月30日)。2010年台灣寬頻網路使用調查報告。取自:http://www.twnic.net/NEWS4/91.pdf
許凱玲(編譯)(2012年10月4日)。歷史性的一刻,Facebook第10億名用戶今天誕生。數位時代。取自:http://www.bnext.com.tw/article/view/cid/157/id/24856
創市際市場研究顧問(2006年9月28日)。DC紀錄影像新生活網路相簿分享全世界。取自:http://www.insightxplorer.com/news/news_09_28_06.html
創市際市場研究顧問(2009年05月13日)。社交網站Facebook使用概況。取自:http://www.insightxplorer.com/news/news_05_13_09.html
創市際市場研究顧問(2009年05月26日)。線上影音正夯!三成網友一星期至少使用一次影音分享平台。取自:http://www.insightxplorer.com/news/news_05_26_09.html
創市際市場研究顧問(2009年10月27日)。社群類別網站黏度高於入口網站,網友每天花15分鐘Facebook。取自:http://www.insightxplorer.com/news/news_10_27_09.html
創市際市場研究顧問(2010年11月23日)。網友花費在社群網站時間為電子郵件網站的9倍。取自:http://www.insightxplorer.com/news/news_11_23_10.html
楊琇羽(2011年12月27日)。智慧型手機拍照快又讚 傻瓜相機需求不再?。鉅亨網。取自:http://news.cnyes.com/Content/20111227/KE11PZQSXNP5V.shtml
Description: 碩士
國立政治大學
數位內容碩士學位學程
98462003
101
Source URI: http://thesis.lib.nccu.edu.tw/record/#G0984620031
Data Type: thesis
Appears in Collections:[數位內容碩士學位學程] 學位論文
[數位內容與科技學士學位學程] 學位論文

Files in This Item:

File SizeFormat
003101.pdf5081KbAdobe PDF363View/Open


All items in 學術集成 are protected by copyright, with all rights reserved.


社群 sharing