【數位資料庫任我行】認識 Metadata,找各類型典藏資料不再大海撈針!

2020-05-29

產業專題研究及調查報告
【數位資料庫任我行】認識 Metadata,找各類型典藏資料不再大海撈針!

Size:

【本文由文化內容策進院 TAICCA X  開放實驗室 OCF Lab 共同合作企劃】 作者:陳廷彥

 

在資訊爆炸的今日,博學強記不再是獲取知識的唯一途徑,即時找到正確、可靠的資料,往往更是工作上的決勝關鍵。Metadata,正是讓我們輕鬆撈到資料和加速數位資料鏈結的好幫手!

 

想像你坐擁一個收有一千萬本書的圖書館,你要怎麼讓讀者可以輕易找到想要的資料?最基礎的一步,就是必須把這些圖書資料們的作者、標題、出版年份、出版者等內容一一記錄下來,才能進一步幫它分類,並讓讀者能利用這些描述館藏的基本資料,查到自己想要的書。當今天這個館藏是圖畫、書刊、藝術品、數位影音等文化產物的資料,協助在線上索引和記錄文化館藏的「關於資料的資料」就是「Metadata」(後設資料,也譯為「詮釋資料」)。

 

無論對於資料的提供者、管理者或使用者,Metadata 的重要性不亞於資料本身:

 

  • 資料系統化管理與分類:對資料的管理者而言,最顯而易見的用處是 Metadata 提供了分類的標準,讓龐雜的資料不再四散各處,可以被有系統地分類與管理。
  • 利於資料搜尋:系統性分類標準的建立亦有助於促進資料的「可發掘性」,讓使用者可以輕易地找到有用的資料;另一方面,對於提供資料的人而言,也能讓自己的心血在茫茫資料海中更有機會脫穎而出。
  • 促進資料流通與傳播:由於共享同一套分類標準,Metadata 能使作品的記錄可以在不同資料庫之間互通,提高其流通程度。
  • 幫助資料長期保存:透過記錄資料的流通歷史與物理特徵,資料管理者在資料遺失時可以更容易追蹤去處與複製,有助於資料的永續保存與傳承。

 

因為 Metadata 在這些層面的重要性,任何有大量資料的地方,都需要 Metadata。除了通用的「都柏林核心」(Dublin Core)系統界定了十五個 Metadata 的主要元素,各個領域也都有自己的 Metadata 系統:圖書資料有「MARC」標準,博物館社群有「CDWA」標準,植物標本館有「HISPID」標準等。而在近年來獲得大量關注的開放資料領域,國內外也紛紛建立起用來描述開放資料集的 Metadata 規範,例如台灣的國發會就訂定了「資料集詮釋資料標準規範」。

 

如果沒有完善的 Metadata 標準,會導致什麼問題?2019年國外媒體 The Verge 就撰文指出,音樂產業由於缺乏共通的 Metadata 系統,關於音樂作品的資料四散各處、沒有集中管理,結果資料常常打錯,或在資料庫之間轉移時被遺漏。這不但時常讓音樂的搜索變得困難,許多參與音樂創作的音樂人名字更因此沒有出現在資料庫中,也就拿不到應有的收入。根據估計,高達25% 的版稅因此沒有付給發行公司,或被付給了錯誤的機構。也因為如此,近來開始有音樂人倡議建立音樂產業的 Metadata 標準「MEAD」,希望改善這樣的窘境。

 

由此可見,Metadata 看似只是微不足道的技術細節,但其實左右資料的流通與運用,更可能嚴重影響創作者和文化內容業者的生計。因此,建立縝密、統一的 Metadata 系統,可說是在這個資訊爆炸的年代,從事資料數位化的重要任務。


參考資料:

Share: