メタデータの基本設計
-クルーズ別メタデータの作成-
○小熊幸子(MIRC)・岩田静夫(MIRC)・鈴木亨(MIRC)・小泉聡子(アジア航測)
メタデータとは、データの起源や変遷に関する情報を記述した「データのデータ」である。具体的には、データが「いつ」「どこで」「誰が」「何を」「何のために」「どのようにして」採られたもので、どのような品質管理(QC)がなされたのか、などの情報が可能な限り詳細に記されたものである。データ利用者にとっては目的に応じたデータの検索やデータの有効的な利用に活用することができる一方、データ管理者にとってはデータの高度な品質管理・維持を行ううえで重要な手だてとなる(Fig.1)。
JODCには航海計画情報(NOP)や航海概要報告(CSR)といったインベントリ情報(一種のメタデータ)が存在しているが、現在の状態では、データベースにリンクしていないためデータ検索に生かすことができない、データの品質管理情報が含まれていないなど、不便である。
MIRCでは、JODCのデータベースの品質を高度に維持・管理するためのメタデータの基本設計において、クルーズ別にメタデータを作成することを念頭に置いている。その理由として、観測データのQCにおいて、クルーズ毎の航速チェックが有効であったことが挙げられる。
メタデータに収録する項目については、各分野の専門家等への聞き取り調査の結果、データ利用者の求める情報量とデータ提供者が実際に提供しうる情報量との間に差がみられたことから、水産試験研究機関の定線観測データをもとに、現実的で必要最小限な項目を挙げ、試験的に作成することにしている。しかし、観測データのヘッダ部に収録されている情報だけではメタデータファイルの基本的な項目を満たすのに十分とは言えない。例えば、データのヘッダ部の船舶コード(もしくはコールサイン)が欠落している場合、クルーズ毎のQCが不可能であるばかりでなく、メタデータに基づいて検索することができないデータが存在することになる。
クルーズを基準とするJODCのメタデータファイルの作成においてはNOP、CSRが基礎となるが、観測責任者に時間的余裕が無いなどの理由で、全てのNOP、GSRを集めるに至っていないのが現状である。
MIRCでは、メタデータ入力ソフトを開発・配布することでデータ提供者によるメタデータ作成を支援する他、検索結果からメタデータベースにアクセスできるような、メタデータベースを使用したデータ検索システムの構築を計画している。