メタデータの基本設計とその問題点
小熊幸子*・小泉聡子†・○鈴木亨・三宅武治‡.岩田静夫*・永田豊*
(*MIRC・†アジア航測(株)・‡JODC)
キーワード:メタデータ・品質管理・データベース・JODC
メタデータとは、データに関する情報を記述した、いわば“データあるいはデータベースのデータあるいはデータベース”である。すでにJODCでは航海計画情報(NOP)や航海概要報告(CSR)のようなインベントリ情報(一種のメタデータ)を収集・保管しているが、本格的なメタデータはまだ作られていない。
メタデータには、JODCに保管されているデータが「いつ」「どこで」「誰が」「何を」「何のために」「どのようにして」得られたもので、どのような品質管理(QC)がほどこされているか等の情報が、できるだけ詳細にデジタル化されて取り入れられるべきである。メタデータは、データ利用者にとっては目的に応じたデータの検索や有効な利用法の決定などに対して役立てることができ、データ管理者にとっては、データの高度な品質維持には欠かせないものである(Fig.1)。
和歌山県水産試験場が行っている定線観測データの品質管理を行ったところ、クルーズ毎の船速チェックが非常に有効であることがわかった(1998年度日本海洋学会春季大会講演244)。また、US-NODCが作成しているWorld Ocean Database 1998でもクルーズに関するエラーフラグを設定している。これらのことから、MIRCでは定線観測データに関するクルーズ単位のメタデータファイルの作成に着手している。また、メタデータ収集のために水産試験研究機関向けの統一野帳も作成した。
クルーズを基準としたメタデータファイルの作成には、JODGのNOPとCSRが基礎となる。しかしながら、観測責任者(PI)に時間的な余裕が少ないなどの理由から、全てのNOPとCSRを集めるまでに至っていないのが現状である。観測データのヘッダ部に収録されている情報だけではメタデータファイルの基本的な項目を満たすにも十分とは言えない。例えば、データのヘッダ部に船舶コード(およびコールサイン)が欠落していればクルーズ毎によるQCは不可能であり、メタデータに基づいて検索できないデータが存在することになる。このことは、データとメタデータとの間で整合性が取れなくなるだけでなく、メタデータの管理下にないデータの品質を保証できなくなることを意味する。
MIRCでは、JODCデータベースの品質を高度に維持・管理する手法を開発し、さらにデータ利用者の求める情報量とデータ作成者によって提供される情報量との間に存在するギャップを埋めるべく、メタデータに基づいたデータ利用者にとって使いやすい検索システムの構築を行うとともに、データ提供者のためのメタデータ作成支援ツールも開発しつつあり、現在までの成果を報告する。
Fig.1. メタデータ概念図