海洋データセットの作成・保管に際して起こりやすい誤り
○永田豊(MIRC)・鈴木亨(MIRC)・小熊幸子(MIRC)・竹内淳一(和歌山水試)・三宅武治(JODC)・吉村智一(パスコ)
水産試験研究機関による一斉海洋観測は1964年から開始された「漁海況予報事業」にもとづいて行われており、1997年からは「新漁海況予報事業」として継続されている。1985年までのデータは磁気媒体(MT)に収録されており、それ以降はPODと呼ばれるデータ管理プログラムを使って流通ファイルとして保管されている。これらのデータは一定期間後にJODCに送付され、品質管理処理された後、JODCデータベースに追加されることになっている。海洋情報研究センター(MIRC:Marine Information Research Center)では和歌山県水産試験場の1975-1995年の21年間の流通ファイル、14164測点を対象として、海洋データの高度品質管理手法の研究・開発を行った。
流通ファイルに含まれる基本的な誤りの一つは、位置情報(緯度・経度)および観測開始時刻に関するものである。PODは、あり得ない位置(例えば190°E)や日時(2月30日)は入力できないようになっているが、空欄や不適切な位置・日時に関するチェックは行われていない。これらを検出するために、和歌山水試の場合は測点間の移動速度(船速)が15knotsを越えた測点について、観測表あるいは観測野帳にまで遡り照合作業を行った。その結果、これらの誤りのほとんどは入力ミスに因るものであることがわかり、リストアップされた387測点のうち372測点が観測表から、11測点が観測野帳から修正できた。残りの2測点は16.2kt.と15.6kt.であったが、これらは測点間の距離と観測開始時との関係から、誤りであるとは判断されなかった。このように、位置・日時情報の入力ミスの検出には船速チェックが非常に有効であり、15kt.という閾値は他の水産試験研究機関にも適用可能であると考えられる。
次に、定点水深に対する観測深度チェックの結果を示す。Fig.1は、定点水深に対する最深観測深度の超過度を年別にグラフ化したものである。ほとんどの年では25%以下が大半であるが、1974-1978年に集中して90%以上の超過が見られる。この状況はTable 1に示すように、水産試験研究機関の定線は浅海と沿岸・沖合に分けられ、それぞれの定線で報告される所定層深度が異なっているために起こったことがわかった。すなわち、浅海定線の観測結果を沿岸・沖合定線の所定層で報告していた測点が、定点水深に対して最深観測深度を大きく越えていた。観測野帳と照合したところ、浅海定線の場合は野帳の所定層水深を書き直していたが、1974-1978年の場合は書き直されずに沿岸・沖合定線のままになっていたため、その通りにデータ記載用紙(1985年まではこの用紙を水産庁に送付していた)に記入されたものと思われる。観測深度チェックで検出された511測点の内、観測表で496測点(観測表はデータ記載用紙とは別に和歌山水試が作成しており、こちらには浅海定線の所定層として記載されていた)、野帳で6測点が修正できた。残りの9測点については、いずれも黒潮流域内で水深勾配が急な測点であったので、観測中に船が移動したものと解釈された。
これらの他に、測点およびプロファイルの重複、水温・塩分のレンジおよび勾配、密度差チェックをおこなった。Fig.2に年別の密度差チェックの結果を示す。0mを含まない層に関する密度差チェックで検出されたデータ組教は、1970年代前半から激減しており、これはこの時期に導入された塩分検定機器の精度が向上したためと考えられる。また、水温・塩分のレンジチェックでは検出されなくても、プロファイルの形状から入力ミスと判断される場合もある。それらについては、JODGデータベースに追加された後、所定層毎のメッシュ統計処理によって標準偏差チェックを行い、フラグを付加することでデータの品質は高度に維持される。