1.2 KoMMeDS-NFデータセットの作成
本年度事業では、未着手のマイクロフィルム(1924〜1933年)を全てB4用紙へ複写した。これらの一部とすでに複写してあった1921〜1923年の資料を合わせて、1921〜1928年の資料を検査(コーデング作業;平成8年度事業報告書巻末資料17参照)した後、キー入力を行った。この結果、今年度事業において電子媒体化した「海上気象報告」は355,392通である(表1.2、図1.1)。
表1.2に各年毎の観測通数、気圧、海上風、気温、海面水温、波浪のデータ数を示す。これによると、通数に対する各要素のデータ数の割合は、うねりを除いて、ほぼ100%近いことが示される。うねりのデータ数が少ない理由は、うねりの観測をしておらず、記載が無いことによる。
図1.1に年別のデータ数を示す。これによると、データは1921〜1928年に分布し、1924年〜1926年のデータが全体の約80%(約27万通)を占め、1925年のデータが最も多い(104,111通)ことが示される。
船舶の観測位置を図1.2に、緯度経度10度毎の海域別通報数を図1.3に示す。図1.2によると、データは北太平洋航路(東京―シアトルまたはサンフランシスコ)、北米ハワイ航路(東京―サンフランシスコまたはロスアンゼルス)、東シナ海からインド洋、紅海を通る東南アジア航路及びアフリカ喜望峰を迂回してリオデジャネイロに向かう南大西洋航路に集中して分布している。また、図1.3によると、北太平洋中緯度と南シナ海にデータが多いが、大西洋、赤道付近及び南半球のデータは非常に少ないことが示される。
図1.2からわかるように、数は少ないが観測位置が陸地に分布しているデータがある。これは西経と東経を誤ったり、観測位置を間違えて記入したものである。このような誤りを取り除くため、電子媒体化されたデータは適切な方法により品質管理(QC; Quality Control)をする必要がある。本事業では、世界気象機関の基準に則り、気象庁が品質管理を行っている(平成8年度報告書p.11;2.3データの品質管理)。
品質管理を受けたデータは、これまでにCD-ROMで公開されたデータと合わせて、国内外のデータセンター、気象海洋機関、大学および一般の利用者に公開される予定である。本年度事業では、平成11年度事業で電子媒体化した約33万通のデータを品質管理し配布する予定である。
表1.3と図1.4〜1.6にこれまでの事業で電子媒体化したデータの総数を示す。これらには品質管理済みデータ(平成7、8年度電子媒体化データと気象庁電子媒体化データの計1,045,682通数)と未品質管理データ(平成9年度〜12年度電子媒体化データ)が含まれる。