日本財団 図書館


第1部 歴史的海上気象観測資料のデジタル化
1.1 概要
 本年度(平成14年度)事業では、未電子媒体化資料を全て処理し、1911年〜1940年までの423,955通の資料を電子媒体化した。これまでの事業(平成7〜14年度)で電子媒体化したデータの総数は、約3,170,898万通である(表1.1)。
 次に、事業開始以来のこれまでの電子媒体化事業の概要を以下に述べる。事業を開始した平成7年度では1890年〜1932年のマイクロフィルムを40巻抽出し、約36万5千通の海上気象資料を電子媒体化した(平成7年度報告書)。続く平成8年度は、1901年〜1932年までのマイクロフィルムを約50巻複写し、約66万7千通の資料を電子媒体化した(平成8年度報告書)。
 第二期前期の平成9年度事業では、すでに複写した資料から1889年〜1932年までの約30万通の資料を電子媒体化した(平成9年度報告書)。第二期後期の平成10年度事業では、新たに15巻のマイクロフィルムを複写し、約25万7千通の資料を電子媒体化するとともに、平成7〜8年度事業で電子媒体化した資料を品質管理し、これをCD−ROM(1998edition)へ格納して利用者へ配布した(平成10年度報告書)。
 
表1.1 電子媒体化したデータ通数、CD−ROM及び報告書
年度 データ通数 CD−ROM 事業報告書
I 1995 365,021   平成7年度報告書
1996 666,417   平成8年度 〃
II 1997 299,816   平成9年度 〃
1998 257,175 平成10年度 〃
III 1999 332,913 平成11年度 〃
2000 355,392 平成12年度 〃
IV 2001 388,053   平成13年度 〃
2002 423,955 平成14年度 〃
合計 3,088,742 4枚 8冊
気象庁作成 82,156
総計 3,170,898 4枚 8冊
 
 第三期前期の平成11年度事業では、新たに5巻のマイクロフィルムを複写し、約33万通の資料を電子媒体化した。また、平成9〜10年度事業で電子媒体化したデータを品質管理し、平成10年度に作成したCD−ROMを再品質管理したデータと合わせて、平成12年版のCD−ROM(2000edition)として作成し配布した(平成11年度報告書)。第三期後期の平成12年度事業では、残りすべてのマイクロフィルムを紙媒体に複写し、このうち1921〜1928年の355,392通の資料を電子媒体化した。また、CD−ROM(2001edition)を刊行した(平成12年度報告書)。
 第四期前期の平成13年度事業では、すでに複写してある1921〜1930年の海上気象資料をコーデング及びキー入力をし、388,053通の資料を電子媒体化した(平成13年度報告書)。第四期後期の本年度(平成14年度)事業では、未電子媒体化資料を全て処理し、1921年〜1940年までの423,955通の資料を電子媒体化した。これまでの事業(平成7〜14年度)で電子媒体化したデータの総数は、約317万通である。なお、この中には気象庁が平成7、9年度にデジタル化した82,156通も含まれる(表1.1)。
 
1.2 KoMMeDS−NFデータセットの作成
 本年度事業では、すでに複写してある1911〜1932年の資料と、新たに1933〜1940年の資料を複写し、これらを検査した後(コーデング作業;キーパンチャーが入力し易いように、読み取り難い文字を明瞭に記すこと等、平成8年度事業報告書 巻末資料17参照)、キー入力を行った。この結果、今年度事業において電子媒体化した「海上気象報告」は423,955通である(表1.2、図1.1)。
 表1.2に電子媒体化された各年毎の観測通数、気圧、海上風、気温、海面水温、波浪、うねりのデータ数を示す。この表によると、通数に対する各要素の観測数の割合は、うねりを除いて94%以上であることが示される。うねりの観測の割合は約52%であり、観測数が少ない理由はうねりの観測記載がないことによるものである。
 図1.1に年別のデータ数を示す。これによると、データは1912年〜1940年に分布するが、1930年〜1932年にデータが集中し、全体の約84%(約36万通)を占め、1932年のデータが最も多い(145,129通)ことが示される。
 船舶の観測位置を図1.2に、緯度経度10度毎の海域別通報数を図1.3に示す。図1.2によると、データは日本近海、北太平洋航路(東京−シアトルまたはサンフランシスコ)、北米ハワイ航路(東京−サンフランシスコまたはロスアンゼルス)、東シナ海および南シナ海に集中して分布している。また、図1.3によると、日本近海、東シナ海と北太平洋中緯度にデータが多いが、大西洋、赤道付近及び南半球のデータは非常に少ないことが示される。
 図1.2によると、数は少ないが観測位置が陸地に分布しているデータがある。これは緯度経度や西経東経を誤るなど、観測位置を間違えて記入したものである。このような誤りを取り除くため、電子媒体化されたデータは適切な方法により品質管理(QC;Quality Control)をする必要がある。本事業では、世界気象機関の基準に則り、気象庁が品質管理を行った(平成8年度報告書p.11;2.3データの品質管理)。
 本年度事業では、平成7年度〜12年度事業で電子媒体化し晶質管理したデータを再品質管理し、これに平成13年度と14年度に電子媒体化したデータを品質管理して、併せてCD−ROMに格納し、一般の利用者へ公開した。
 表1.3と図1.4〜1.6に、これまでの事業で電子媒体化し品質管理した全データを示す。これらのデータは品質管理されたデータであり、品質管理する前のデータの集計である表1.1とは値が異なることに注意されたい。表1.3によると、品質管理されたデータの総数は3,138,075通であり、うねりを除く各要素のデータは、約294万通以上あることが示される。
 図1.4は、これまで(平成7年度〜平成14年度事業)に電子媒体化し、品質管理した全データを年別に棒グラフで示す。この図より、これまでに電子媒体化されたデータは、概ね1901〜1932年に分布していることが分かる。
 図1.5は、これまでに電子媒体化した全てのデータの観測位置を、図1.6には緯度経度10度格子に含まれるデータの個数を示す。この図からわかるように、「神戸コレクション」に含まれる船舶データは、北太平洋の北緯20〜50度に集中して分布することが示される。
 
表1.2 
平成14年度に電磁媒体化した要素別データ通数一覧表(未QCデータ)
(拡大画面:113KB)
 
(拡大画面:25KB)
図1.1 
平成14年度に電子媒体化した船舶海上気象観測データの年代別データ通数(未QCデータ)







日本財団図書館は、日本財団が運営しています。

  • 日本財団 THE NIPPON FOUNDATION