海洋データの高度品質管理─三陸沖混合水域を例として─
High Level Quality Control on Oceanographic Data
 
小熊 幸子・永田 豊
Ms. Sachiko OGUMA and Dr. Yutaka NAGATA
 
MIRCは水温・塩分の基礎的な物理量を中心に品質管理ソフトの開発を行ってきているが、高度の品質管理を行うためには種々の基礎的研究が必要となる。米国にある世界データセンター(WDC-A)が発行した1998年度版世界海洋データベース(WOD98)編集に際して用いられた品質管理や内挿法(日本海洋データセンター、JODC、では若干簡略な方式が用いられている)においても、個々の限られた海域を対象として、より高度の品質管理を行うには、多くの問題が残されている。そこで、日本近海で最も複雑な海況を示す三陸沖の混合水域等を対象として検討してきた結果を報告する。
品質管理で先ず行うのは、位置や観測日時等の測点情報に関するもので、これには船速チェックが有効であることはすでに述べた(MIRC News Letter No.2)。水温・塩分の測定値について最初に行われるのがレンジチェックであり、測定値があらかじめ設定された範囲内にあるかどうかのチェックである。表紙に示した上側2つの図は、岩手県水産技術センターの三陸沖での20年間の水温・塩分の観測資料をそれぞれ1つの図にプロットしたものであるが、それぞれの図で外側の階段状折線が、WOC98で採用されている範囲(レンジ)を示す。これは赤道域を除く北太平洋全域を対象として設定されたもので、プロットされたデータの全てが十分範囲内に入っている。言い換えれば、この様な広域を対象に決められた範囲は、海域を限定すれば、複雑な三陸沖においても広すぎて明らかなミスタイプの発見にしか役に立たないことが示される。一歩進んだ範囲の設定としては、与えられた場所での平均値(m)や分散(σ)を求めて、m±3σの範囲外のものを異常値としてチェックする方法である。図で白三角をつないだ中央の線が平均値で、その外にある白丸をつないだ2本の線がm±3σの線である。データの分布が正規分布に近ければ、このm±3σを範囲に採用するのが適当であるが、亜寒帯域の、特に水温については問題がある。これは寒帯・亜寒帯でも水温が-2℃(三陸沖では0℃)以下になることがないから、データの頻度分布は下限があらわれるが、上方に大きく伸びる形になる。したがって、m+3σより高いが異常とは言えない水温のデータが現れることになる(図で200m〜300m付近参照)。m-2σ、m+4σの様な範囲を設定すべきであろう。表紙下側の4つの図は1、4、7、10月のデータをTSダイヤグラム上にプロットしたものを示すが、この海域上層では顕著な季節変化があり、このことも勘案して具体的な範囲設定法を提案したいと考えている。
 
MIRC has developed quality control (QC) software for oceanographic data such as temperature and salinity (MIRC News Letter No. 2). There remain many research items in order to design QC software of higher levels. The World Data Center A (WDC-A) in US set up a due procedures of QC and of interpolation to compile World Ocean Database 1998 (WOD98). As they are applied to worldwide oceanic data, there remain several problems in order to conduct high level QC for a specified sea area of limited extent. Oceanic structure in the Mixed Water Region between the Kuroshio and Oyashio Fronts to the east of Honshu. Japan is very complicated and has many layers with small vertical scales. Temperature and salinity contrasts are large among these layers. We discuss here problems to conduct high level QC in this area.
The most basic QC for quantities such as temperature and salinity is “range check”: to check whether data lies between a prescribed range which is set for each quantity in given area and given depths, and to put error flag if data lies outside of the range. The upper two figures in the face page are the plots of temperature (left) and salinity (right) data taken by Iwate Fisheries Technology Center in the Mixed Water Region off Sanriku Coast in the period from 1971 to 1995. The outermost two stepwise lines shown in each figure indicate the range of normal data given by WOD98 for the entire North Pacific Ocean except tropical area. All of the observed temperature and salinity data are distributed well inside of the range. However, some of the data points lie separately and apart from a clustered portion. These data would be erroneous, or, at least, need to be checked. This means that the range given by WOD98 is too broad if we confine our attention in the limited area, even when we select the area having very complicated oceanic structure like the Mixed Water Region. A more reasonable setting of the range can be done through statistical analysis. If we have enough number of data for a given area and for a given depth range, reasonable mean (m) and standard deviation (σ) would be obtained. If the distribution of the data is roughly Gaussian, 99.7% of the data would lie in the range m±3σ. Then, m±3σ would give a reasonable range of normal data. The central line with white triangles in each upper figure shows the vertical profile of the calculated mean value for each quantity, and two outer lines with white circles that of m±3σ. As seen in these figures, this range appears not to be suitable in the Mixed Water Region: the line of m+3σ passes inside of the clustered portion of the data, especially for temperature (left figure) between 200m and 300m. The water temperature off Sanriku Coast never becomes below 0℃ even in winter. The temperature is considerably increased when the Kuroshio or the Tsugaru Current waters intrude into this region. Thus, the distribution pattern is very skewed as seen in the figure. We need to set the range in a different way, say between m-2σ and m+4σ for the Mixed Water Region. However, the distribution pattern shows considerable seasonable variation as shown in lower figures of the figure in the face page, where of data distribution on TS diagram is shown for the data taken during January, April, July, and October (from left to right).