次に、同じクルーズで観測位置(緯度経度で0.1分までの記載がある)が完全に一致するものを選び出した。そうして、両方またはいずれか一方が一致しているものについては、水温・塩分の鉛直分布値が、これも完全に一致するかどうかを調べた。この結果から、この重複の可能性の高いデータについてTable2に示すような6つの場合に分けて統計を取った。case1とcase2が、観測日時・観測位置が一致している場合、case3とcase4は観測日時だけが一致している場合、case5とcase6が観測位置だけが一致している場合で、それぞれの場合において、奇数のものは報告された水温の鉛直分布が完全に一致する場合、偶数はプロファイルが異なっている場合である。ただし、プロファイルの一致には、報告された標準層の数あるいは深さが異なっていても、双方に共通する標準層の数値が互いに一致する場合も、ここに含めている。したがって、case1には、設定された標準層も完全に一致する場合と、若干異なっている場合がある。これについては後に論じる。
検出された重複の可能性の高いデータに付いて、1971年以後のものについては観測野帳と対照して、また1970年以前のものについては「水産試験研究機関海洋観測資料」と対照して、ミスタイプがあればそれを訂正して、改めて統計を取った。ただし、水温・塩分の鉛直分布に関しては、「観測資料」の記載が塩素量になっていることもあり、塩分の鉛直分布の対照は行っていない。
野帳の保存状態の異なる1970年以前と、1971年以後に分けて、重複データ発生状況を検討した。1970年以前の期間でのエラー発生状況をTable3に示す。Table3aが「観測資料」(1968年4月以降1970年までについては観測野帳)によるミスタイプのチェックを行う前、Table3bがチェック・訂正を行った後の結果である。これらの表では、左から解析したデータ(測点)数と、重複ないしは重複の可能性の高いデータの数を示している。次のcase1からcase6は、Table2の分類によるcase毎の発生頻度である。1970年のデータには重複データが1つも現れていないが、1963年から1969年の期間については、重複の可能性の高いデータは、Table3aおよびTable3bともに、解析したデータ数の約5%に達する。2つの表を比較して、「観測資料」または野帳によるミスタイプのチェック・訂正の効果は、余り現れていないことが分かる。ただし、1963年のデータの1つが観測日時のタイプミスから、別測点のものであることが判明した他、1966年の1データがcase4からcase2に移り、1968-69年のcase2の若干数のデータがcase1に移っており、チェックの結果、僅かではあるが、より「完全一致のcase1」に近づいた。
1971年以後の期間における重複データの出現状況をTable4に示すが、ここでは塩分の鉛直分布もチェック対象にしており、チェック項目が増したにもかかわらず、重複データの出現頻度がそれ以前に比べて激減している。