日本財団 図書館


はしがき
 本報告書は、PSCターゲット方式調査研究会において平成15年度に審議・検討したターゲット方式に関する成果をとりまとめたものである。
 
PSCターゲット方式調査研究会
(敬称略順不同)
委員長: 萩原 秀樹 東京海洋大学海事システム工学科 教授
委員: 岡田 卓三 (社)日本船長協会 常務理事
委員: 松岡 猛 独立行政法人 海上技術安全研究所 海上安全研究領域長
委員: 田淵 一浩 国土交通省海事局 外国船舶監督業務調整官
関係者: 伏見 慎一 国土交通省海事局 外国船舶監督業務調整係長
関係者: 伊藤 和行 国土交通省海事局 海技資格課海技資格制度対策室
外国船舶監督係長
事務局: 岡田 光豊 (財)東京エムオウユウ事務局 専務理事
寧 正 (財)東京エムオウユウ事務局 企画課長代理
秋元 文子 (財)東京エムオウユウ事務局 業務課長代理
 
PSCターゲット方式に関する調査研究
 船舶運航の安全を確保するためにはポートステートコントロール(PSC)による検査を実施し、各船舶運航者の安全意識を高めるとともに、安全対策の実施状況をチェックすることが重要である。しかし、この船舶検査には検査する側、される側共に多大な労力と時間がかかり、多数船舶が入港する港においては全数検査は不可能な状態にある。
 そこで、従来より効率的なPSC業務の実施のためにターゲットシステムという船舶検査実施のための判定基準策定がPSC委員会の会合において議論され、各種の方式が提案されてきている。しかし、これらの提案は多分に経験者の感により設定されたものであり、最適なものであるかどうかの決め手はなく、また、得られた評価点のどこで線引きをするかの明確な基準を得ることも難しい状況にある。
 そこで、本調査研究において統計的な手法を用い、効率的かつ根拠のある判定基準を提案し、実際のPSC業務への活用を図ることを目的とした調査研究を実施した。
 各種計測データを用いて現象を予測や分類問題として捉える統計数理的データ解析の一つとして多変量解析がある。多変量解析では計測データに附随している現象を多数の特性要因、特性量を用いて分析する。具体的には、重回帰分析、判別分析を用い、過去のデータをもとに予測式を導出することを試みた。
 本調査研究は、大学、船長協会、国土交通、研究機関など各分野の委員により構成され、船舶検査実施のための判定基準策定について広範囲の意見を反映するようにした。
 本報告書は、平成15年度単年度の成果を取りまとめたものである。
 
 本調査研究では、効率的かつ根拠のあるターゲットシステムを提案し実際のPSC業務への活用を図ることを目的として以下の内容の検討を実施した。
 まず、多変量解析が適用可能かどうか見通しを立てるため、比較的少数のデータを使い予備的分析を実施した。
 その結果をもとに、約2年分のデータを用いた本解析を実施し線型判別関数を求めた。
 説明変数として、管理会社の情報を入れた判別分析も実施した。現在管理会社の情報は十分なものが集められていないため予備的な解析に終わったが、管理会社の情報はより効果的なターゲットシステムを構築する際に有望であることを示した。
 判別分析の過程から、特定の船籍、あるいは老朽船のみを検査対象とする方法も効率的であることを示した。
 比較のため各種ターゲット方式のなかで最新の方式である2003年修正案について定量的に評価し、比較的有効な方法であることを確かめた。
 最後に今後の検討課題について言及した。
 
 各種計測データを用いて現象を予測や分類問題として捉える統計数理的データ解析の一つとして多変量解析がある。多変量解析では計測データに附随している現象を多数の特性要因、特性量を用いて分析する。今対象としている船舶検査では、現象としては「安全対策の欠陥」、「拘留の必要」、「欠陥数」等があげられる。これに対する特性要因、特性量には「船齢(Ship Age)」、「船種(Ship Type)」、「国籍(Ship Flag)」、「Classification Society」、「検査空白期間」、「過去の拘留回数」等がある。現象が数量であらわされている場合(例えば「欠陥数」)には重回帰分析が、現象がある区分(グループ)に属しているかどうかの場合は判別分析が使用される。
 本調査研究では、ロシアのヴィタリ・クリューエフ氏(APCISマネジャー)から提出された考察(参考資料)も考慮に入れながら、重回帰分析、判別分析を用い、過去のデータをもとに予測式を導出することを試みた。
 
 重回帰分析とは 結果 ← 原因1 + 原因2 + 原因3 + ・・・
と、一つの結果といくつかの原因が関連しているとき原因から結果を予測するための分析方法である。結果のことを目的変数y、原因のことを説明変数vと呼ぶ。この関係を一次式で表したのを線型重回帰分析と言う。ここに示すように原因が複数あるため重回帰と言う。
y ← Y = b1v1 + b2v2 + b3v3 + ・・・ + bnvn + b0 ・・・(1)
と表現した式をyの予測値Yを求める重回帰式という。b0は定数項で、b1、b2、b3・・・bnを偏回帰係数という。
 説明変数として量的データを必要とするため定性的データが含まれている場合は、定性的データをダミー変数と呼ばれる量的データに変換してから使用する。
 
 ここである二つの説明変数同士の相関係数が1に近い場合、つまり変数v1が大きな値をとるときは変数v2も大きな値をとりこれらの2変数がほぼ同様な挙動をする場合は分析において不具合を生じる。結果に寄与する同様の原因を二重に数えることになってくる。この判断指標としてVIF(Variance Inflation Factor; 分散拡大要因)が準備されており、VIF値が5.0以上なら要注意といわれている。全説明変数を使用したときのVIF値が大きな変数が複数ある場合は、それらの変数に相関性(共線性)があることになり、最終的にはどれか一つの変数を選択する必要がある。
 
 つぎに、ある説明変数の目的変数への影響の大きさを調べて説明変数の重要度を判定する必要がある。そのための方法としては、目的変数および全ての説明変数を標準化(平均を0、分散を1に変換)したときの重回帰式を求める方法がある。このときの偏回帰係数を標準偏回帰係数と言い、値の大きなもの程影響が大きく、この値から説明変数の寄与度を判定することができる。
 一方、偏回帰係数を0.0(寄与が無い)と置いても良いという仮説を統計的に検定することにより定量的な判定が可能となる。偏回帰係数をその標準誤差で割った値を2乗したものをF値とするとこのF値は自由度(1、N-p-1)のF分布に従っている。ここで、Nはサンプル数、pは説明変数の数である。
 
F値=(偏回帰係数/標準誤差)2
 
 F分布とは、互いに独立なX2分布に従う統計の比(F=v1x12/v2x22)として定義されている。有意水準0.05で仮説が棄却される場合(つまり、偏回帰係数の寄与がある場合)はF値がF分布の0.05%値(F(1、∞)(0.05)=3.84)より大きな値となる時である。ここでは、本分析での対象とするサンプル数は1,000〜3万であるので自由度としては∞を用いている。
 結果に影響を及ぼすと考えられ候補に挙げた説明変数全てを用いた重回帰式を求める場合を、強制投入法と言う。
 説明変数を順次増減させ最適な重回帰式を求める方法がソフトウエア(SPSS: 本調査研究で使用した多変量解析のソフトウエア)に準備されている。その結果、共線性、有意水準(寄与度)を適切に考慮した回帰式が得られる。
 説明変数の棄却基準として上に挙げたF値=2.0、4.0、等を条件として与え分析を行なった。
 
 多次元空間(本調査研究の場合10次元空間となっている)の中に分布したデータ点を、2つのグループ(本調査研究では拘留の有無とした)に分ける平面を求め、各データがどちらのグループに属すかを判別するのが線型判別分析法である。
 重回帰分析と同様な式、
 
Z = b1v1 + b2v2 + b3v3 + ・・・ + bnvn + b0 ・・・(2)
 
が線型判別関数と呼ばれ、Z=0が境界面を与える式となる。V1、・・・Vnに説明変数の値を代入して得られた値Zを判別得点と定義しているが、これは境界平面からの距離を与える。
 一方、多次元空間のなかでのグループ1(拘留無)、グループ2(拘留有)のそれぞれの平均位置からの距離を考え、近いほうのグループに属すると判別するのがマハラノビスの距離による判別法である。マハラノビスの距離とは単なる距離ではなく各グループの分散、共分散を考慮した量である。
 線型判別関数か、マハラノビスの距離による判別のどちらを用いるべきかは各グループの分散共分散行列の比較により判定される。分散共分散行列が5%水準で等しい場合は線型判別関数による判別でよいことになる。
 重回帰分析と同様に判別分析でもステップワイズ法がSPSSのソフトに用意されており、適切な説明変数による線型判別関数が得られる。







日本財団図書館は、日本財団が運営しています。

  • 日本財団 THE NIPPON FOUNDATION