日本財団 図書館


3. 学習型フィードフォワード制御システム
 自動着桟操船では、誘導実行の前に、操船ルートや船速、船体姿勢などが操船計画9)によって立案されなければならないが、ここではすでに、操船計画によって自動着桟のための目標値が設定されているものとして、それには触れない。
 通常、着桟操船時の船舶の運動特性は、船速の変化とともに大きく変動する。従って、着桟操船を自動制御する場合、アプローチ操船制御時に適正であったフィードバックゲインは、接岸直前のバーシング操船制御時には不適となり、ゲインを変更するか制御方式を変更する必要が生じる。
 ここでは、学習型フィードフォワード制卸方式が、制御対象の動特性変化に対して、制御系を変更しなくても学習による適応機能によってかなりの制御性能が維持されることを示すと同時に、風外乱補償制御系によって風外乱の影響が補償されることを示す。
3.1 自動着桟制御システムの設計
 文献1, 2, 3)に述べられている多変数制御系の設計法に従って、自動着桟制御システムを設計する。
 
Table 1 Principal particulars of the object ship
Items
Displacement W 24,742 ton
Length Lpp 175.00 m
Breadth β 25.40 m
Draught d 9.50 m
Block coefficient CB 0.572
 
 制御対象船は船長175mのいわゆるSR108コンテナー船であり、船体主要目をTable 1に示す。詳細については文献10)に記載されているのでここでは省略する。ただし、SR108コンテナー船にはフィン及びスラスターの装備は想定されていないが、本論文ではバウスラスター及びスタンスラスターを用いて制御を行うので、スラスターはそれぞれ船体重心位置からx'B=sB/L=0.375及びx's=xs/L=-0.350の位置に設置されているものと仮定する。スラスターの最大推力はそれぞれ40 ton、推力の最大増加率は2.86ton/secと仮定している。
 
Fig. 2  Root loci of the closed-loop transfer function from thrust of the bow thruster to heading angle (U0=1 knot)
 
 学習型フィードフォワード制御システムを構成する逆システムは安定でなければならず、そのためには、SR108コンテナー船の伝達特性が安定でなければならない4, 5)。バウスラスター推力から回頭角までの伝達関数を例にとってその根軌跡をFig. 2に示す。この伝達特性は、極及び零点が左半平面にある安定な最小位相推移系であり、従って、それから得られる逆伝達関数も安定である。その他の伝達特性についても安定であることを確認している。
 Fig. 3に、プロペラ、バウスラスター、スタンスラスターによって船速、横移動量、回頭角を同時に制御し、目標の位置に船体を接岸する自動着桟制御系のブロック線図を示す。
 
Fig. 3  Block diagram of automatic approach and berthing control system based on the LFFC system
 
 船速に関する制御は、簡単のため、比例ゲインのみの単純なフィードバックループとし、目標値をできるだけ速やかに実現できるようなゲインを設定している。その他のフィードバック制御系は、横方向の移動量y'0の偏差からバウスラスターの推力が、また、回頭角ψの偏差からスタンスラスターの推力が得られるように構成されている。各々のフィードバックコントローラから出力される操作量TFBiは、バウスラスター推力とスタンスラスター推力を出力するLFFCシステムのフィードバック誤差学習を実行するための教師信号となる。教師信号は結合係数の学習ができればよいため、各フィードバックコントローラに良好な制御性能を要求する必要はなく、ゲインは安定な小さな値が設定されている。
 文献1, 2, 3)に記述されている設計法に従って選択されたフィードバックコントローラ(PD動作)は、Kp(1+TDs)で表され、それらのパラメータ値は次のようである。
FBO: kp=1.47rps/knot
FB1: kp=16000kg、TD=150sec
FB2: kp=-389kg/deg、TD=200sec
 フィードバックコントローラのみによる、目標値(破線)に対する制御結果をFig. 4に一点鎖線で示している。船速は目標の3ノットを実現しているが、横移動量y'0および回頭角ψについては、制御精度がよくない。
 Fig. 3におけるGijは逆システムを表し、(G11, G12)及びG21, G22)は目標値追従系(LFFCD)、G14, G'14)及び(G24, G'24)は風外乱補償系(LF-FCWD)で、結合係数Wijkを用いて次式で表される。
 
 
 
 ただし、
H=b24b35-b25b34
J=a22a91b35-a31a91b25+a61a92b35
D=a61a92+a51a61a91
E=a21b35-a32b25
P=a22a91b34-a31a91b24+a61a92b34
Q=a21b34-a32b24
 
Fig. 4  Desired values for learning and responses of LFFCD after 10 learning trials
 
 GijとG'ijは同一の外乱からの信号を入力とすることから、一対で1つの逆システムとみなしている。また、逆システムGijの添え字iは操作部の種類(バウスラスター:i=1、スタンスラスター:i=2)、jは制御量の種類(y0軸方向の移動量y'sb0: j=1、回頭角ψ:j=2)または外乱の種類(風:j=4)である。
 逆システムはsの次数の異なるサブシステムに分けられると考え、それぞれに結合係数が連結され、結合係数はフィードバック誤差学習によって制御対象の逆特性を正確に近似するように調整される。
 逆システムヘの入力が確率過程で、結合係数(シナプス荷重)変化の時定数が十分に大きければ、結合係数Wは学習方程式によって、フィードバックコントローラからの出力TFBが最小となる値に平均収束し、制御対象の入出力特性を逆に見たシステムの近似が得られることが、川人11)によって数学的に証明されている。ただし、このときの学習方程式は(10)式の右辺第2項を除いた式で、この場合、学習速度は非常に遅く、数百回または数千回の学習回数を必要とする。
 ここでは、学習の高速化のために、いわゆる比例項を導入した次の学習方程式を用いることにする12)
 
 
 ただし、yijkは逆システムの中の各サブシステムからの出力、TFBiはフィードバックコントローラからの出力である。添字kはサブシステムの順番を表す。Wijとwpijが結合係数Wijkの学習の安定と速度に関係する学習方程式の係数である。
 これらの学習方程式の係数は、(11)式に示す制御偏差の自乗時間積分値εjの学習1回目の値を評価規範とし、1)積分項、2)比例項、の順に決定される1, 2, 3)
 
 
 ここで、xdは目標値、xは制御量を表す。
 LFFCDのために採用された学習方程式の係数は、
(G11, G12): w11=w12=10-9
ψp11=wp12=10-2
(G21, G22): w21=w22=10-6
wp21=wp22=3×10-1
である。
 学習方程式の係数が決定された後、Fig. 4に示す目標値に対してくり返し学習を実施する。εjが十分に小さくなれば学習が終了したとみなし、普通2、3回で学習は終了する。実際には念のため2500秒間の学習を10回実施している。
 10回学習後のLFFCDによる制御結果をFig. 4に実線で示している。回頭角に若干制御偏差が残っているが良好な制御結果が得られている。
 LFFCWDの諸量を決定する時には、時刻t=0秒において、ステップ状の風が突然に吹いてくるものとし、外乱に対して原針路を保つ補償制御を考える1)。実際の風外乱は時間と共に変動するが、このような変動外乱は近似的にステップ関数の重ね合せと考えることができ、ステップ状のある代表風外乱に対して学習が終了していれば、変動風に対しても学習効果が期待でき、後はニューラルネットワーク特有の汎化特性によって対応できると考えられる。その証左は文献1, 5)に示されているので、ここではLFFCWDの学習及び変動風に対するシミュレーション結果についての詳細は省略する。
 LFFCWDのために採用された学習方程式の係数は、
(G14, G'14): w14=10-8、Wp14=10-1
(G24, G'24): w24=10-8、wp24=10-1
である。
 LFFCD及びLFFCWDの学習方程式の係数探索における結合係数の初期値は全て1としている。LFFCWDは風速15ノットの風に対して、LFFCDと同様に10回の学習を実施している。学習時の船速は3ノットである。制御系は制御実行中も、与えられた目標値に対して学習を継続している。
 風外乱によって船体に働く外力の推算法は多くの方法が提案されているが、ここではIsherwood13)の方法に従っている。


前ページ 目次へ 次ページ





日本財団図書館は、日本財団が運営しています。

  • 日本財団 THE NIPPON FOUNDATION