新しい IBM Developer JP サイトへようこそ!サイトのデザインが一新され、旧 developerWorks のコンテンツも統合されました。 詳細はこちら

二重振り子におけるカオス

概要

二重振り子とは、振り子の先にもう 1 つの振り子を連結したものです。単純な物理システムでありながらも、環境内の初期条件とノイズ (振り子の連結による室内の空気の動き、音の振動、テーブルの振動など) に極めて敏感に反応して複雑な動的挙動を見せます。随時、環境による影響がその後の軌道に影響を与え、その影響が時間とともに大きくなっていくことが、二重振り子がカオス・システムであるゆえんです。

このデータセットに含まれる二重振り子の動画は、高速度ビデオ・カメラの Phantom Miro EX2 で撮影しました。このカメラに備わっている高速グローバル・シャッター機能により、短時間の露出時間で被写体ぶれを回避し、歪みのないフレームを撮影することができました。振り子のアームの位置を抽出しやすくするために、艶消しの黒い背景を使用し、3 つの測定基準点を赤、緑、青の基準マーカーでマークしました。これらのマーカーを、それぞれの直径が振り子の測定基準点と正確に一致するように印刷したので、位置合わせは容易でした。短時間のフレーム露出時間を埋め合わせるために、振り子の照明には (光の揺れを防ぐための) カスタム DC 電源を備えた強力な LED 投光照明を使用しました。被写体の軸を最初の振り子の測定基準点に合わせて、カメラを被写体から 2 メートル離れた位置に配置しました。振り子の動作を手でスタートさせて、カメラの撮影を開始します。このデータセットは 21 回の振り子の実行を基に生成されていて、それぞれの実行シーケンスの録画時間は約 40 秒間です。各シーケンスは約 17,500 のフレームからなります。

私たちは、動画から取得したマーカーの位置を抽出するプログラムを実装しました。動画フレームを処理するために、最初にその画素数を 5 倍に増やして 1 ピクセル未満の位置解像度を簡単に利用できるようにしました。scikit-image を使用して作成した基準マーカー・テンプレートを OpenCV 相互相関アルゴリズムと併せて使用して、フレームごとに最適一致を検出しました。一致として検出された一連のマーカーは、最終的にそれぞれの色に基づいて区別されています。

私たちに提示された課題は、4 つの連続する時間ステップを基に、次の 200 の連続する時間ステップを予測することです。そのために、以下に説明するように元の 21 回のシーケンスを前処理しました。

シーケンスがデータおよび振り子の実行時間に均一的に分散されるような形で、データの 5% を「検証/テスト・セット」として抽出しました。トレーニング・セットと検証/テスト・セットとの相関関係が強くならないよう、抽出した各シーケンスの前後 200 の時間ステップを破棄しました。これにより、123 個の重複しないシーケンスが残りました。その内訳は、長さの異なる (637 ~ 16850 の時間ステップ数) 39 個のトレーニング・シーケンスと、それぞれ 204 の時間ステップ数からなる 84 個の検証/テスト・シーケンスです。後者の最初の 4 ステップが入力 (i) を表し、次の 200 ステップがターゲット (t) に相当します。最後に、すべてのファイルの順序をランダム化しました。

元の画像を補完する表現として、マーカー位置とアーム角度の 2 つを追加しています。マーカー位置は、3 つすべてのマーカーの画像座標を表す 3 つの (x,y) ペアです (各値は 5 で乗算されています)。アーム角度は、2 つの角度 α と β の正弦と余弦です。α は、右向きの水平画像の線と最初のアームとの角度を表します。β は、最初のアームと 2 番目のアームとの角度です。

指摘すべき点として、入力とターゲット/予測に別の表現を組み合わせて使用することも考えられますが、何を使用するかによって課題の難易度が左右されます。具体的には、入力とターゲットの両方に未処理の画像を使用すると最も複雑なタスクになります。その一方で、入力とターゲットとしてアーム角度を使用すると、従来型の複数入力、複数出力の時系列予測のタスクになり複雑さが軽減します。

データ・ファイルには以下のものが含まれています。

A. 元の動画 (ノーカット)

  • 位置の情報が含まれる CSV ファイル
  • H.264 で圧縮された動画

B. 元の動画から生成された、トレーニング・セットおよびテスト・セットを含むデータセット (4 フレームの入力、200 フレームの予測)

  • 位置の情報が含まれる CSV ファイル
  • H.264 で圧縮された動画。CSV フォーマットのアノテーション・ファイルの 6 列は、(x_red, y_red)、(x_green, y_green)、および (x_blue, y_blue) に相当します。

詳しくは、学術誌を参照してください。

データセットのメタデータ

形式 ライセンス ドメイン レコード数 サイズ 公開日
CSV
H.264
CDLA-Sharing 時系列 21 動画
378099 アノテーション付きフレーム
567 MB 2018-12-15

抜粋

@InProceedings{asseman2018learning,
title={Learning beyond simulated physics},
author={Asseman, Alexis and Kornuta, Tomasz and Ozcan, Ahmet},
year={2018}
maintitle={Neural Information Processing Systems},
booktitle={Modeling and Decision-making in the Spatiotemporal Domain Workshop},
url={https://openreview.net/forum?id=HylajWsRF7},
}