スポーツ動画分類子

概要

このモデルは、Sports-1M データセットに含まれる 487 種類のクラスのスポーツ活動を認識します。これは、Sports-1M データセットでトレーニングされた深層 3-D 畳み込みネットワークで構成されたモデルです。モデルに動画を入力すると、推定したクラス確率のリストが出力されます。このモデルのベースとなっているのは、C3D TensorFlow モデルです。

モデルのメタデータ

ドメイン アプリケーション 業種 フレームワーク トレーニング・データ 入力データの形式
視覚 動画分類子 一般 TensorFlow Sports-1M 動画 (MPEG-4)

参考資料

ライセンス

コンポーネント ライセンス リンク
モデルの GitHub リポジトリー Apache 2.0 LICENSE
モデルの重み MIT C3D-TensorFlow
モデルのコード (サード・パーティー) MIT C3D-TensorFlow
テスト・アセット 各種 アセットの README

このモデルのデプロイ方法

  • Docker Hub からデプロイする場合:
docker run -it -p 5000:5000 codait/max-sports-video-classifier
  • Kubernetes 上にデプロイする場合:
kubectl apply -f https://raw.githubusercontent.com/IBM/MAX-Sports-Video-Classifier/master/max-sports-video-classifier.yaml

使用例

モデルをデプロイしたら、コマンド・ラインからモデルをテストできます。以下に例を示します。

curl -F "video=@assets/basketball.mp4" -XPOST http://localhost:5000/model/predict
{
  "status": "ok",
  "predictions": [
    {
      "label_id": "367",
      "label": "basketball",
      "probability": 0.39916181564331
    },
    {
      "label_id": "370",
      "label": "streetball",
      "probability": 0.16513635218143
    },
    {
      "label_id": "369",
      "label": "3x3 (basketball)",
      "probability": 0.11865037679672
    }
  ]
}