はじめに
こんにちは伊藤です。
だいぶ久しぶりの投稿となってしまいました。。
さて、前回の記事ではObject Detectionの代表的な手法として3つ紹介しました。
今日はその中の一つである、Faster R-CNNを実際に動かしてみたいと思います。
Faster R-CNNとは
物体の候補検出もCNNで行うことにより高速化された手法です。
もともとはFast R-CNNという手法が先に発表されましたが、
すぐ後に更に高速となったFaster R-CNNが発表されました。
より詳しい内容は論文を参照してください
https://arxiv.org/abs/1506.01497
やり方
オリジナルはCaffe の方ですが
https://github.com/rbgirshick/py-faster-rcnn/tree/96dc9f1dea3087474d6da5a98879072901ee9bf9
Caffe はあまり使いたくないので、今回はKerasのバージョンを使います。
https://github.com/jinfagang/keras_frcnn
環境:Ubuntu16.04LTS、Python3.7.3、 Keras2.13
GPU: GTX-1080Ti
まずはじめにクローンし、フォルダに移動します。
1 |
git clone https://github.com/jinfagang/keras_frcnn.git |
以下の、モジュールが必要なので事前にインストールしておいてください。
・tensorflow
・keras
・scipy
・cv2
この、Repoでは自動車マシンビジョンのためのデータセット「KITTI Vision Benchmark Suite」を事前に学習していますが、
VOC、COCOや自分のデータセットを以下のフォーマットで用意することでトレーニングが行えます。
1 |
/path/training/image_2/000001.png,599.41,156.40,629.75,189.25,Truck |
トレーニングが終了したら、以下の予測してみましょう。
1 |
python test_frcnn_kitti.py |
以上、簡単にFaster R-CNNを実行することができました。
0件のコメント