アノテーション
収集した画像は物体検出に使用できるように被写体に意味付け(タグ付け)を行います。物体検出は画像中のどこに何があるかを判定するので、画像の中から検出したい物体それぞれを矩形で囲みクラスを割り当てます。 概要
学習データにサンプルデータを使用する場合は学習のチュートリアルへ進んでください。
画像はのちの学習で、学習用、検証用、評価用の3つに分けて使用します。そのため収集した画像をアノテーションする前に3つのフォルダに分割しておきます。分割の比率ははじめにを参照してください。 画像の分割
タグ付けは集めた画像全てに行います。物体検出では物体をどのように検出したいか、によってタグの付け方が変わります。例えば犬を検出したい時に犬の顔がわかれば良いのか、手足を含めた全体を検出したいのか、などです。目的に沿ったタグ付けルールを決めてから行う必要があります。 アノテーションツール
ドコモ画像認識プラットフォームでは物体検出専用のアノテーションツールのサンプルツールとして ImageCutter.jar を提供しています。ここではこのツールを使用したアノテーション方法を説明します。
ツールのダウンロード
- ドコモ画像認識プラットフォームにログインします。
- 左ペインの アノテーションツールダウンロード をクリックします。
- アノテーションツールダウンロードリストの中の アノテーションツール イメージカッター(物体検出) とある行の最右列にある ダウンロード ボタンをクリックします。
- ダウンロードしたzipアーカイブを解凍するとサンプルツールのImageCutter.jarとサンプルの画像が確認できます。
分割したフォルダのそれぞれに検出したい物体の名前を列挙した namelist.tsv と言うファイルも同梱している必要があります。 エディタなどで作成してください。 使い方
-
namelist.tsv
namelist.tsvはアノテーションツールでタグを作る際に 何が写っているか を決めるためのタグ名リストです。フォーマットはタグ名と選択した矩形の色をタブ文字で区切った形式です。タグ名には日本語が使用でき、サンプルツールのタグ選択メニューに表示されます。
dog ff0000
cat 00ff00のようなファイルではdogとcatがタグ名を表し、ff0000と00ff00が矩形の色を表します。矩形の色はRGB色を3Byteで指定します。タグ名と矩形色の間の区切りはタブ文字です。
-
操作方法
次の手順で集めた画像に対してタグ付けを行います。全ての集めた画像にタグ付けが完了すると画像データのフォルダの中に result_image と result_xml のフォルダが作成されています。このフォルダを使用して次の手順でドコモ画像認識プラットフォームにインポート可能なデータセットを作成します。
- サンプルツールのImageCutter.jarを起動します。
- 真っ白なスペースに収集した画像とnamelist.tsvを同梱したフォルダをドラッグ&ドロップします。
ツールに読み込んだ画像が表示されます。 - 画像の中からタグ付けしたい被写体を囲むようにマウスポインタをドラッグして矩形を作成します。
- 矩形が作成されるとツール下部のタグリストに作成した矩形の左上と右下の座標が表示されます。
Nameカラムにnamelist.tsvのタグ名が表示されているのでプルダウンメニューから矩形に設定したいタグ名を選択します。
画像の中に選択したい被写体が複数ある時は全ての被写体に対してiii,ivを繰り返し行いすべてタグ付けします。
矩形を間違えた時はタグリストからその矩形を選択して Delete キーを押下すると削除できます。 - タグ付けが終わったらキーボードの Space キーを押下します。
次の画像が表示されるのでもう一度iii,iv,vを繰り返して全ての集めた画像にタグ付けしていきます。