データセット
アノテーション付けした画像セットを一般物体認識で使用できるような形式にしてデータセットを作成します。アノテーション済み画像セットにサンプルデータセットを使用する場合は学習のチュートリアルへ進んでください。 概要
学習用データセットには次に示すファイルが必要です。サンプルツールとして提供されている データセット作成 ImageTagging.jar を使用してアノテーションした場合は自動的に作成されています。検証用と評価用も同じように専用のデータセットを作成します。
ファイル種別 | ファイル名 | 詳細 | 備考 |
---|---|---|---|
画像ファイル | 任意のファイル名 | 分類したい画像ファイル | アノテーションに使用した画像ファイルを使用します |
csvファイル | classnames.csv | クラス名を記載 | クラス名の定義 |
csvファイル | annotation.csv | 画像とクラスの関連付けを記載 | ファイル名とクラスIDの定義 |
-
ファイル構成
zipファイル
├ dataset
│ ├ images
│ │ └ 画像ファイル
│ └ annotation.csv
└ config
└ classnames.csv
必要なファイルが集まったらデータセットを作成します。データセットは集めたファイルを所定のフォーマットに合わせてzipアーカイブして作成します。zipアーカイブ名は任意です。学習、検証、評価用に3つのアーカイブを作成します。 zipアーカイブ
-
zipアーカイブフォーマット
アーカイブには config と dataset フォルダが含まれます。アーカイブのルートにこの2つのフォルダ以外を含めてはいけません。
-
configフォルダ
configフォルダには学習に使用するクラス定義を示すファイルが含まれます。このフォルダには classnames.csv のファイルを格納します。
-
datasetフォルダ
datasetフォルダには学習に使用する画像ファイルが格納された images フォルダと annotation.csv が含まれます。 images フォルダにはアノテーションに使用した画像を全て含めます。
分類に使用するクラス名を示すcsvファイルです。サンプルツールとして提供されているImageTagging.jarを使用して作成します。 classnames.csv
1行ごとに1つのクラス名を列挙します。
- フォーマットサンプル
dog
cat
パスを含む画像ファイル名と分類したクラスIDの関連付けを示すcsvファイルです。サンプルツールとして提供されているImageTagging.jarを使用して作成します。クラスIDは annotation.csv classnames.csv の0から始まる行番号で表します。上記の classnames.csv の場合はdogが0、catが1となります。
-
フォーマットサンプル
images/dog01.jpg,0
images/dog02.jpg,0
images/cat01.jpg,1
images/cat02.jpg,1
学習に使用するデータセットをインポートします。データセットは学習用、検証用、評価用に使用するものを全てアーカイブごとにインポートします。次の手順ではインポートしたデータセットを使用して学習を行います。 データセットインポート
- ドコモ画像認識プラットフォームにログインします。
- 左ペインの データセットインポート をクリックします。
- インポートするデータセットの名称を入力します。
名称は入力が必須です。インポート後は名称の変更ができません。 - メタ情報を入力します。
メタ情報に学習や評価に使用するデータセットといった概要を記載しておくと管理がしやすくなります。 - データセットをアップロードします。
作成したデータセットのzipアーカイブを選択します。 - 入力内容に問題なければ インポート ボタンをクリックしてデータセットをインポートします。
インポートしたデータセットは データセット管理 から確認できます。
インポートしたデータセットはデータセット管理から確認できます。インポートしたデータセットは削除だけが可能でダウンロードしたりインポート内容を確認することはできません。 インポートしたデータセット
- 左ペインの データセット管理 をクリックします。
- 検索情報に必要な情報を入力して 検索 をクリックします。
検索情報を入力しないで 検索 ボタンをクリックするとインポートされている全てのデータセットを列挙できます。 - 検索されたデータセットがリストに表示されます。
必要のないデータセットは 削除 ボタンをクリックすると削除できます。
削除されたデータセットは復活させることができません。