データセット
アノテーション付けした画像セットを物体検出で使用できるような形式にしてデータセットを作成します。アノテーション済み画像セットにサンプルデータセットを使用する場合は学習のチュートリアルへ進んでください。 概要
学習用データセットには次に示すファイルが必要です。ImageCutter.jarを使用してアノテーションした場合は自動的に作成されています。検証用と評価用も同じように専用のデータセットを作成します。 データセット作成
ファイル種別 | ファイル名 | 詳細 | 備考 |
---|---|---|---|
画像ファイル | 任意のファイル名 | 画像中に検出したい物体を含む画像ファイル | アノテーションに使用した画像ファイルを使用します |
xmlファイル | 画像ファイル名.xml | 画像中の物体の位置とタグ名を表す | ImageCutter.jarを使用している場合は result_xml フォルダの中に作成されています |
csvファイル | correspondence_table.csv | xmlのnameと対応するクラスIDの定義 | ImageCutter.jarを使用している場合は config フォルダの中に作成されています |
namesファイル | classes.names | デプロイしたAPIが返却するクラス名 | ImageCutter.jarを使用している場合は config フォルダの中に作成されています |
必要なファイルが集まったらデータセットを作成します。データセットは集めたファイルを所定のフォーマットに合わせてzipアーカイブして作成します。zipアーカイブ名は任意です。学習、検証、評価用に3つのアーカイブを作成します。 zipアーカイブ
-
zipアーカイブフォーマット
アーカイブには config と dataset フォルダが含まれます。アーカイブのルートにこの2つのフォルダ以外を含めてはいけません。
-
configフォルダ
cofigフォルダには学習に使用するクラス定義を示すファイルが含まれます。このフォルダには correspondence_table.csv と classes.names のファイルを格納します。
-
datasetフォルダ
datasetフォルダには直下にimagesフォルダを配置します。そのimagesフォルダの中には学習に使用する画像ファイルと result_xml フォルダが含まれます。学習画像はアノテーションに使用した画像を全て含めます。 result_xml フォルダにはアノテーション情報を含めます。ImageCutter.jarを使用している場合は result_xml フォルダをそのままdatasetフォルダにコピーします。
PascalVOC形式のxmlファイルです。作成のためのサンプルツールとしてImageCutter.jarを提供しています。fileNameの名称はzipアーカイブに含まれている画像ファイル名である必要があります。object.nameの名称はcorrespondence_table.csvに記載されている名前です。 xmlファイル
-
フォーマットサンプル
<?xml version="1.0" encoding="UTF-8" standalone="no"?>
<annotation>
<fileName>cat_1.jpg</fileName>
<size>
<width>600</width>
<height>400</height>
</size>
<object>
<name>cat</name>
<difficult>0</difficult>
<bndbox>
<xmin>96</xmin>
<ymin>67</ymin>
<xmax>466</xmax>
<ymax>347</ymax>
</bndbox>
</object>
</annotation>
xmlファイルのobject.nameの名称とデプロイしたAPIが返却するクラス名を関連付けます。作成のためのサンプルツールとしてImageCutter.jarを提供しています。 correspondence_table.csv
左列にはobject.nameの名称を列挙します。右列にclasses.namesの0から始まる行番号を記載し関連付けます。
-
フォーマットサンプル
dog,0
cat,1
デプロイしたAPIが返却するクラス名のリストです。作成のためのサンプルツールとしてImageCutter.jarを提供しています。 classes.names
最上段から1行ずつ名称を列挙します。最上段を0行目とした行番号がcorrespondence_table.csvの関連付ける行番号として使用されます。
-
フォーマットサンプル
dog
cat
学習に使用するデータセットをインポートします。データセットは学習用、検証用、評価用に使用するものを全てアーカイブごとにインポートします。次の手順ではインポートしたデータセットを使用して学習を行います。 データセットインポート
- ドコモ画像認識プラットフォームにログインします。
- 左ペインの データセットインポート をクリックします。
- インポートするデータセットの名称を入力します。
名称は入力が必須です。インポート後は名称の変更ができません。 - メタ情報を入力します。
メタ情報に学習や評価に使用するデータセットといった概要を記載しておくと管理がしやすくなります。 - データセットをアップロードします。
作成したデータセットのzipアーカイブを選択します。 - 入力内容に問題なければ インポート ボタンをクリックしてデータセットをインポートします。
インポートしたデータセットは データセット管理 から確認できます。
インポートしたデータセットはデータセット管理から確認できます。インポートしたデータセットは削除だけが可能でダウンロードしたりインポート内容を確認することはできません。 インポートしたデータセット
- 左ペインの データセット管理 をクリックします。
- 検索情報に必要な情報を入力して 検索 をクリックします。
検索情報を入力しないで検索ボタンをクリックするとインポートされている全てのデータセットを列挙できます。 - 検索されたデータセットがリストに表示されます。
必要のないデータセットは 削除 ボタンをクリックすると削除できます。
削除されたデータセットは復活させることができません。