はじめに
ここでは、ドコモ画像認識プラットフォームの各機能を紹介します。 概要
学習の際の流れを紹介します。 学習の流れ
一般物体認識・物体検出
一般物体認識と物体検出は共通で以下の流れで処理を進めます。
- 画像収集
- アノテーション
- データセット作成
- 学習
- 評価
- デプロイ
- 推論
- クリーンアップ
類似画像検索は以下の流れで処理を進めます。 類似画像検索
- 画像収集
- アノテーション
- データセット作成
- デプロイ
- データの追加
- 推論
- クリーンアップ
特定物体認識は以下の流れで処理を進めます。 特定物体認識
- 画像収集
- アノテーション
- データセット作成
- 辞書作成
- デプロイ
- 推論
- クリーンアップ
姿勢推定、文字認識と複数API組み合わせ用コンテナは、汎用モデルを使用して以下の流れで処理を進めます。なお、一般物体認識と物体検出についても汎用モデルを用意しています。そちらを利用すれば、学習等を省略し同じ流れで進めることができます。 姿勢推定・文字認識・複数API組み合わせ用コンテナ
- デプロイ
- 推論
- クリーンアップ
学習の際に行う各ステップについて紹介します。 学習の各ステップ
学習に必要な画像はお客様自身で収集していただく必要があります。このチュートリアルではサンプルデータをダウンロードすることで進めることができます。 画像収集
アノテーション
集めた画像に対して、画像認識プラットフォームを用いて自動で推論・判定させたいタグ(その画像が何か・どこの位置に何があるか)を、人手で付与します。
- 一般物体認識・物体検出
- 学習用に全体の7割から8割振り分けます
- 残りを検証用と評価用に2:1〜1:2の割合で振り分けます
- 類似画像検索
- 特定物体認識
アノテーションのためのサンプルツールは管理画面からダウンロードして使えますが、出力形式が同じであれば他のツールを使っても大丈夫です。
後述する学習のステップでは集めた画像を学習用、検証用、評価用の3つに分ける必要があります。
アノテーションツールを使う場合は、集めた画像を3つのフォルダに分類した後、それぞれのフォルダごとにアノテーションツールをかけると出力がそのまま使えます。
振り分けの画像数は以下を目安としてください。
集めた画像データが少ない場合は、一般的には精度の高い学習モデルを作成できません。可能な限り、以下の枚数を集めて学習・検証を行います。
データ | 枚数の目安 |
---|---|
学習用データ | 100枚以上 |
検証用データ | 50枚以上 |
評価用データ | 50枚以上 |
集めた画像は、類似画像検索の出力として用いられます。画像の枚数の目安としては、各物体につき1枚ずつから使用可能です。
画像の枚数の目安としては、各物体につき1枚ずつから使用可能です。
データセット
アノテーション付けした画像をドコモ画像認識プラットフォームで使用できるような形式にしてデータセットを作成します。
- 一般物体認識・物体検出
- 類似画像検索・特定物体認識
ドコモ画像認識プラットフォームがサンプルとして提供しているアノテーションツールを使用した場合はツールの出力がそのまま使えます。
データセットは学習用データ、検証用データ、評価用データの3種類必要です。
画像とタグを対応させるためのタブ区切りのファイルをお客様側で作成する必要があります。
類似画像検索については、タブ区切りのファイルを使用せず、画像を一枚ずつ追加することも可能です。