AIシステムの高度化を実現する上で、大量の教師データを作成する「アノテーション」という作業が必要です。
そのため、AIアノテーションツールを導入することで、作業を効率化でき、大量のデータに対して精度の高いアノテーションを実現できます。
本記事では、AIアノテーションツールについて解説するので、参考にしてください。
現役のシステムエンジニアとして10年程度のキャリアがあります。 Webシステム開発を中心に、バックエンドからフロントエンドまで幅広く対応してきました。 最近はAIやノーコードツールも触っています。
AIアノテーションツールとは?

AIアノテーションツールとは、これまで人の手で行ってきたアノテーション作業を、効率化させるツールです。
アノテーション(annotation) とは、「注釈」や「付加情報」といった意味を持ち、ビジネスシーンでは、さまざまなデータ(テキスト、音声、画像など)に対して、人手でタグやメタデータを付与していく作業のことを指します。つまり、アノテーションは、教師データを作成するための重要な作業なのです。
また、近年では、ビッグデータの活用が注目されていますが、ビッグデータを有効活用するためには、データにラベル付けを行う必要があります。アノテーションは、ビッグデータの管理を効率化し、データ分析を容易にするための重要な役割を果たします。
AIアノテーションツールは、アノテーション作業を効率化し、高精度な教師データを作成するために不可欠なツールといえるでしょう。
アノテーションツールの主な機能

アノテーションツールは、様々な機能を備えており、効率的なデータの注釈付けを支援します。これらの機能により、データのタグ付けやメタデータの追加、進捗管理などが容易に行えます。
以下では、アノテーションの主な機能を紹介します。
自動アノテーション
アノテーションツールの中には、あらかじめ設定したルールに基づいて自動的にタグ付けを行う機能を持つものがあります。
これにより、人手による作業を大幅に削減できるため、大量のデータを短期間でアノテーションできるようになります。
自動アノテーションは、単純なアノテーション作業を効率化できる機能です。
対象の抽出・ラベル付け
対象の抽出・ラベル付け機能は、アノテーション対象となるデータを見つけ出し、ラベルを付ける機能です。
画像であれば、物体や人物を検出し、それぞれに対するラベルを付けることが可能です。音声であれば、話者を特定し、感情を分析できます。テキストであれば、固有名詞や感情を抽出できます。
対象の抽出・ラベル付け機能は、アノテーション作業の精度向上に貢献します。
進捗管理機能
進捗管理機能は、アノテーション作業の進行状況を管理する機能です。
作業者ごとの進捗状況や作業完了度を可視化し、プロジェクト全体の進行状況を把握できます。また、未完了の作業や課題を特定し、効率的なスケジュール管理を支援します。
アノテーション作業の進捗状況を可視化することで、作業効率の向上に役立つでしょう。
データの出力
データの出力機能は、アノテーション結果を各種形式で出力する機能です。CSV形式やJSON形式など、さまざまな形式で出力できます。
データの出力機能は、アノテーション結果を他のツールで使用したり、分析したりするときに便利です。
データ拡張
データ拡張機能は、アノテーションデータを増やすための機能です。
回転や反転、スケーリングなどの操作によって、データの種類を増やします。学習データの不足を補えるため、モデルの精度向上に役立ちます。
画像へのコメント
画像へのコメント機能は、画像データに対してテキスト形式でコメントを付与する機能です。
作業者が注釈付けを行った際に、その内容や意図を記述できます。アノテーション作業者同士でコメントを共有することで、アノテーション作業の品質向上に役立ちます。
【無料】AIアノテーションツールおすすめ6選!

アノテーションを行うには先ほど紹介したようにツールの導入も検討に入れるべきですが、さまざまなツールがあり選ぶのが難しいかもしれません。
ここではOSSのAIアノテーションツールを6つ紹介します。
各ツールを比較表にしてわかりやすくまとめました。
| 特徴 | Brat | Prodigy | Doccano | CVAT | LabelMe | VoTT |
| 価格 | 無料 | 一部ライセンス購入が必要 | 無料 | 一部有料 | 無料 | 無料 |
| カスタマイズ性 | 低 | 高 | 低 | 高 | 低 | 高 |
| 機械学習モデルとの統合 | 直接的な統合機能は無い | 可能 | 直接的な統合機能はないが、エクスポート可能 | 可能 | 直接的な統合機能は無い | TensorFlowやCustom Visionなどの既存モデルを活用可能 |
| 学習コスト | 適度 | 低い | 低い | 適度 | 低い | 適度 |
| 主な利用対象者 | 研究者、開発者 | 開発者、データサイエンティスト | 研究者、開発者、データサイエンティスト | 研究者、開発者、データサイエンティスト | 研究者、学生 | データサイエンティスト、AI開発者 |
| コラボレーション機能 | 手動セットアップが必要 | データベース経由で可能 | アプリ内完結 | アプリ内完結 | アプリ内完結 | クラウドストレージ上のデータに対してもアノテーション可能 |
Brat

Brat(ブラット)は注釈視覚化ツールであるstav text annotation Visualizerの拡張機能として開発されました。
WindowsやMacでもダウンロードして利用できます。GUI上で操作可能であり、テキストをドラッグしてラベル付けしたい範囲を決めてラベル付けを行うという非常にシンプルなものです。サーバーに置くことも可能であるため複数人で操作できアノテーションの作業効率の向上が可能です。
Prodigy

Prodigy(プロディジー)はドイツで開発されたアノテーションツールでありExplosionというソフトウェア会社によって提供されています。
Webアプリケーションであり手順に沿ってインストールし、セットアップを行います。サーバーにセットすれば複数人で操作が可能です。
アノテーション作業もラベルに対して割り振られている数字キーを入力するというシンプルさであるため、1件に対する作業時間は慣れれば5秒も掛からないようになります。
差分を表示するdiff機能や複数人で同一サンプルをアノテーションした際にラベルが異なるものを可視化するreview機能などがあり設定する際に注意が必要ですが、導入することでアノーテーターが違いを見つけながらラベル付けをする、データの修正をするといった負担を軽減することが可能です。
そうしてできあがった学習モデルは、PythonパッケージとしてエクスポートすることでPythonアプリケーション内で実行することが可能です。
これによって1から学習モデルを作成する必要がなく、ライブラリから導入したものを一部変更するだけで済むため非常に効率の良い環境設定ができるでしょう。
Doccano

Doccano(ドッカーノ)は日本のTISインテックグループにより開発された英語と日本語に対応しているアノテーションツールです。公式ドキュメントに従いインストールし、必要な依存関係を順備しましょう。
GUI上で直感的に操作が可能でラベリングはもちろん要約や翻訳を行えます。また、アプリ内でアノテーションを行う為に必要なステップがYouTubeで解説動画として紹介されているため学習コストが低く使いやすいものとなっています。
また、アノテーションを行うメンバーを複数登録し管理する機能やアノテーションデータのインポートやエクスポート、ラベルの登録といった管理する機能があり、維持管理も行いやすいツールです。
CVAT(Intel)

CVATはインテルが開発したオープンソースのアノテーションツールです。画像、ビデオ、3Dデータに対応し、ポリゴン、ボックス、ポリラインなどの手動アノテーションと、AIアシストによる半自動アノテーションが可能です。
複数のアノテーターによる協調作業をサポートし、アノテーションの一貫性を保てます。データセットの管理、検証、エクスポートなどの機能も備えており、コンピュータービジョンの研究者やデータサイエンティストに適しているツールです。
LabelMe(MIT)

LabelMeはマサチューセッツ工科大学が開発したオープンソースのアノテーションツールです。画像のアノテーションに特化しており、ポリゴンやボックスによるオブジェクト領域の指定とラベル付けが可能です。
LabelMeはウェブベースのツールのため、ブラウザ上で直接アノテーションできます。シンプルな操作性と無料で利用できることから、コンピュータービジョンの研究者や学生に人気があります。
VoTT(Microsoft)

VoTTはマイクロソフトが開発したオープンソースのアノテーションツールです。
画像やビデオに対応し、ボックス、ポリゴン、ポリラインなどの手動アノテーションが可能です。TensorFlowやCustom Visionなどの機械学習モデルを活用した半自動アノテーションにも対応しています。
また、ローカルマシンだけでなく、クラウドストレージ上のデータに対してもアノテーションできます。直感的なUIと機械学習との連携により、データサイエンティストやAI開発者に適しています。
【有料】AIアノテーションツール

以下に紹介するツールは有料ではあるものの、その分強力な助けとなるアノテーションツールやサービスとなります。プロジェクトの規模や余裕を考慮して使い分けると良いでしょう。
今回紹介する有料のAIアノテーションツールは以下のとおりです。
| 特徴 | Labelbox | Appen | ANNOTEQ | FastLabel | ProLabel | harBest Data |
| 価格体系 | サブスクリプション型 | プロジェクトごとにカスタム設定 | プロジェクトごとにカスタム設定 | プロジェクトごとにカスタム設定 | 複数パッケージ価格モデル | プロジェクトごとにカスタム設定 |
| カスタマイズ性 | 高 | 非常に高い | 高 | 中 | 中 | 中 |
| 主な利用対象者 | 研究者、データサイエンティスト、開発者、企業 | 大企業、テクノロジー企業 | 大手企業、研究機関 | 研究者、データサイエンティスト、開発者 | 企業、研究機関 | 企業 |
| コラボレーション機能 | 一部制限あり、外注可能 | プロジェクトごとにカスタム設定、外注可能 | クラウドソーシングプラットフォームと連携し、大規模な分散作業が可能 | チーム作業を効率化するコメント機能やダッシュボードあり | プロジェクト単位での管理が可能 | 全国のクラウドワーカーによるデータ作成が可能 |
Labelbox

Labelbox(ラベルボックス)はアメリカのLabelbox社から開発されたアノテーションツールです。
画像やテキスト、動画や音声波形といったさまざまなデータにラベリングをができ、アクティブラーニング機能によりアノテーションをアノテーターと機械側でサイクル化することでラベリングの負荷を減らし、生産性と高い精度向上を実現できます。進捗状況やメンバーの管理をWebのGUI上で確認や管理が行えることもあり、課題の発見や情報共有を行うこともできます。
Labelboxは、料金体系がサブスクリプション型であり規模によって柔軟にカスタマイズすることが可能です。コミュニティも存在することから、コミュニティを利用して成長することもできるでしょう。
| 料金 | 登録可能なユーザーアカウント | 対象 | |
| 1ヶ月500LBUまで | 無料 | 30まで | 個人利用 |
| 500LBU以上 | 1LBUあたり0.10ドル | 無制限 | 小規模・大規模チーム |
Appen

Appen(アッペン)は1996年創業、オーストラリアのシドニーを拠点に170カ国を超える国と地域にオフィスを構え100万人以上のクラウドワーカーが在籍しているアノテーションを代行するサービス会社です。
サービス会社を利用する理由としては、アノテーション作業はAIに関して無知レベルの方をアルバイトなどで雇用して行うよりも、ある程度機械学習の基礎知識を持った方が必要であり効率が良いためです。
AIアノテーションに特化し長年の実績から膨大な音声データ、235以上の言語への対応が可能です。そして経験豊富なプロジェクトマネージャーによる高品質な品質管理やメカニズムの開発が行われています。こうした人的リソースの圧倒的な豊富さと実績の高さから、相場より安く、高品質かつ短納期という世界トップレベルのコストパフォーマンスを実現しています。
アノテーション作業の委託以外にもラベリングされたデータセットの販売も行っており、利用してコストを抑えることもできます。料金については公式サイト中に説明はありません。
ANNOTEQ(株式会社ユニメディア)

ANNOTEQはディープラーニングモデル構築に必要な学習データセットの作成を支援するアノテーションサービスです。
実働100万人以上のクラウドソーシングプラットフォームと連携しており、大規模な作業を高速で実施できます。また、国内外の提携センターやオフショアセンター、内職者などのリソースを適切に組み合わせてサービスを提供しており、1週間で10万件以上の作業対応が可能です。
画像、テキスト、音声など様々なデータ形式に対応しており、アノテーションだけでなく、データ収集(写真撮影やウェブ取得)も可能です。また、機密性の高いデータの場合はオンプレミスでの作業にも対応しています。
大量のアノテーション作業を短期間で高品質に実施できる点が強みです。
FastLabell(FastLabel株式会社)

FastLabelのアノテーションツールは、画像、動画、音声、3Dデータなど多様なデータ形式に対応しています。YOLO、COCO、PascalVOC、VoTT、labelmeといったさまざまなデータセットにも対応している点も強みです。
FastLabelはデータ品質99.7%という高い品質が強みで、マニュアルや対応語のサポートも充実しています。
また、国内拠点によりデータのセキュリティリスクを低減できるため、機密性の高いデータを扱う企業からも利用されています。
さらに、プロジェクトの進捗やアノテーションされたデータの確認がWeb上から行えるため、レビューや承認プロセスを効率化できる点も強みです。
自動運転、ドローン、医療、建築といったさまざまな業種で利用されており、安心して使用できるという利用者からの声も多いサービスです。
ProLabel

ProLabelは、画像アノテーションツールです。
自動アノテーション機能を搭載し、AIモデルによる自動ラベリング機能を提供しています。また、データ拡張機能により、既存データから新たなデータも生成可能です。
バウンディングボックス、キーポイント、セグメンテーションなど多様なアノテーション方式に対応しているため、アノテーション作業の効率化・品質向上がはかれます。
動画アノテーション、シェイプ自動検出、領域指定自動アノテーションといった機能の提供も予定されており、今後ますます使いやすくなることが期待されているサービスです。
harBest Data

harBest Dataは、AIモデル開発の基礎となるデータ収集・アノテーションを手軽に行えるツールです。
harBest Dataでは、クラウドワーカーによる質の高いデータ作成が可能です。タスクの分解やマニュアル作成を行い、一定のスキルを持つProユーザーがスピーディーに高品質なデータを収集・作成します。
AIの基礎であるデータ収集・アノテーションから、課題設定、プロジェクトの全体設計までをサポートしてくれるので、AIの実装を検討中の企業に最適なツールといえるでしょう。
アノテーションツール選択時の注意点

アノテーションツールを選ぶ際には、いくつかの注意点が存在します。どれも見落としがちで途中からの変更が難しいものですので、前もってしっかりと決めておきましょう。
アノテーションの種類を事前に決める
アノテーションといっても先述の通りいくつかの種類が存在するため、プロジェクトの要件からどのようなデータがアノテーションタイプとして必要になるかを決めましょう。
また、アノテーションツールやアノテーションソフトはこの記事で紹介したものも含めて様々なものが存在します。
特定のタイプのサポートが厚いものもあるため、どのツールを使うのか早い段階から検討するのがおすすめです。
目的や予算・作業規模を明確にする
例えば、「AIで自動的に文章を翻訳可能にしたい」という場合は名詞認識のアノテーションが必要だとわかりますが、「翻訳を正確にかつ自然な文章として出力したい」場合は同じ翻訳でも名詞認識と動詞認識、係り受け認識が必要になります。
これでは必要となる時間やツール、作業規模とともに金銭的コストも大幅に変わってくるため予めプロジェクトの目的と要求をしっかりと特定してアノテーションの種類を設定しましょう。
また、プロジェクトによっては予算制限があることも考慮し、ツールを利用する際のコストパフォーマンスも重要な検討要件になるかと思います。
サブスクリプション型なのか買い切り、プロジェクトによってカスタムするのかはプロジェクトの目的と要求に適したものを導入することが重要です。
使用する社員のスキルレベルを把握する
アノテーション作業を行うにあたってアルバイトなどで適当に集めたりすることは得策ではありません。
AIやアノテーション、特殊なデータを扱うのであればそれに関する知識をもつ人物が行う方が教育コストが掛かりませんし、コミュニケーションも取りやすいでしょう。ただし、そういった人物ばかりを集めることは難しいため先ほど紹介したツールや外注可能な会社を頼ることも検討しましょう。
そのほかにも、複数人で作業するのであれば報告や相談がしやすい環境作りも必要です。チャットツールの導入や定期的なミーティングを開催し、ちょっとしたことでも話しやすくし、かしこまりすぎないような雰囲気作りを心がけましょう。
意外と「この程度のことを聞いていいのか」といった恥ずかしさや不安から相談しにくいこともありますし、「これくらい大丈夫だろう」という勝手な判断から正確なデータ作成ができていない可能性もありますので、コミュニケーションをしっかりとれる環境作りも非常に重要だといえます。
まとめ:アノテーションツールのまとめ

本記事では、AIシステム開発において重要な役割を担う「アノテーションツール」について解説してきました。
近年では、アノテーションを行った学習モデルを作成して利用することで、仮想アシスタント機能や個人に最適にカスタマイズされた筋肉トレーニングジムが開設されるなど、その進化はめざましいものとなっています。今後も潜在的な業界や企業、個人のニーズに応えるAIが求められ開発されていくことでしょう。
Jiteraでは、AIシステム開発の他、最適なアノテーションツールのご提案やサポートも行っております。AI導入の課題解決に向けて、親身にサポートいたします。AI活用に関するご相談やご質問がある場合は、ぜひ株式会社Jiteraへお問い合わせください。


