18.232.56.9

IT業界におけるアノテーションの意味をどこよりも分かりやすく解説

「IT業界でよく聞くアノテーションって何のことだろう」
「AIのことを調べていたらアノテーションって言葉が出てきたんだけど、どういう意味だろう」

このように考えている方は多いのではないでしょうか。IT業界におけるアノテーションとは、画像や動画、音声やテキスト等について関連する情報を注釈として与えることです。

より詳しく言うと、AI・機械学習の構築に必要なデータ(教師データ)を作るためのタグづけをする作業をアノテーションというのです。

アノテーションとは

例えば猫の画像を「猫」と機械に認識させるためには、猫の画像に「これは猫だ」とタグ付けをした教師データをたくさん機械に学習させることで、猫を認識できるようになります。

「これは猫だ」というタグをつけたデータ

アノテーションを正確に行うためには、多くのデータが必要となります。偏りがなく、質の高いデータを大量に活用することで信頼性の高い教師データを作ることが可能となるのです。

もしもデータの数が少なかったり偏っているデータを活用してしまうと、正確な教師データを作る事は難しくなってしまいます。

そこでこの記事では、アノテーションの意味や種類、注意点など以下の内容を詳しく解説していきます。

この記事を読めばわかること

・IT業界におけるアノテーションの意味とは
・IT業界におけるアノテーションは何をするものなのか
・アノテーションの種類とは
・アノテーションのためにはデータ集めが重要
・アノテーションのためのデータの集め方
・アノテーションの注意点

この記事をお読みいただくことで、アノテーションに必要な基本的な情報を網羅できると思います。

ぜひお読みいただき、アノテーションや教師データの活用にいかせていただければ幸いです。

1.IT業界におけるアノテーションの意味とは

「アノテーション」とはそのまま直訳すると注釈と言う意味になります。IT業界においては画像や動画、音声やテキスト等のデータに関連する情報をタグ付けすることで、AI技術に必要な「教師データ」を作るといったものです。

アノテーションとは

実は、AI・機械学習の「教師あり学習(正解を含むデータを学習させる手法)」において、機械は「勝手に賢くなる」というわけではありません。AIを組み上げていく過程として、人間と同じように機械にデータを学習させる過程が必要となるのです。

人がひとつひとつ作成した膨大な数の教師データを機械に学習させることで、正確なAIを構築することが可能なのです。

アノテーションとは、AIに学ばせるための教師データを作る工程のことを指します。具体的にどのようにデータを作るのかは、次章でより詳しく掘り下げていきます。

2.IT業界におけるアノテーションを行う具体例

この章ではより具体的に、アノテーションをどのように行うかの具体例を見ていきましょう。ここでは画像データのアノテーションを例に出したいと思います。

以下の画像をご覧ください。映っている生き物は何でしょうか?

猫の画像

人間ならこれが猫だということがすぐに分かりますが、機械にはそれが分かりません。そこでこの画像については「猫」であるというデータをタグ付けします。

「猫」であるというデータをタグ付けされた画像

その他にも、画像内で分かる範囲のデータをタグ付けします。この過程を「アノテーション」と言います。

・色
・模様
・形 など

こうしたタグ付きのデータを膨大に機械に読み込ませることで、機械は次第に「猫」を認識できるようになります

機械は次第に「猫」を認識できるようになる

また、機械に「猫」を認識させるためには猫の画像だけを学習させればいいというわけではありません。機械が猫を認識するということは、同時に例えば「犬」との違いも認識する必要があります。

機械は同時に例えば「犬」との違いも認識する必要がある

機械に猫だけの画像を学習させてしまうと、犬の画像を見せたときに犬を猫と認識してしまいます。犬のデータも学習させることで、機械は猫と犬の特徴の違いを学習します。

このように、機械に学習させるためには広範囲において膨大なデータを学習させる必要があります。アノテーションは機械にこのような学習をさせるための「タグ付けを行う作業」のことを指すのです。

3.アノテーションの種類とは

ここで、アノテーションで活用されるデータの種類についても見ていきましょう。アノテーションで活用できるデータの種類として、ここでは以下の3種類について解説します。

アノテーションの3つの種類

3-1.画像や動画

まずは、第2章でも示した「画像」や「動画」などの視覚的なデータです。画像や動画のデータを認識することで、Web上の画像や動画のカテゴリーや意味を自動的に割り出すことが可能となります。

画像や動画においては以下の3つのステップで行うことによりアノテーションが可能です。

1.物体検出(Object Detection)
2.領域抽出(Image Semantic Segmentation)
3.画像分類 (Image Classification)

Step1.物体検出

まずは物体検出を行います。

物体検出とは、画像のなかにどんなオブジェクトが映っているのかを見つけて、それぞれのオブジェクトに意味をタグ付けする作業です。

物体検出の作業

Step2.領域抽出

次に領域抽出を行います。

領域抽出とは、画像の中の領域についてタグ付けを行う手法です。

領域抽出の作業

Step3.画像分類

最後に、画像分類を行います。

画像分類では、被写体に対して「猫か犬か」「色」「模様」などより具体的な属性をタグ付けします。

画像分類の作業

3-2.音声

音声データのアノテーションでは、音声の意味、音の種類、音量等について一つ一つタグをつけていきます。

例えば以下は、トランスコスモスのアノテーションサービスによる音声データのアノテーションです。コンタクトセンター(電話やメールに加え、SNS、チャットなど幅広いコミュニケーションチャネルを利用して、顧客と企業を結ぶ部署を指す。以前は電話コミュニケーションのみだったので、コールセンターと呼ばれており、現在でもコールセンターで表現されている所も多い。)で抽出した音声データをもとに、AI学習によって書き起こしデータの作成などを行っています。

音声データのアノテーション

音声データについてアノテーションを行うことで、文字データを作成したり音声認識に生かすことが可能となります。

3-3.テキスト

テキストのアノテーションについては、文書に前もって定義されたカテゴリー等をタグづけすることで、以降のテキストデータのジャンル分けなどを行うことが可能となります。

この技術により、ビジネスで使われている書類や顧客データなどを自動的にカテゴライズできます。例えば、一般的によく利用されているGmailの迷惑メールの分類機能にもこうした技術が使われています。

4.アノテーションを強化することでAIの精度が上がる

アノテーションを強化すればするほどAIの精度が上がります。AIを構築するためには、元となるデータを集めてアノテーションを行い、なるべく多くの教師データを作成することが必要不可欠です。

そのためには質の高いデータを大量に集める必要があります。質の高いデータが多いほど教師データを多く作ることができ、機械学習の精度が上がるのです。

例えば画像データにおいて機械に「猫」と学習させたい場合を考えてみましょう。「猫」の教師データを1000件学習させた場合と1万件読み込ませた場合では、当然1万件学習させた場合の方が信頼性が高くなります。

このように、AIを構築する際のアノテーションには何よりも膨大なデータが必要となります。そして全てのデータに的確なアノテーションを行うことで、AIの精度は上がるのです。

5.アノテーションを行うためのデータの集め方

この章では、アノテーションを行うための核となるデータの集め方について詳しく解説していきます。具体的には、以下の3つの方法でデータを集めることが一般的です。

それぞれについて解説していきます。

5-1.自社データを利用する

まずは自社データを利用する方法です。社内で蓄積されたデータで活用できるものをできるだけ活用します。

・顧客データ(行動データ、属性、購買データなど)
・売上データ
・コンタクトセンターでの問合せデータ
・支払いのデータ
・文書のデータ など

こうしたデータに十分なボリュームがあれば、機械に学習させて活用が可能となります。活用方法としては、例えば顧客の属性を分類したり優良顧客の割り出しや行動の予測も可能です。

ただし自社データを活用する場合には、信頼に足る分量のデータが集まっているかどうかはしっかりと確認しておきましょう。自社で集められたデータの分量が少ない場合には信頼性の高い結果を得ることはできないためです。

アノテーションに必要なデータの具体的な数などについては、「6-1.十分な量のデータを集める」で詳しく解説していますので参考にしてみてください。

5-2.公開データを利用する

オンラインで公開されているデータを活用する方法も一般的です。オンラインで公開されているデータとは例えば以下のようなものです。

・Web上で公開されている画像やテキスト
・動画コンテンツ
・URL
・研究機関から公開されているデータセット

こうしたデータを活用することで、信頼性の高い機械学習を行うことが可能です。

Web上の公開データ活用に関しては、「スクレイピング」というプログラムを利用することで効率的に集めることが可能です。データ集めは手作業で行うのではなく、スクレイピングサービスの利用がおすすめです。

5-3.アンケートなどで収集する

データが少ない場合には、アンケートなどで収集することもおすすめです。利用者の情報など必要なデータはアンケートを活用することで補うことが可能です。

アンケートを行うことで必要なデータの量が集まる場合には検討してみましょう。

しかし、アンケートをせっかく行っても大量に回答が集まらない場合には行う必要はないかもしれません。数百単位の大量な回答を得られる可能性がある場合にのみ、アンケートを実施する効果があるといえるでしょう。

6.アノテーションを行う場合の注意点

それではここからは、アノテーションを行う場合の注意点についてより詳しく解説していきます。具体的には、以下の3つの点について注意して行いましょう。

アノテーションを行う場合の注意点

6-1.最低でも1,000件以上のデータを集める

まずは、十分な量のデータを集めることが重要です。「5-1.自社データを利用する」でも解説した通り、データが少ない場合には十分な機械学習を行うことができず、信頼性の高いAIを構築することは難しいためです。

必要なデータ数に関しては分野によって異なるため一概には言えません。しかし目安として1つのクラスにつき5,000〜1万件以上のデータ活用は必要で、少なくとも1000件以上は欲しいというのが一般的な見方です。

利用するデータの数は多ければ多いほどよく、GAFA等世界的な大企業では数十億以上ものデータが活用されています。

自社でデータを集めることが困難な場合には専門のサービスを利用することも可能です。アノテーションサービスについては「7.アノテーションならトランスコスモスへお問合せください」でも解説していますので参考にしてみてください。

6-2.アノテーションのデータに偏りが出ないようにする

アノテーションで活用するデータに偏りが出ないように気を付けましょう。

2.IT業界におけるアノテーションを行う具体例」でも解説した通り、例えば機械に「猫」を認識させるためには猫の画像だけを用意すればいいわけではありません。猫だけでなく犬の画像も十分に学習させて、初めて信頼性の高い認識が導き出せるのです。

別の例では、農家で人参の判別をAIが行うとします。

販売できる質の人参とそうでない人参をAIで自動的に判別するシステムを構築する場合、販売できる質の人参(色、大きさ、形など)のデータが5,000件あったのに対して販売できない質の人参のデータが500件であれば、AIは正確にその違いを判別できません。

AIが判別できない人参のデータの例

このように、機械学習を正確に行うためにはデータの数だけでなく幅広さも重要となるのです。

6-3.質の高いデータを活用する

アノテーションについてもう一つ重要な点としては、質の高いデータを活用することです。データの量が適切で偏りがなかったとしても、データの質が悪かった場合にはその精度が低下してしまいます。

例えば、コンタクトセンターの音声データをアノテーションに活用する場合。

その数が一万件と十分で偏りがなくても、そのうち半数の2,500件に雑音などがあり音質の低いデータだった場合には正確に教師データとしてアノテーションを行うことができません。画像やテキストなどについても同じことが言えます。

AIが判別できない音声データの例

アノテーションを行う場合には、質の高いデータを活用することが重要です。

7.アノテーションならトランスコスモスへお問合せください

ここまででも解説してきた通り、信頼性の高い機械学習を行う場合には「質・量」共に十分なデータを活用する必要があります。その一方で、機械学習に必要なアノテーションを行ったり、リソースの確保やそもそもデータの用意を自社だけで行うのは簡単ではありません。

トランスコスモスでは、お客様企業向けにアノテーションサービスを提供することにより、AI・機械学習プロジェクトを推進しています。

トランスコスモスが提供するアノテーション企画・設計・実施

トランスコスモスのアノテーションセンターでは、沖縄エリアで実績があり、これまでAI・機械学習のプロジェクトで蓄積した経験をもとに最適な教師データを作成するためのアノテーション企画・設計・実施までトータルで安価な金額でうことができます

7-1.アノテーションセンター 実績

7-1-1:音声アノテーション

まず音声アノテーションの実績は、AIスピーカー音声認識機能の教師データ作成についてご紹介します。

コミュニケーション言語に重きを置いた内容となり、時事ネタや流行の言葉など、常に最新情報の更新が必要となる業務です。

業務概要

AIが発話を正しく認識しているかを評価

業務内容

・発話音声とテキストを比較し、発話内容を正しく認識しテキストに書き出せているかを評価。
・正しく認識していない場合は、正しい内容を書き起こし

 ※発話者が発音している通り の内容で評価。
・その他、各発話に対する属性付け。

7-1-2:画像アノテーション

続いて画像アノテーションの実績について。顧客の性別・年齢のための教師データ作成を紹介します。

来年・来場者分析によるマーケティング施策立案において、顧客の性別・年齢を判定するための教師データを作成しました。トライアルの実施やWチェックを行うことにより、品質を担保しています。

業務概要

顧客の性別・年齢判定のための教師データ作成

業務内容

・画面に映っている人の顔の性別・年齢(1歳きざみ)を入力し、送信。

・アノテーション不可能な画像についてはスキップ

AI・機械学習を行いたいけどノウハウがない、リソースやデータが足りない…とお悩みでしたら、ぜひ一度トランスコスモスにお問合せください。

まとめ

以上、この記事ではAI・機械学習に必要なアノテーションに関して、以下の内容を詳しく解説してきました。

この記事を読めばわかること

・IT業界におけるアノテーションの意味とは
・IT業界におけるアノテーションは何をするものなのか
・アノテーションの種類とは
・アノテーションのためにはデータ集めが重要
・アノテーションのためのデータの集め方
・アノテーションの注意点

この記事をお読みいただいたことで、アノテーションの概要や必要な情報を網羅できたのではないでしょうか。ぜひこの記事を参考に、アノテーションの活用を検討していただければ幸いです。

トランスコスモスのコンタクトセンター/コールセンターサービスでお取引いただいたお客様は、業界問わず1,700社を超え、様々なノウハウを保有しています。コンタクトセンター/コールセンターの運営に関して、お悩みの方は一度お問合せください。
トランスコスモスのコンタクトセンター/コールセンターサービスでお取引いただいたお客様は、業界問わず1,700社を超え、様々なノウハウを保有しています。コンタクトセンター/コールセンターの運営に関して、お悩みの方は一度お問合せください。