グローバルウォーカーズ株式会社 山下氏 

 人工知能(以下、AI)を実現する上で、重要となるのがアノテーション。そのアノテーションをサービスとして提供しているベンチャー企業がグローバルウォーカーズ株式会社。
独自の体制と品質の高さから、先日行われたアジア最大級のビジネスマッチングイベント イノベーションリーダーズサミット(Innovation Leaders Summit)でも数ある企業の中からTOP20に選出された注目の企業。なぜ注目されているのか、グローバルウォーカーズ株式会社マネージャーである山下氏が、未来メディアのインタビューに応じてくれました。

*アノテーションとはAIの学習用にデータを加工すること

AIの学習データ作成における課題

AIを実現する上で、学習データの準備がキーポイントになりますが、課題はありますか?

 課題は大きく2つございます。
1つ目は、教師データにするデータ素材の収集や選別です。
どのようなAIを開発したいのかは各社で大いに検討されております。しかし、そのAIを作るために、どのようなデータが必要になるのか、どのようにデータを集めるのかといった問題に対して悩まれている企業様が多く見受けられます。
2つ目は、アノテーションを行うことでの膨大なコストです。
AIでは数万データから数百万データといった、非常に大量なデータに対してアノテーションを行う必要があります。
一つのデータを作成することは、僅かな時間で可能ですが、大量のデータを高品質に作成するとなると、社内でアノテーションを行うとすると、莫大なコストが必要になります。
この2点が大きな課題になっていると考えています。

データが無ければ用意する

大量の学習データを、用意することは可能でしょうか?
データを用意する上で、どうしても準備できないデータもあるのではないでしょうか?

 データが足りないという企業様については、条件にあったデータを収集することを行っております。
画像認識が必要なAIに対しては、3D CG(Computer Graphics)や撮影を通して、新たなデータを作ることを行っております。
これまで自動運転用のデータが必要なお客様に対して、1万キロ程度車を走らせることで、新たに車載カメラ映像データを作り出した経験もございます。

CGでのデータ作成や、長距離を運転しながらのデータ取得作業は苦労もあると感じます。
企業様にとっては、学習に必要なデータを取得していただくので、大変ありがたいことだと思います。

画像分野の学習データ作成が強み

先ほど画像分野は得意と伺いました。画像のほかにも対応は可能でしょうか?

 我々のサービスでは、現在、様々なAIに対するデータを供給しており、画像から始まり、音声や自然言語といったデータ作成にも対応をしております。特に画像領域においては、幅広いデータ作成手法を経験しており、画像分類(Classification)、概説矩形(バウンディングボックス)付与(Detection)、自動運転で使うような、特定の領域や条件に対して色分けする作業(Semantic Segmentation / Instance Segmentation) にも対応しています。
人や動物の姿勢推定や、顔認証で必要となるキーポイントと言われるドット付与作業にも対応しています。
また、これだけでなく、ご希望のデータ作成作業に対しても柔軟に対応をさせていただいております。

高品質で低価格

品質の高さが評価されていますが、企業様に向けて何かメッセージはありますか?

 弊社はこれまで、研究機関、大学、メーカー、IT企業などAIに関わる様々な企業様とお取引をさせていただいております。
品質の高さから、色々な企業様をご紹介いただく形でお取引を開始し、これまでご好評をいただいております。一見すると、データ作成はあまり難しい作業ではなく、差が出ないと考えられている方も多くいらっしゃいます。その中で、弊社が選ばれているのには独自の体制を所有していることにあると考えております。

 弊社では、データ作成専用チームを所有しております。
他の多くの企業では、クラウドソーシングを中心に活用しております。データ作成は難しくはない作業と考えられがちですが、高品質なデータを作るためには、様々なコツやルールがあり、クラウドソーシングでは一人一人のデータの質にバラつきが生じます。また、各個人が別々の場所で作業をしていることから、セキュリティ面でも懸念点が多いと考えております。弊社では、トレーニングを積んだデータ作成のプロフェッショナルが対応を行うことで、高品質かつ短時間での作業を実現しております。また、頂くデータは全て暗号化を行い、シンクライアント形式のツールを使って作業を行います。こういった様々な工夫により高セキュリティかつ高い品質のデータ提供を実現しております。

 これまで、データの作成をアウトソーシングし、失敗された経験のある企業様が多くいると聞いております。
是非とも、こういった企業様に、まずはトライアルから弊社サービスをお試し頂き、品質の高さを確かめて頂ければと考えております。

このような取り組みにより、高品質なデータの提供に関係していることが分りました。
そのほかに、高品質なデータ提供の上で、注意されていることはありますか?

 アノテーションの作業の種類は種々あり、また大量のデータを作成しなくてはいけません。そのため、チェックにおいても抜け漏れが発生しないように、データを自動的に点検するツールの開発を進めております。

高品質なデータを提供をいただくには、費用も掛かるのではないでしょうか?

 弊社は業界屈指の低価格でサービスを提供しております。弊社では、国内国外に体制を所有しており、特に国外においては、賃金が低いとされる国において作業を行っております。また、データ作成に機械学習や動画像処理といった複数のノウハウを活用することで、通常よりも短いスピードで作業ができるよう工夫を行っております。この点は、元々弊社がAI開発を行っていることでの強みと考えております。

今後の取り組み

 これまでも様々な企業様のデータ作成をさせて頂きましたが、まだまだ対応できていないデータは数多くあります。今年はまず、ライダーセンサー(LIDAR)に代表される点群データに対するアノテーションに新しく取り組むことを考えております。
また、体制も強化し、より迅速に大量のデータが開発できる体制を作って参ります。

■特設サイト
プロフェッショナルがすべてのAIプロジェクトを支援する
機械学習/深層学習向けデータセット構築・運用プラットフォーム
リンク : AnnotationOne

■会社情報
会社名 : グローバルウォーカーズ株式会社
住所 : 東京都品川区西五反田8-2-12 アール五反田 5B
公式ホームページ: https://www.globalwalkers.co.jp/