株式会社三菱総合研究所

インパクト起業家ストーリーSeptember 15, 2022#21 迅速なAI開発をサポートするプラットフォーム『harBest』。大量、短納期、高品質、低コストを叶える仕組みづくり。(株式会社APTO)

株式会社APTO 代表取締役 高品 良 氏

AIの開発には、何万、何十万以上もの大量なデータが必要になります。また、量だけでなく、データの質もAIの精度に影響します。質の高い大量のデータを、迅速に、低コストで集めることのできるAI開発プラットフォーム『harBest』を提供する株式会社APTOの代表取締役 高品良(たかしな りょう)氏にお話を伺いました。

―株式会社APTOについて教えてください。

株式会社APTO 代表取締役
高品 良 氏

2020年にAPTOを創業。『harBest』というAI開発プラットフォームをご提供しています。AIや人工知能の開発におけるデータの収集、作成、アノテーションは、非常に手間と時間がかかります。これらの工程を、高品質かつ低コストで実行できるのが、『harBest』の特徴です。

―起業のきっかけについて教えてください。

大学卒業後、エンジニアとして大手基幹系システムの開発に従事しました。ITコンサルティング会社でもシステムエンジニアとして働いた後、2017年にVRコンテンツの制作会社を設立しました。その会社でSNSでの炎上を自動で検知する自動炎上検知サービスを開発しようとしていたのですが、なかなか精度が上がりませんでした。なぜ精度が上がらないのかを調べると、データが足りない、データの精度が悪い、という原因に行き着いたのです。しかし当時は、質の良いデータを簡単に大量に集められるようなサービスがまだありませんでした。そこでAPTOを創業したというのが、起業のきっかけです。

―『harBest』というサービス名には、どのような由来があるのでしょうか?

収穫するという意味の「harvest」が由来です。企業としてはデータを収穫できるという意味があり、クラウドワーカーにとってはポイントを収穫できるという意味があります。

「harvest」ではなく『harBest』、VをBにしたところには、ベストなデータを収集できる、ベストな形でポイントを得られる、といったニュアンスを込めています。

出所:株式会社APTO

―『harBest』は、どのようなサービスなのでしょうか?

『harBest』は、AI開発におけるデータ作成、アノテーション工程での課題を解決するためのサービスです。

これまでの作業プロセスは煩雑で、何度もやりとりが発生、手間がかっていました。しかし、『harBest』を使えば、それらを一元管理でき、作業期間や費用を半分以下に抑えることが可能になります。

AIはさまざまなプロダクトに導入されるようになりました。AIの開発がどのように行われているか、ご存じでしょうか。

AIの開発には、大きく4つのプロセスがあります。まずは、「データの収集と作成」。その後に「AIの構築」。そして、システムへ「組み込み」、「評価」します。その評価をもとに、再びデータの収集と作成を行う。このような流れになっています。

出所:株式会社APTO

このプロセスの中で最も時間がかかるのは、データの収集と作成の部分です。この工程が約80%を占めるといわれています。AI業界では、このデータ作成のことを「アノテーション」と呼びます。

アノテーションは正解を付与する作業です。たとえば、AIに「犬」を学習させる際、犬の写っている画像のうち、どこからどこまでが犬なのかを指定する必要があります。そして、「犬」をAIに認識させるためには、正確に範囲を指定された画像が何万枚も必要だったりします。

このような大量のデータを集めるのは、そう簡単なことではありません。そこで、『harBest』の出番です。

『harBest』の管理画面で対象のタスクタイプを選択し、プロジェクト名や予算、作業者の属性を入力。必要に応じて、画像のアップロードなどを行います。最後に開始ボタンを押すと、登録しているワーカーさんへ作業が表示されます。ワーカーさんは、簡単な作業をするだけでポイントを獲得できます。クラウドワーカー(以下、ワーカー)に依頼することで、早く安く大量かつ正確な作業を依頼することができる仕組みになっています。

ここでデータの重要性について触れておきたいのですが、あるアルゴリズムの改善を行うタスクにおいて、アルゴリズム自体の改善を行うよりも、データを改善する方が、大幅に精度が向上するというケースが報告されています。つまり、高品質なデータがAIプロジェクトの成功確率を上げる一つの要因であるということです。

そこで『harBest』では、複数人数での作業をもとにした自動チェックアルゴリズムによって、信頼度の高い良質なデータを集めることにしました。

また、データの信頼度を高めるために、先ほどのアルゴリズムとは他に、スマートチェッカーAIがワーカーをチェックし、作業の正確さに応じてレイティングが変動するようにしています。レイティングに応じてもらえるポイントが変わるため、ワーカーが良質なデータをつくるインセンティブになっています。

また、作業の管理画面からデータを一覧で確認でき、品質の低いデータがあった際には、差し戻しや除外といった操作が簡単にできるようになっています。

また、『harBest』の特徴に、「プロユーザー制度」があります。プロユーザーとは、本人確認、NDAや誓約書の締結、アノテーション試験合格を経たワーカーのことです。

企業からの依頼には、秘匿性の高いデータを扱うこともあります。そのような場合には、プロユーザーに発注することが可能です。

―コストの面では、どのような優位性をもっているのでしょうか?

クラウドワーカーに直接発注できるため、仲介コストが発生せず、競合他社に比べて圧倒的な低コストを実現しています。

例えば、画像分類作業。他社だと2週間かかっていたところを3日間で、20万円かかっていたものを5万円で行うことができます。なぜこのような短期・低価格が実現できるのかというと、アクティブユーザー(ワーカー)が数百人いるからです。さらに、週間アクティブユーザーが63%と、非常に高い稼働率を誇っています。

実際にどのような作業があるかというと、今ちょうど稼働しているのは、ホイールの物体検出作業や違反コメントの検出作業です。ホイールの物体検出は、写真の中のホイールの部分を枠で囲むという作業です。6,000件の案件を2~3日で完了することができます。違反コメントの検出は、表示される文章が違反コメントかどうかをチェックするものです。コメントの違法性をチェックするようなAIをつくる際、検出作業を3人で行った上で多数決を取ります。15,000件のデータの検出が3~4日間で終わります。

他にも、塗りつぶし作業や写真を撮ってもらうような作業も依頼可能です。

企業からは、「従来よりも費用を抑えることができた」という声をいただいています。また、ワーカーの方からは、「他のアプリよりも稼ぐことができました」という声が届いています。

リリースから1年間で200万件のデータを処理しており、他のサービスに比べても、かなりの量をこなしていると自負しています。

今後もAI開発は活発に行われることが予想されます。『harBest』をご利用いただくことでより効率的なAI開発が可能になります。ご興味がございましたら、ぜひフリートライアルからご利用いただければと思います。

社名:株式会社APTO
創立:2020年1月
主な事業内容:主な事業内容:AI開発プラットフォーム提供事業、AIコンサルティング事業
URL:https://apto.co.jp

本稿は、ICF会員として、社会課題解決のために共に活動するベンチャー企業を紹介するシリーズ記事です。

  • Twitter
  • Facebook