エンコードがAI向けデータ開発ツールの成長のために新たな資金調達を実施

ラベリングおよびアノテーションプラットフォームは、最新の生成AIモデルに比べて注目されにくいですが、非常に重要です。なぜなら、多くのモデルがトレーニングする際に必要なデータはラベル付けがされていないと、モデルがそのデータを解釈できなくなるからです。

アノテーションの重要性

アノテーションは広範な作業であり、大規模で高度なデータセットには数千から数百万のアノテーションが必要です。この負担を軽減するために、エリック・ランダウとウルリック・ハンセンは、エンコードという「データ開発」プラットフォームを設立しました。このプラットフォームは、AIモデルのためにデータを管理し準備する企業を支援します。

資金調達による成長

現在、エンコードはNext47主導のシリーズBラウンドで新たに3000万ドルを調達し、総額5000万ドルの資金を確保しました。この資金は、今後6ヶ月間にわたり、エンコードの製品、エンジニアリング、AI研究チームの規模を倍増させるために使用され、サンフランシスコオフィスの拡張にも使われる予定です。ランダウは、「年末までにチームを現在の70人から100人に増やす予定です」と述べました。さらに、「ロンドンとサンフランシスコに二つの本社を持ち、世界中にチームメンバーがいます」と付け加えました。

アイデアの発端と共同創業

ランダウはスタンフォード大学で学部生として素粒子物理学の研究を行いながら、大規模データシステムに取り組んでいました。一方、ハンセンはJ.P.モルガンのグローバルマーケットで新興市場のデリバティブを扱っていました。ハンセンは、インペリアル・カレッジ・ロンドンでのコンピュータサイエンスの修士課程中にデータ集約型のAIプロジェクトに取り組んでいる間に、エンコードのアイデアが生まれたと語ります。データのキュレーションとラベリングに時間がかかることにフラストレーションを感じ、彼はランダウと解決策を話し合うことにしました。

エンコードの製品と市場の位置

「ハンセンのソフトウェア開発の専門知識と私の定量的研究の洞察を組み合わせてデータ開発を自動化し、2021年春にY Combinatorでエンコードの初版を発表しました」とランダウは説明しました。エンコードのプラットフォームは、企業がデータをAI向けに準備し、そのデータがモデルをどのようにサポートしているかを評価するためのツールを提供します。

データアノテーションおよびラベリング市場は、2027年までに36億ドルに成長すると予測されています。エンコードは、多くの競合他社の中で契約獲得を目指しています。特にScale AIなどの大手企業の存在に加え、DatasaurやHeartex、Dataloopなどのスタートアップも競争しています。

エンコードの独自性

エンコードは、そのプラットフォームの多様性によって際立っています。エンコードを使用することで、チームはプライベートおよびパブリッククラウドストレージから取り込んだデータセット(画像、動画、音声データセットを含む)を探索し、視覚化できます。また、同じデータセットでトレーニングされた異なるモデルのパフォーマンスを比較することも可能です。プラットフォームは、モデルの精度の問題を検出し、それを改善するために追加のトレーニングデータを提案します。

「特定のデータスタックの一部だけを扱うバラバラなソリューションとは異なり、エンコードはすべてのデータワークフローを一つのプラットフォームに統合します」とランダウは述べています。これにより、企業はAIの「ブラックボックス」の理解が深まり、モデルが特定の決定を下す理由を明らかにすることができます。

成功を収めるエンコード

エンコードの戦略は、これまでのところ成功を収めているようです。現在、同社にはフィリップス、AIスタートアップのSynthesia、ヘルスケアプロバイダーのCedars-SinaiおよびNorthwell Healthなど、120社の顧客がいます。また、名前が明らかにされていない軍や政府機関との契約もあります。ランダウによれば、エンコードは昨年の収益を4倍に増やし、スタッフを増員しなければ2025年にはキャッシュフローがプラスになる可能性があるとしています。

「私たちは減速の感触を持っていません」とランダウは言いますが、「市場全体の状況を認識し、資本の運用には慎重なアプローチを取っています」とも付け加えました。

他の資金調達ラウンドの参加者には、Y Combinator、CRV、Crane Venture Partnersが含まれています。