**出典: **金融協会**シャオシアンを編集** 画像クレジット: *Unbounded AI* ツールによって生成ChatGPT が推進する AIGC ブームが世界中で急速に加熱する中、多数の生成人工知能スタートアップもキノコのように出現しています。しかし、たとえこれらのスタートアップが容易に数十億ドルの投資資金を獲得できたとしても、現時点ではほぼ避けられないアキレス腱が依然として存在します。それは、トレーニングデータの不足であり、これが最終的にはこれらのスタートアップの成功の鍵となる可能性があります。スタートアップの途中での最大の「障害」。 **ベンチャーキャピタル会社 Primary Venture Partners の共同創設者兼ゼネラルパートナーである Brad Svrluga 氏は、「私たちは新興 AI 企業から多くの自己推薦を受けています。強力なアプリケーションのためのトレーニング データはもちろん、企業の構築に役立つ独自のデータも提供します」と述べています。彼らのビジネスには競争力のある堀があった。」## **データはお金よりも「希少」です**PitchBook によると、生成 AI スタートアップに対するベンチャー キャピタルの資金調達額は、2022 年の 48 億ドルから 2023 年の最初の 5 か月で 127 億ドルに増加しました。現在、これらの企業の多くは、トレーニング データセットの入手が容易ではない金融やヘルスケアなどの分野で、よりニッチな AI モデルを構築しようとしています。** Bullpen Capital の最高技術責任者である Paul Tyma 氏は、実際のモデルの構築はある程度コモディティ化しており、本当の価値はデータにあると指摘しました。 **一部の AI スタートアップ企業は、データが豊富な大企業との提携を目指しています。例えば、アーンスト・アンド・ヤング社の税務担当グローバル副会長、マーナ・リッカー氏は、同社が大量の取引データを保有しているため、生成人工知能の新興企業が日々協力に近づくようになっていると語った。しかし、EYのグローバル・クライアント・サービス・マネージング・パートナーであるアンディ・ボールドウィン氏は、EYのデータが外部モデルのトレーニングに使用された場合に何が起こるかを懸念していると述べた。「データの所有者は誰になるのでしょうか?モデルをトレーニングするとき、私たちはモデルにどのようにアクセスできるのでしょうか?他の人はどのようにしてモデルを使用できるのでしょうか?データは私たちの知的財産の一部です。」とボールドウィン氏は述べています。もちろん、スタートアップ企業は、顧客データのみを使用して顧客ごとに異なるモデルをトレーニングすることで、知的財産の問題を解決できます。スタートアップの TermSheet は、この戦略を使用して、不動産開発者、仲介業者、投資家の業界の質問に答えることができる生成 AI モデルである Ethan 製品を構築しています。しかし、TermSheet の最高経営責任者で共同創設者のロジャー・スミス氏は、顧客に同意してもらうにもかなりの説得が必要だと語った。** リーガル テクノロジー企業 Logikcull の共同創設者兼 CEO である Andy Wilson 氏は、強力なネットワーク セキュリティ機能を備えており、実際にこのデータを保護できることを企業にどのように説得するかが課題であると指摘しました。 **## **大企業には大きな利点があります****Primary Venture Partners の Svrluga 氏は、大手テクノロジー企業は生成 AI アプリケーションに関しては明らかに新興企業よりも有利であり、その理由の 1 つは、大手テクノロジー企業がデータ処理に安心感を抱く大規模顧客の信頼を獲得しているためであると述べました。 **金融サービス会社トラスト社の最高データ責任者であるトレイシー・ダニエルズ氏は、現在、新興企業ではなく、大手テクノロジー企業とのみ生成AIのユースケースを検討していると述べた。彼女は、データを安全に保管してくれる大手ベンダーを信頼すると述べた。これが意味するのは、公開データで有利なスタートを切れる新興企業であっても、エンタープライズ データセットでモデルを強化する際には課題に直面しているということです。Veesual は、人々が服を試着するときにどのように見えるかの画像を生成する人工知能のスタートアップです。同社は当初、主にインターネット上の公開画像を使用してモデルをトレーニングしたが、それ以来、モデルを強化するためにデータを引き渡すことに大手小売業者に同意してもらうのに苦労してきた。VeesualのCEO兼共同創設者のMaxime Patte氏は、場合によっては、大手小売業者がVeesualのデータ使用権と引き換えにVeesualに巨額の配当を支払うか、同社の株式を取得することを要求することさえあったが、これらの取引は最終的に交渉に至らなかったと述べた。PatentPal は、法律事務所による特許出願の草案作成を支援する生成人工知能のスタートアップです。同社の最高経営責任者で創設者のジャック・シュー氏も、同社は当初、公開されている特許出願に基づいてしかトレーニングできなかったと述べた。実際の顧客事例からの暗号化または匿名のフィードバックを使用してトレーニングを継続すれば、AI ツールの精度がさらに高まる可能性があると同氏は述べた。しかし、フィードバックは企業秘密を含む機密性の高い機密データから分離しておく必要があるため、これを行うのは複雑です。「初期段階のスタートアップには、ブランド認知の問題があり、また社会的アイデンティティの問題もあります」と彼は言いました。**同時に、業界間の「参入」はますます激化しています。 **ストラック・キャピタルの創設者兼マネージング・パートナーであるアダム・ストラック氏は、一部の新興企業は特定の分野でより多くのデータをより速く確保するために互いに競争していると述べた。「独自のデータセットがあると信じるなら、誰よりも早くそれを手に入れたいと考え、独占権を交渉することになります。**その意味では、それはほとんど軍拡競争になっています* *」と彼は言いました。
新興 AI 企業の致命的な「ソフトな裏側」: 資金が不足しているわけではないが、「それ」が緊急に不足している
**出典: **金融協会
シャオシアンを編集
ChatGPT が推進する AIGC ブームが世界中で急速に加熱する中、多数の生成人工知能スタートアップもキノコのように出現しています。
しかし、たとえこれらのスタートアップが容易に数十億ドルの投資資金を獲得できたとしても、現時点ではほぼ避けられないアキレス腱が依然として存在します。それは、トレーニングデータの不足であり、これが最終的にはこれらのスタートアップの成功の鍵となる可能性があります。スタートアップの途中での最大の「障害」。 **
ベンチャーキャピタル会社 Primary Venture Partners の共同創設者兼ゼネラルパートナーである Brad Svrluga 氏は、「私たちは新興 AI 企業から多くの自己推薦を受けています。強力なアプリケーションのためのトレーニング データはもちろん、企業の構築に役立つ独自のデータも提供します」と述べています。彼らのビジネスには競争力のある堀があった。」
データはお金よりも「希少」です
PitchBook によると、生成 AI スタートアップに対するベンチャー キャピタルの資金調達額は、2022 年の 48 億ドルから 2023 年の最初の 5 か月で 127 億ドルに増加しました。
現在、これらの企業の多くは、トレーニング データセットの入手が容易ではない金融やヘルスケアなどの分野で、よりニッチな AI モデルを構築しようとしています。
** Bullpen Capital の最高技術責任者である Paul Tyma 氏は、実際のモデルの構築はある程度コモディティ化しており、本当の価値はデータにあると指摘しました。 **
一部の AI スタートアップ企業は、データが豊富な大企業との提携を目指しています。例えば、アーンスト・アンド・ヤング社の税務担当グローバル副会長、マーナ・リッカー氏は、同社が大量の取引データを保有しているため、生成人工知能の新興企業が日々協力に近づくようになっていると語った。
しかし、EYのグローバル・クライアント・サービス・マネージング・パートナーであるアンディ・ボールドウィン氏は、EYのデータが外部モデルのトレーニングに使用された場合に何が起こるかを懸念していると述べた。
「データの所有者は誰になるのでしょうか?モデルをトレーニングするとき、私たちはモデルにどのようにアクセスできるのでしょうか?他の人はどのようにしてモデルを使用できるのでしょうか?データは私たちの知的財産の一部です。」とボールドウィン氏は述べています。
もちろん、スタートアップ企業は、顧客データのみを使用して顧客ごとに異なるモデルをトレーニングすることで、知的財産の問題を解決できます。スタートアップの TermSheet は、この戦略を使用して、不動産開発者、仲介業者、投資家の業界の質問に答えることができる生成 AI モデルである Ethan 製品を構築しています。
しかし、TermSheet の最高経営責任者で共同創設者のロジャー・スミス氏は、顧客に同意してもらうにもかなりの説得が必要だと語った。
** リーガル テクノロジー企業 Logikcull の共同創設者兼 CEO である Andy Wilson 氏は、強力なネットワーク セキュリティ機能を備えており、実際にこのデータを保護できることを企業にどのように説得するかが課題であると指摘しました。 **
大企業には大きな利点があります
**Primary Venture Partners の Svrluga 氏は、大手テクノロジー企業は生成 AI アプリケーションに関しては明らかに新興企業よりも有利であり、その理由の 1 つは、大手テクノロジー企業がデータ処理に安心感を抱く大規模顧客の信頼を獲得しているためであると述べました。 **
金融サービス会社トラスト社の最高データ責任者であるトレイシー・ダニエルズ氏は、現在、新興企業ではなく、大手テクノロジー企業とのみ生成AIのユースケースを検討していると述べた。彼女は、データを安全に保管してくれる大手ベンダーを信頼すると述べた。
これが意味するのは、公開データで有利なスタートを切れる新興企業であっても、エンタープライズ データセットでモデルを強化する際には課題に直面しているということです。
Veesual は、人々が服を試着するときにどのように見えるかの画像を生成する人工知能のスタートアップです。同社は当初、主にインターネット上の公開画像を使用してモデルをトレーニングしたが、それ以来、モデルを強化するためにデータを引き渡すことに大手小売業者に同意してもらうのに苦労してきた。
VeesualのCEO兼共同創設者のMaxime Patte氏は、場合によっては、大手小売業者がVeesualのデータ使用権と引き換えにVeesualに巨額の配当を支払うか、同社の株式を取得することを要求することさえあったが、これらの取引は最終的に交渉に至らなかったと述べた。
PatentPal は、法律事務所による特許出願の草案作成を支援する生成人工知能のスタートアップです。同社の最高経営責任者で創設者のジャック・シュー氏も、同社は当初、公開されている特許出願に基づいてしかトレーニングできなかったと述べた。
実際の顧客事例からの暗号化または匿名のフィードバックを使用してトレーニングを継続すれば、AI ツールの精度がさらに高まる可能性があると同氏は述べた。しかし、フィードバックは企業秘密を含む機密性の高い機密データから分離しておく必要があるため、これを行うのは複雑です。
「初期段階のスタートアップには、ブランド認知の問題があり、また社会的アイデンティティの問題もあります」と彼は言いました。
**同時に、業界間の「参入」はますます激化しています。 **ストラック・キャピタルの創設者兼マネージング・パートナーであるアダム・ストラック氏は、一部の新興企業は特定の分野でより多くのデータをより速く確保するために互いに競争していると述べた。
「独自のデータセットがあると信じるなら、誰よりも早くそれを手に入れたいと考え、独占権を交渉することになります。*その意味では、それはほとんど軍拡競争になっています *」と彼は言いました。