AI がデジタル人間に魂を注入し始める

巴比特_

2023-05-15 03:21:16

著者: フレディ

データサポート: ピタゴラスビッグデータ (

出典: 格龍回

画像の出典: Unbounded AI ツールによって生成

ここ数日、国内の「不人気歌手」がAIのカバー曲で再び人気を集めている。

ステーションBのネチズンはAIモデルを使用して歌手ステファニー・サンのAIクローンを生成しました。これは実際にカーナビ上の「林志玲」と「郭徳剛」に似ています。歌手自身の音声をトレーニングに使用し、まったく同じ音色の「Sun Yanzi」を生成します。

そして、アイドルに自分の好きな曲を歌わせたいという願いが、こんな奇妙な形で実現したのです。

出典: ステーションB

海外のゲームプレイはさらにとんでもない。

180 万人のファンを持つ米国の 23 歳の女性インターネット有名人は、GPT-4 で自分の AI クローンを再現し、1 分あたり 1 ドルを請求しながら同時に 1,000 人以上のネットユーザーと恋に落ちました。

わずか 1 週間で、彼女は 71,600 ドルを集めました。

**そしてそれはそれをはるかに超えたもので、今でも彼女の「ボーイフレンド」は急速に増加しており、その数は1万人近くに達しており、彼らは彼女と「恋に落ちる」ために96時間もの長い間列に並んで待っています。。 **

一部のアナリストは、この傾向からすると、彼女が月に500万ドルを稼ぐことは難しくないと考えており、技術的な制限がなければ、彼女が稼ぐ金額は天文学的な数字になる可能性がある。

これらの現象は、AI+ によってもたらされる新しいテクノロジーの配当の時代が急速に近づいていることをすでに十分に示しています。

01生放送室にデジタル人間軍がなだれ込む

商品を伴うライブ配信は、バーチャル IP の実現にとって最も可能性のあるシナリオです。

Z 世代のソーシャルネットワーキング、ビデオ、オンラインショッピングなどのツールの使用は、ネットワーク全体の平均レベルをはるかに上回っており、デジタルヒューマンと仮想空間を組み合わせた新しいゲームプレイは、彼らに経験と対話性の感覚をもたらしています。バーチャル IP のファンは 18 ～ 24 歳の若いグループです。

この傾向により、ブランドは製品がサークルを突破する機会を得ることができます。

2020年には、バーチャルシンガーの羅天儀と楽正玲がタオバオのライブ放送室にやって来て、ボシュロム、ミデア、ロクシタンなどのブランドの商品を持参します。この生放送の視聴者数は270万人に上り、200万人近くが報酬や交流を行いました。

これは当時大きな話題を呼び、**バーチャルデジタルヒューマンによる生放送の時代が到来しました。 **

そして今年、chatGPT によって引き起こされた人工知能の大規模モデルの急増により、バーチャルデジタルヒューマンの分野は、さらに壮大な爆発の新たなラウンドを迎えました。

多数の仮想デジタル人がライブ放送室に群がり始めました。

今年4月、Tianyu Digitalのバーチャルデジタルヒューマン「朏朏」はChatGPTモデルへのアクセスを完了し、ライブブロードキャストデビューを完了し、顧客の質問にリアルタイムで応答するだけでなく、さまざまな質問に独自に回答することもできます。

出典: ドウイン

短いビデオには、次のようなシーンがたくさんあります。 会社のオフィス全体が空っぽで、コンピューター画面に数十人の AI 美女が並んだ机が並んでいるだけで、生放送が行われています。

出典: 短いビデオ

同社は、あらかじめ用意された2Dの超リアルなアバターと台本、背景を頼りに、たった1日だけ生放送を行うことができる **個々の効果は生放送ほどではないものの、コストがとんでもなく安く、ライブ配信も可能超低コストでコピーされ、勝利は量で勝つことにあり、本当に嘘をついて AI にお金を稼ぐことは不可能ではありません。 **

これらすべては、「AI+」に基づくコンテンツ効率の革命がデジタルヒューマンの分野で勃発していることを示しています。

バーチャルデジタルヒューマンは、制作技術、応用シナリオ、映像特性などに応じて多くの種類に分類されます。

3D の人気アイドルとは異なり、生放送室で話す 2D のリアルなデジタル人物のほとんどは、現実のプロトタイプに基づいており、声や表情が再現されているソウル IP です。

仮想アンカーは、人間の設定を覆す問題を心配することなく、オンコールで 7*24 のライブブロードキャスト作業を実行できるため、ライブブロードキャスト業務の人件費が削減されます。

この背景では、AIGC がデジタルヒューマンの生産プロセスを再構築しています。

2Dデジタルヒューマンの制作にはディープラーニングを活用しており、画像デザインを決定するだけでグラフィックデータと音声データを収集・前処理した後、モデルにアップロードして学習させることができ、3Dに比べて制作方法がシンプルかつより簡単です。標準化され、生産効率が継続的に向上します。

工場の組立ラインのこの方法により、デジタルヒューマンの生産閾値、コスト、サイクルが大幅に短縮されました。

**同時に、業界の生産端での技術の反復とコスト削減に伴い、小規模顧客向けのデジタルヒューマンソリューションも登場し始めています。 **

Tencent Cloud は 4 月にデジタルヒューマンプロダクションプラットフォームをリリースし、現実の画像を生成する必要があるデジタルアバターはプラットフォーム上でサービスを購入でき、画像、音声、ビデオをアップロードするだけでカスタマイズが実現でき、さまざまな音色やビデオの長さに応じて課金されます。

デジタルヒューマンの作成に加えて、デジタルヒューマンライブブロードキャストソリューションの完全なセットも提供できます。その機能には、ライブブロードキャストルームを引き継ぐ生身の音声、ユーザーのコメントに対するインテリジェントな返信の取得などが含まれます。価格はわずか 1,000 元です。。

**また、一部のチャネル運営者は、AI アンカーをパッケージで 200 元未満で販売しています。 **

これらのアンカー画像の多くはモデル事務所の許可を得たものであり、放送画質は粗いものの、明らかな切り抜きの痕跡があり、音声も特徴がありません。

しかし、一般的な中小企業にとっては、商品を提供するための大きな V はなく、ハイエンド IP のカスタマイズに何百万ドルも費やす余裕はありません。運営コストを削減し、すぐに量産を開始したい場合は、数千ドルが必要です。元デジタルの人で十分です。

デジタルヒューマンスタジオ Siji

企業が独自にコードを変更してさまざまなデジタルヒューマンを作成したい場合は、テクノロジープロバイダーからソースコードを購入することもでき、デジタルヒューマンはライブ配信を行って収益を得ることができます。

しかし、AIデジタルヒューマンの物語はまだ終わっていません。

02 AI を注入した魂

IDCは「中国のAIデジタルヒューマン市場の現状と機会分析」レポートの中で、デジタルヒューマンを5つのレベルに分類しており、現在、デジタルヒューマンの開発はマニュアル制作からAIモデリングまでの段階を経ており、最初は人間の外観を持ち、しかし、彼らは単純な対話型の意思決定しか行うことができません。

インテリジェンスのレベルが L4 および L5 に達すると、アイアンマンの専属 AI 執事「ジャービス」と同様に、AI 主導のデジタルヒューマンがシーンのほとんどの意思決定を引き継ぎ、よりモーダルなリアルタイムインタラクションをサポートできるようになります。

**過去 30 年間の仮想デジタルヒューマンの開発、技術開発、市場の需要は、基本的に 2 つの点を中心に進化してきました。1 つは視覚効果、もう 1 つはインタラクティブな体験です。 **

仮想デジタルヒューマンは、ゲーム、アニメーション、映画で初めて登場し、流行のものへの感情的なつながりと IP 価値の拡張を反映しました。

初期のキャラクター系IPは手描きで、アクションを一つ一つ描く必要がありました。 1982年、日本のアニメ「マクロス」のヒロイン、林ミンミがバーチャルシンガーとして初めて音楽アルバムをリリースした。

初代歌手リン・ミンメイ

映画では、映像はコンピューターでモデリングできますが、アクションは人間が行う必要があり、CG技術やモーションキャプチャーなどの技術が徐々に普及してきており、グリーンバックとキャプチャー機材を頼りに、俳優はどんな役にもなりきることができます。

2002 年の『ロード・オブ・ザ・リング』から昨年の『アバター 2』まで、ミレニアムを経て、キャラクターのレンダリング効果は細心の注意を払い、芸術作品の創作に大きな利便性をもたらしてきました。

実在の人物が撮影したロード・オブ・ザ・リングの「ゴラム」画像

これまでのデジタルヒューマン技術の発展は、服装の見た目や視覚効果を現実に近づけるだけでなく、運転（リアルな表現）も含めて、段階的に「人間」に近づける限界に近づいています。繊細な表現や動きなど）とレンダリング（映像をより精細かつリアルタイムに表現すること）。

しかし、まだ何かが足りないような気がします。

1970年に日本のロボット工学の専門家である森正博氏が提唱した「不気味の谷」理論では、ロボットは外見も動作も人間に似ているため、人間はロボットに対して肯定的な感情を抱くようになるという。

ロボットと人間がある程度の類似点に達すると、ほんのわずかな違いでも拡大され、否定性や憤りをもたらすようになります。そして、ロボットと人間の類似性が高まり続けると、人間はロボットに対して肯定的な感情を取り戻すでしょう。

映画とは異なり、ソーシャル属性が強いアプリケーションシナリオでは、デジタルヒューマンのリアルタイムインタラクションに対するより高い要件があり、見栄えの良い「花瓶」を作成するだけでは満足できません。

**インタラクションに関しては、自然言語モデルがそのギャップを埋めます。 **

GPT のテキスト生成能力は誰もが驚かされ、デジタルヒューマンの「IQ」に 2 つのバーが追加されました。

大規模な NLP モデルは、AI 主導のバーチャルヒューマンの技術的基礎です。簡単に言うと、バーチャルデジタルヒューマンが雄弁に話し、標準化されたコンテンツの制作コストを削減し、インテリジェントな顧客サービス、モデレータ、およびインテリジェントな顧客サービス、モデレータ、およびサービスなどの役割を果たすように訓練されることを可能にします。ツアーガイド。長期的には、個別化と感情理解の向上により、高齢者に寄り添い、ケアを提供し、子供たちにとって「個人教師」になることも実現されるでしょう。

さらに、口の動きもAIによって駆動され、テキストとのマッピング関係を確立できます。リアルさのレベルが高まるにつれて、微表情がより豊かになります。話すとき、表情と口の動きを一致させることができます。」「形は人間に似ている」そして「精神は人間に似ている」。

新華社通信：世界初のデジタル宇宙飛行士：シャオ・ジェン

Midjourney は拡散モデルに基づいた爆発的な製品で、昨年 7 月にリリースされ、テキスト入力命令を通じて AI ペイントを訓練します。

カップル、イラスト：Midjourney

** 一部の組織は、現在の年間収益が 1 億米ドルの規模に達していると試算しています。 **

ステーションBのアップマスターは、Midjourneyを使用して、おばあちゃんのリアルなイメージを復元しました。外観から、老化した肌のラインや白髪などの詳細が満載で、さらに過去の音声をおばあちゃんの声を再現し、最終的におばあちゃんのイメージを生成しました。 D-IDデジタルダブル。

おばあちゃんに別れを告げられなかったちょっとした後悔を埋め合わせるために、孫は目の前のデジタル「おばあちゃん」と対話を開始し、「おばあちゃん」は丁寧に答えました。これは実際に ChatGPT が提供した回答資料でした。

出典: ステーションB

クライアント側でのこうした試みがさらに繰り返されることで、AI の「擬人化」に大量のトレーニング資料が継続的に追加され、AI モデルデータの強化が加速され、最終的には AI が魂を注入できるようになります。デジタルヒューマンを実現し、より大きな可能性をもたらします。

03 エピローグ

バーチャルアバターの探求は 30 年以上にわたって続けられており、手描きから人間主導、そして AI 主導に至るまで、リアルでインタラクティブなエクスペリエンスの進歩により、幅広いアプリケーションシナリオが開かれ、少しずつ広がりを見せています。。

AIGC は、一般人の外見、声、その他の特徴を完全にデジタル化するのに役立ち、生産の敷居が低いことで市場の想像力の余地が広がります。

IDCは、2026年までに中国のAIデジタルヒューマンの市場規模は102億4000万元に達すると予測しているが、AIデジタルヒューマンがどれだけ優れたエクスペリエンスを私たちにもたらしてくれるかが、デジタルヒューマンの最終的な運命を決定する。

同時に、AI デジタルヒューマンは、次世代の人間とコンピューターのインタラクションポータルとしての可能性を秘めており、将来、私たちは冷たい画面ではなく、生き生きとしたデジタルヒューマンに直面するようになるかもしれません。

おそらく AI のゴッドファーザーが言ったように、人間はデジタルインテリジェンスを生み出すための知性の進化の過渡期にすぎません。今、私たちはついに、人間のように見え、私たちと同じように話し、私たちと同じように考えるかもしれないデジタルクローンを手に入れました。将来。（全文）

原文表示

内容は参考用であり、勧誘やオファーではありません。投資、税務、または法律に関するアドバイスは提供されません。リスク開示の詳細については、免責事項を参照してください。

報酬
いいね
コメント
共有

0/400

コメントなし

トピック
#BTC#
222k 投稿
#PI#
186k 投稿
#ETH#
141k 投稿
4#GateioInto11#
79k 投稿
5#ContentStar#
66k 投稿
6#GT#
62k 投稿
7#BOME#
60k 投稿
8#DOGE#
57k 投稿
9#MAGA#
52k 投稿
10#SLERF#
51k 投稿

ピン

サイトマップ

AI がデジタル人間に魂を注入し始める

01生放送室にデジタル人間軍がなだれ込む

02 AI を注入した魂

03 ** エピローグ **

03 エピローグ