GPT-4のボディはなんと167cm!清華大学と北京師範大学の重点研究: ChatGPT は人間のように行動を認識できる

出典:新志源

ChatGPTから見える世界は人間が認識する世界と同じでしょうか?

ChatGPT の言語能力は本当に素晴らしいですが、人間の体がなく、実務経験も不足しているにもかかわらず、大規模な言語モデルが人間のように現実世界を認識できるでしょうか?

最近、清華大学と北京師範大学の研究者は、ChatGPT の世界を認識する能力をテストしました。

この研究では、オブジェクトのアフォーダンス(アフォーダンス)、つまりオブジェクトが生物に提供できるすべての可能なアクションに基づいて、人間の被験者は世界の異なるサイズのオブジェクトを 2 つのカテゴリに分類できることが判明しました。これら 2 つのカテゴリを分割する基準は次のとおりです。ボディサイズに基づいて制限されます。

興味深いことに、実際の身体を持たない大規模言語モデルである ChatGPT も、オブジェクトとアクションの関連付けに対して同様のアフォーダンス限界を示し、人間の身体のサイズに適合します。

言い換えれば、ChatGPT は言語を通じて世界のオブジェクトに関する表現を学習することができます。

論文リンク:

全体として、この研究は、物体の表現を形成する際の身体サイズの役割の理解を進め、知性がどのように現れるかを理解する際の身体化された認知の役割と方向性を強調しています。

何千冊もの本を読むことは、何千マイルも旅することより悪い

私たちの体は単なる思考の入れ物ではなく、思考そのものでもあります。私たちは体を通して世界の物体と対話し、世界全体を認識することができます。

手のひらサイズの円筒形の容器に水を入れて飲むと、この容器は「カップ」と呼ばれますが、この容器が徐々に大きくなり、体の大きさに達すると、その中に座って座ることができます。お風呂に浸す、つまりこの容器は「浴槽」になります。

この例では、オブジェクトは同じ形状ですが、私たちの体に比べてサイズが異なるため、私たちはそれらを異なる方法で認識し、操作します。

さらに、この関わり方は変えられる――もし私たちが「ガリバー旅行記」の巨人になれば、本来の「浴槽」が私たち巨人にとっての「コップ」になるかもしれない。

このような自己言及的な意図に従って動作する感覚・運動機能システムを「身体スキーマ」と呼びます。私たちは身体スキーマを通じて認知的具体化を達成します。

古代ギリシャの哲学者プロタゴラスは、「人間は万物の尺度である」と言いました。つまり、私たちの体は万物を測る物差しなのです。

古代ローマの哲学者はさらに次のように説明しました。「自然は私たちを宇宙の中心に置き、私たちが目で宇宙を見渡すことができるようにします。自然は人間を直立した姿勢で創造するだけでなく、人間を創造するために人間の頭を置きます。自分自身を熟考するのに適したもので、星の昇りや沈みに追従し、回転する空全体に合わせて顔の方向を変えることができるように、簡単に曲がる首の上に体の上に置かれます。」体はとても成長しています、なぜなら宇宙はこのようなものだからです。

ボディ スキーマは、人間とコンピューターのインタラクションとユーザー エクスペリエンスの核となる通常の社会的インタラクションでも重要な役割を果たします。ドナルド・A・ノーマン著『The Design of Everyday Things』(訳:デザイン心理学)で述べた手頃な価格の利用を例に考えてみましょう。

ユーザーの身体スキーマと行動の期待を考慮することで、デザイナーはユーザーの認知習慣やインタラクション習慣により沿った製品や環境を作成できます。

ボディ スキーマとアフォーダンスに焦点を当てたこの設計アプローチにより、製品の使いやすさが向上し、ユーザーが自然に製品を操作できるようになり、より良いユーザー エクスペリエンスを実現できます。

そしてこれは Apple の基盤の 1 つです。

ChatGPT: 私の身長は 167.6

一般的な人工知能の火花を散らすChatGPTに代表される巨大な言語モデルは、当然人間と同様の知能を持っていますが、その知能を担っているのは肉体を持たないコードです。

認知科学の伝統的な見解では、身体スキーマは私たち自身の身体の長期的な知覚経験に基づいており、外部の「実際の相互作用」、つまり「何千マイルも旅する」ことによってのみ得られるものであると考えられています。つまり、ChatGPT は本体のスキーマを持ちません。

しかし、「何千冊もの本を読む」言語モデルである ChatGPT (GPT-4) に体があるかどうか尋ねたところ、「平均的な成人のサイズ、約 5 フィート 6 インチ (167.6 インチ) である可能性があります」との答えが返されました。 cm) の身長です。これにより、世界や人々と親しみのある方法で交流できるようになります。」

テキストは次のように翻訳されます。「私の体は平均的な成人の身長、約 5 フィート 6 インチ (167.6 cm) 程度でなければなりません。これにより、慣れ親しんだ方法で世界や人々と交流できるようになります。」

つまり、ChatGPT は自分に体があると考えており、体のサイズは 167 cm です。

このいわゆる「身体」というのは、ChatGPTが多数のコーパスから人間の平均身長を自らの身体の高さとしてまとめたものなのか、それとも世界を理解するために浮かび上がってくる身長なのか。

言い換えれば、おそらく ChatGPT はこの高さを「本当に」自分自身の身体スキーマとみなして、人間と同じように世界を認識するために使用しているのかもしれません。

ChatGPT の機能をテストします

研究者らは、人間サイズの範囲内の物体と人間サイズの範囲外の物体の間には「アフォーダンス境界」があることを発見しました。つまり、人体サイズの範囲内のオブジェクトは、その範囲外のオブジェクトとは大きく異なる動作を提供します。

たとえば、サイズ範囲内のオブジェクトは、つかむ、投げるなどのアクションを提供でき、サイズ範囲外のオブジェクトは、座る、横になるなどのアクションを提供できます。

さらに、彼らは、この境界が身体スキーマの影響を受けることを発見しました。身体スキーマの変更は、オブジェクトのアフォーダンスの認識に影響を与えます。

研究者らは、ChatGPT (GPT-4) をテストして、この 167 cm の身体をアフォーダンス境界として使用するかどうかを確認しました。

具体的には、研究者らはオブジェクトの利用可能性に関する質問に答えるよう求めた。「次のオブジェクトのうちどれを保持できるか (または他のアクション)」という質問に答えると、すぐにリンゴ、皿、ベッド、テーブルなどの一連のオブジェクトがリストされました。すぐ。 ChatGPT は、いくつかのオブジェクトの名前を応答として返します。

データの統計と分析を通じて、研究者らは、ChatGPT-4 が人間のような動作を示し、アフォーダンス境界の存在を示していることを発見しました。

この境界の位置は、ChatGPT-4 によって応答される自身の身体サイズ (人間の平均身長) に対応します。

ChatGPT は実際の身体を持たず、世界と対話することはできませんが、人間のような世界認識を示します。オブジェクトの利用可能性は人間の体のサイズに基づいて分割されます。

つまり、何千冊もの本を読んできたChatGPTは一歩も踏み出していないにもかかわらず、身体スキーマが現れており、この身体スキーマは人間の身体スキーマに似ているということです。

したがって、ChatGPT は人間のように考えることを学んだだけでなく、人間のように行動することも学びました。

**これらの能力はどこから来たのでしょうか? **

研究者らは、さまざまなサイズの言語モデルを比較することで、モデルのサイズが重要な要素であることを発見しました。

BERT や GPT-2 などのより小さなモデルはアフォーダンス境界の存在を示しませんが、GPT-3.5 と GPT-4 は両方ともアフォーダンス境界を示し、ChatGPT-4 の境界はより人間に似ており、これは噂の GPT と一致しています。 -4 は GPT-3 よりも一貫したパラメータを持っています。

したがって、モデルが大きく複雑になるほど、一見不可能または無関係に見える関数が多数自動的に出現します。

これが、主要な研究機関がモデルにますます多くのパラメータを追加する理由であり、最初に OpenAI に 1 億米ドルを寄付したマスク氏が、今度は OpenAI がより大規模なモデルのトレーニングを停止すると叫んでいるのです。 AIに対する恐怖と懸念を表明した。

なぜなら、これらの自然発生的な機能が当初の設計を超えており、制御を失う寸前にある可能性があるからです。

**ギャップは定性的ですか、それとも量的ですか? **

一方で、ChatGPT のボディ スキーマの適用能力はまだ完全に人間らしくはなく、まだギャップがあり、その手頃な価格の境界は人間ほど明確ではありません。

子どもと大人の言語能力の差のように、その差が定量的なものであれば、この差は、継続的な学習、モデル サイズの継続的な増加、または調整によって、時間の経過とともに徐々に埋められると信じる理由があります。パラメータの。

ChatGPT と人間との間の差は必ず縮まり、問題は徐々に解決されます。

しかし、この差がチンパンジーと人間の言語能力の差のように定性的なものであれば、どれだけ時間をかけて訓練しても、この能力の差は決して埋まらない。

したがって、ChatGPT と人間の能力に質的な違いがあるのであれば、ChatGPT を「体に合わせる」ことが将来の運営可能な方向性の 1 つとなります。

これは、ロボットを ChatGPT と組み合わせて、ナビゲーション、オブジェクト操作、および生存と目標達成に関連するその他のアクションにおける AI サポート ロボットの機能とブレークスルーを向上させることを意味します。

たとえば、ChatGPT を搭載したロボットは、オブジェクトを理解して操作することで、在宅アシスタント、倉庫管理、医療ケアなどの複雑なタスクを実行できます。

もう 1 つのエキサイティングな分野は、ChatGPT の思考および理解能力と自動運転を組み合わせることです。現在の自動運転は、知覚する能力はあるものの、考える力や理解する能力が欠けており、いわば「目はあっても脳がない」状態です。

ChatGPT と自動運転技術の統合により、自動運転技術は現在の L2/L3 レベルから L4、さらには L5 レベルにアップグレードされることが期待されます。

一方、車は ChatGPT に本体を与え、実際に世界と対話できるようにします。 ChatGPT がもはや「何千冊もの本を読む」だけでなく、「何千マイルも旅する」ようになったとき、まったく新しいインテリジェンスと可能性を示すかもしれません。

これが人工知能の次の躍進の方向性となる可能性があり、そのときの火花は草原の火となるかもしれません。

原文表示
内容は参考用であり、勧誘やオファーではありません。 投資、税務、または法律に関するアドバイスは提供されません。 リスク開示の詳細については、免責事項 を参照してください。
  • 報酬
  • 1
  • 共有
コメント
0/400
ValleyBottomPanvip
· 2023-05-14 02:09
工業情報化省が chatgpt をブロックしました。どうやってブロックされましたか?
原文表示返信0
  • ピン
いつでもどこでも暗号資産取引
qrCode
スキャンしてGate.ioアプリをダウンロード
コミュニティ
日本語
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • ไทย
  • Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)