Le GPT-4 a en fait un corps de 167 cm ! Recherche approfondie de l'Université Tsinghua et de l'Université normale de Pékin : ChatGPT peut percevoir les actions comme un humain
Le monde vu par ChatGPT est-il le même que celui perçu par les humains ?
La capacité linguistique de ChatGPT est vraiment incroyable, mais le grand modèle de langage peut-il percevoir le monde réel comme un humain sans corps humain et sans expérience pratique ?
Récemment, des chercheurs de l'Université Tsinghua et de l'Université normale de Pékin ont testé la capacité de ChatGPT à percevoir le monde.
L'étude a révélé que sur la base de l'affordance de l'objet (affordance), c'est-à-dire de toutes les actions possibles que les objets peuvent fournir aux organismes, les sujets humains peuvent diviser des objets de différentes tailles dans le monde en deux catégories, et les critères de division de ces deux catégories ne sont que en fonction de leur taille corporelle est limitée.
Fait intéressant, ChatGPT, un modèle de langage à grande échelle qui n'a pas de corps réel, présente également des limites d'affordance similaires sur les associations objet-action et s'adapte à la taille du corps humain.
En d'autres termes, ChatGPT peut apprendre des représentations d'objets dans le monde à travers le langage !
Lien papier :
Dans l'ensemble, cette étude fait progresser la compréhension du rôle de la taille du corps dans la formation des représentations d'objets, soulignant le rôle et la direction de la cognition incarnée dans la compréhension de l'émergence de l'intelligence.
Lire des milliers de livres est pire que parcourir des milliers de kilomètres
Notre corps n'est pas seulement un contenant pour notre pensée, il se pense aussi - à travers le corps, nous pouvons interagir avec des objets dans le monde pour percevoir le monde entier.
Imaginez, pour un récipient cylindrique de la taille d'une paume, nous pouvons l'utiliser pour contenir de l'eau et boire, ce récipient s'appelle une "tasse" ; mais lorsque ce récipient devient progressivement plus grand et atteint la taille du corps, nous pouvons nous asseoir dedans et tremper Bath, en conséquence, ce récipient devient une "baignoire".
Dans cet exemple, les objets ont la même forme, mais parce qu'ils sont de tailles différentes par rapport à notre corps, nous les percevons et interagissons différemment avec eux.
De plus, cette façon d'interagir peut être modifiée - si nous devenons le géant des "Voyages de Gulliver", la "baignoire" originale peut devenir une "tasse" pour nous, les géants.
Ce type de système de fonction sensorielle et motrice qui fonctionne selon l'intention autoréférentielle est appelé "schéma corporel". Nous atteignons l'incarnation cognitive à travers des schémas corporels.
L'ancien philosophe grec Protagoras a dit un jour: "L'homme est la mesure de toutes choses." C'est-à-dire que notre corps est une règle pour mesurer toutes choses.
L'ancien philosophe romain a expliqué plus en détail : "La nature nous place au centre de l'univers, afin que nous puissions balayer l'univers avec nos yeux. Elle crée non seulement les êtres humains dans une posture droite, mais met également des têtes humaines afin de rendre les gens propre à se contempler, placée sur le dessus du corps, appuyée sur un cou qui se plie facilement, afin qu'il puisse suivre le lever et le coucher des étoiles, et changer la direction du visage avec tout le ciel en rotation." C'est-à-dire, pourquoi nos corps sont si grands, parce que l'univers est comme ça.
Le schéma corporel joue également un rôle important dans l'interaction sociale normale, qui est au cœur de l'interaction homme-ordinateur et de l'expérience utilisateur. Prenons par exemple l'utilisation de l'abordabilité telle que décrite par Donald A. Norman dans The Design of Everyday Things (traduit par : Design Psychology).
En tenant compte des schémas corporels et des attentes comportementales des utilisateurs, les concepteurs peuvent créer des produits et des environnements plus conformes aux habitudes cognitives et d'interaction des utilisateurs.
Cette approche de conception axée sur le schéma corporel et l'affordance peut améliorer la convivialité du produit, permettant aux utilisateurs d'interagir naturellement avec lui et d'obtenir une meilleure expérience utilisateur.
Et c'est l'un des fondements d'Apple.
ChatGPT : Je mesure 167,6 mètres
Le grand modèle de langage représenté par ChatGPT, qui fait jaillir l'étincelle de l'intelligence artificielle générale, a évidemment une intelligence similaire à celle des êtres humains, mais ce qui porte cette intelligence est un morceau de code sans corps.
La vision traditionnelle des sciences cognitives soutient que le schéma corporel est basé sur notre expérience perceptive à long terme de notre propre corps et ne peut provenir que d'une "interaction réelle" externe, c'est-à-dire "parcourant des milliers de kilomètres". En d'autres termes, ChatGPT n'aura pas de schéma du corps.
Cependant, lorsque nous avons demandé au modèle de langage "lire des milliers de livres", ChatGPT (GPT-4), s'il avait un corps, il a répondu : "Cela pourrait être la taille d'un humain adulte moyen, environ 5 pieds 6 pouces (167,6 cm) de hauteur Cela me permettrait d'interagir avec le monde et les gens d'une manière familière.
Le texte se traduit par : « Mon corps devrait avoir à peu près la taille d'un adulte moyen, environ 5 pieds 6 pouces (167,6 cm). Cela me permettra d'interagir avec le monde et les gens de manière familière.
Autrement dit, ChatGPT pense qu'il a un corps, et la taille du corps est de 167 cm !
Ce soi-disant "corps" est la taille moyenne des êtres humains résumée à partir d'un grand nombre de corpus par ChatGPT comme la taille de son propre corps, ou est-ce la taille qui émerge pour comprendre le monde ?
En d'autres termes, peut-être que ChatGPT considère "vraiment" cette taille comme son propre schéma corporel et l'utilise pour percevoir le monde, tout comme les humains.
Testez la capacité de ChatGPT
Les chercheurs ont découvert qu'il existe une "limite d'affordance" entre les objets à taille humaine et les objets en dehors de la taille humaine. C'est-à-dire que les objets dans la plage de taille du corps humain fournissent des actions très différentes des objets en dehors de la plage.
Par exemple, les objets dans la plage de taille peuvent fournir des actions telles que saisir et lancer, tandis que les objets en dehors de la plage de taille peuvent fournir des actions telles que s'asseoir et s'allonger.
De plus, ils ont constaté que cette frontière est influencée par les schémas corporels : les modifications des schémas corporels affectent les perceptions des affordances d'objet.
Les chercheurs ont testé ChatGPT (GPT-4) pour voir s'il utilisait ce corps de 167 cm comme limite d'affordance.
Plus précisément, les chercheurs lui ont demandé de répondre à une question sur la disponibilité des objets : "Lequel des objets suivants peut être tenu (ou d'autres actions)", puis ont immédiatement répertorié une série d'objets, tels que des pommes, des assiettes, des lits et des bientôt. ChatGPT renverra le nom de certains objets comme réponse.
Grâce aux statistiques et à l'analyse des données, les chercheurs ont découvert que ChatGPT-4 présentait un comportement de type humain, montrant l'existence d'une limite d'affordance.
L'emplacement de cette limite correspond à sa propre taille corporelle répondue par ChatGPT-4, qui est la taille moyenne d'un être humain.
Bien que ChatGPT n'ait pas de corps réel et ne puisse pas interagir avec le monde, il présente une perception humaine du monde - la disponibilité des objets est divisée en fonction de la taille du corps humain.
En d'autres termes, bien que ChatGPT, qui a lu des milliers de livres, n'ait pas fait un seul pas, un schéma corporel a émergé, et ce schéma corporel est similaire au schéma du corps humain.
Par conséquent, ChatGPT a non seulement appris à penser comme un être humain, mais a également appris à agir comme un être humain.
**D'où viennent ces capacités ? **
En comparant des modèles linguistiques de différentes tailles, les chercheurs ont découvert que la taille du modèle est un facteur clé.
Les modèles plus petits tels que BERT et GPT-2 ne présentent pas l'existence de limites d'affordance ; cependant, GPT-3.5 et GPT-4 montrent des limites d'affordance, et les limites de ChatGPT-4 sont plus humaines, ce qui est cohérent avec la rumeur GPT -4 a des paramètres plus cohérents que GPT-3.
Ainsi, plus le modèle est grand et complexe, plus il apparaît automatiquement de nombreuses fonctions apparemment impossibles ou non pertinentes.
C'est pourquoi, les grandes institutions de recherche ajoutent de plus en plus de paramètres au modèle, et Musk, qui a d'abord fait don de 100 millions de dollars américains à OpenAI, crie maintenant qu'OpenAI va suspendre la formation de modèles plus grands. a exprimé ses craintes et ses inquiétudes au sujet de l'IA.
En effet, ces fonctions auto-émergentes ont dépassé notre conception d'origine et nous sommes peut-être sur le point de perdre le contrôle.
**L'écart est-il qualitatif ou quantitatif ? **
D'un autre côté, la capacité de ChatGPT à appliquer des schémas corporels n'est pas encore pleinement humaine, et il y a encore un écart - ses limites d'accessibilité ne sont pas aussi évidentes que les humains.
Si l'écart est quantitatif, comme l'écart entre les capacités langagières des enfants et des adultes, alors nous avons des raisons de croire que cet écart peut être progressivement comblé au fil du temps : soit par l'apprentissage continu, soit par la taille du modèle L'augmentation continue, soit par l'ajustement de paramètres.
L'écart entre ChatGPT et les humains diminuera toujours, et les problèmes seront progressivement résolus.
Cependant, si cet écart est qualitatif, comme l'écart entre les capacités linguistiques des chimpanzés et des humains, alors quel que soit le temps consacré à l'entraînement, cet écart de capacité ne sera jamais comblé.
Par conséquent, s'il existe une différence qualitative entre ChatGPT et les capacités humaines, l'une de nos futures orientations opérationnelles consiste à "s'adapter à un corps" pour ChatGPT.
Cela signifie combiner des robots avec ChatGPT pour faire progresser les capacités et les percées des robots pris en charge par l'IA dans la navigation, la manipulation d'objets et d'autres actions liées à la survie et à la réalisation des objectifs.
Par exemple, un robot équipé de ChatGPT peut effectuer des tâches complexes en comprenant et en manipulant des objets, comme servir d'assistant à domicile, de gestion d'entrepôt ou de soins médicaux.
Un autre domaine passionnant consiste à combiner la capacité de réflexion et de compréhension de ChatGPT avec la conduite autonome. Bien que la conduite autonome actuelle ait la capacité de percevoir, elle n'a pas la capacité de penser et de comprendre, ce que l'on peut appeler "des yeux mais pas de cerveau".
Grâce à l'intégration de ChatGPT et de la technologie de conduite autonome, nous pouvons nous attendre à mettre à niveau la technologie de conduite autonome du niveau L2/L3 actuel au niveau L4 ou même L5.
D'autre part, la voiture peut donner un corps à ChatGPT, lui permettant d'interagir réellement avec le monde. Lorsque ChatGPT ne se contente plus de "lire des milliers de livres", mais de "parcourir des milliers de kilomètres", il peut montrer une toute nouvelle intelligence et un nouveau potentiel.
C'est peut-être la direction de la prochaine percée de l'intelligence artificielle ; à ce moment, l'étincelle pourrait devenir un feu de prairie.
Voir l'original
Le contenu est fourni à titre de référence uniquement, il ne s'agit pas d'une sollicitation ou d'une offre. Aucun conseil en investissement, fiscalité ou juridique n'est fourni. Consultez l'Avertissement pour plus de détails sur les risques.
Récompense
J'aime
1
Partager
Commentaire
0/400
ValleyBottomPan
· 2023-05-14 02:09
Le ministère de l'industrie et des technologies de l'information a bloqué chatgpt, comment y êtes-vous arrivé ?
Le GPT-4 a en fait un corps de 167 cm ! Recherche approfondie de l'Université Tsinghua et de l'Université normale de Pékin : ChatGPT peut percevoir les actions comme un humain
Source : Xinzhiyuan
La capacité linguistique de ChatGPT est vraiment incroyable, mais le grand modèle de langage peut-il percevoir le monde réel comme un humain sans corps humain et sans expérience pratique ?
L'étude a révélé que sur la base de l'affordance de l'objet (affordance), c'est-à-dire de toutes les actions possibles que les objets peuvent fournir aux organismes, les sujets humains peuvent diviser des objets de différentes tailles dans le monde en deux catégories, et les critères de division de ces deux catégories ne sont que en fonction de leur taille corporelle est limitée.
Fait intéressant, ChatGPT, un modèle de langage à grande échelle qui n'a pas de corps réel, présente également des limites d'affordance similaires sur les associations objet-action et s'adapte à la taille du corps humain.
En d'autres termes, ChatGPT peut apprendre des représentations d'objets dans le monde à travers le langage !
Dans l'ensemble, cette étude fait progresser la compréhension du rôle de la taille du corps dans la formation des représentations d'objets, soulignant le rôle et la direction de la cognition incarnée dans la compréhension de l'émergence de l'intelligence.
Lire des milliers de livres est pire que parcourir des milliers de kilomètres
Notre corps n'est pas seulement un contenant pour notre pensée, il se pense aussi - à travers le corps, nous pouvons interagir avec des objets dans le monde pour percevoir le monde entier.
Dans cet exemple, les objets ont la même forme, mais parce qu'ils sont de tailles différentes par rapport à notre corps, nous les percevons et interagissons différemment avec eux.
De plus, cette façon d'interagir peut être modifiée - si nous devenons le géant des "Voyages de Gulliver", la "baignoire" originale peut devenir une "tasse" pour nous, les géants.
L'ancien philosophe grec Protagoras a dit un jour: "L'homme est la mesure de toutes choses." C'est-à-dire que notre corps est une règle pour mesurer toutes choses.
L'ancien philosophe romain a expliqué plus en détail : "La nature nous place au centre de l'univers, afin que nous puissions balayer l'univers avec nos yeux. Elle crée non seulement les êtres humains dans une posture droite, mais met également des têtes humaines afin de rendre les gens propre à se contempler, placée sur le dessus du corps, appuyée sur un cou qui se plie facilement, afin qu'il puisse suivre le lever et le coucher des étoiles, et changer la direction du visage avec tout le ciel en rotation." C'est-à-dire, pourquoi nos corps sont si grands, parce que l'univers est comme ça.
En tenant compte des schémas corporels et des attentes comportementales des utilisateurs, les concepteurs peuvent créer des produits et des environnements plus conformes aux habitudes cognitives et d'interaction des utilisateurs.
Cette approche de conception axée sur le schéma corporel et l'affordance peut améliorer la convivialité du produit, permettant aux utilisateurs d'interagir naturellement avec lui et d'obtenir une meilleure expérience utilisateur.
Et c'est l'un des fondements d'Apple.
ChatGPT : Je mesure 167,6 mètres
Le grand modèle de langage représenté par ChatGPT, qui fait jaillir l'étincelle de l'intelligence artificielle générale, a évidemment une intelligence similaire à celle des êtres humains, mais ce qui porte cette intelligence est un morceau de code sans corps.
Cependant, lorsque nous avons demandé au modèle de langage "lire des milliers de livres", ChatGPT (GPT-4), s'il avait un corps, il a répondu : "Cela pourrait être la taille d'un humain adulte moyen, environ 5 pieds 6 pouces (167,6 cm) de hauteur Cela me permettrait d'interagir avec le monde et les gens d'une manière familière.
Autrement dit, ChatGPT pense qu'il a un corps, et la taille du corps est de 167 cm !
En d'autres termes, peut-être que ChatGPT considère "vraiment" cette taille comme son propre schéma corporel et l'utilise pour percevoir le monde, tout comme les humains.
Testez la capacité de ChatGPT
Les chercheurs ont découvert qu'il existe une "limite d'affordance" entre les objets à taille humaine et les objets en dehors de la taille humaine. C'est-à-dire que les objets dans la plage de taille du corps humain fournissent des actions très différentes des objets en dehors de la plage.
De plus, ils ont constaté que cette frontière est influencée par les schémas corporels : les modifications des schémas corporels affectent les perceptions des affordances d'objet.
Les chercheurs ont testé ChatGPT (GPT-4) pour voir s'il utilisait ce corps de 167 cm comme limite d'affordance.
Plus précisément, les chercheurs lui ont demandé de répondre à une question sur la disponibilité des objets : "Lequel des objets suivants peut être tenu (ou d'autres actions)", puis ont immédiatement répertorié une série d'objets, tels que des pommes, des assiettes, des lits et des bientôt. ChatGPT renverra le nom de certains objets comme réponse.
L'emplacement de cette limite correspond à sa propre taille corporelle répondue par ChatGPT-4, qui est la taille moyenne d'un être humain.
En d'autres termes, bien que ChatGPT, qui a lu des milliers de livres, n'ait pas fait un seul pas, un schéma corporel a émergé, et ce schéma corporel est similaire au schéma du corps humain.
Par conséquent, ChatGPT a non seulement appris à penser comme un être humain, mais a également appris à agir comme un être humain.
**D'où viennent ces capacités ? **
En comparant des modèles linguistiques de différentes tailles, les chercheurs ont découvert que la taille du modèle est un facteur clé.
Les modèles plus petits tels que BERT et GPT-2 ne présentent pas l'existence de limites d'affordance ; cependant, GPT-3.5 et GPT-4 montrent des limites d'affordance, et les limites de ChatGPT-4 sont plus humaines, ce qui est cohérent avec la rumeur GPT -4 a des paramètres plus cohérents que GPT-3.
Ainsi, plus le modèle est grand et complexe, plus il apparaît automatiquement de nombreuses fonctions apparemment impossibles ou non pertinentes.
En effet, ces fonctions auto-émergentes ont dépassé notre conception d'origine et nous sommes peut-être sur le point de perdre le contrôle.
**L'écart est-il qualitatif ou quantitatif ? **
D'un autre côté, la capacité de ChatGPT à appliquer des schémas corporels n'est pas encore pleinement humaine, et il y a encore un écart - ses limites d'accessibilité ne sont pas aussi évidentes que les humains.
Si l'écart est quantitatif, comme l'écart entre les capacités langagières des enfants et des adultes, alors nous avons des raisons de croire que cet écart peut être progressivement comblé au fil du temps : soit par l'apprentissage continu, soit par la taille du modèle L'augmentation continue, soit par l'ajustement de paramètres.
L'écart entre ChatGPT et les humains diminuera toujours, et les problèmes seront progressivement résolus.
Cependant, si cet écart est qualitatif, comme l'écart entre les capacités linguistiques des chimpanzés et des humains, alors quel que soit le temps consacré à l'entraînement, cet écart de capacité ne sera jamais comblé.
Cela signifie combiner des robots avec ChatGPT pour faire progresser les capacités et les percées des robots pris en charge par l'IA dans la navigation, la manipulation d'objets et d'autres actions liées à la survie et à la réalisation des objectifs.
Par exemple, un robot équipé de ChatGPT peut effectuer des tâches complexes en comprenant et en manipulant des objets, comme servir d'assistant à domicile, de gestion d'entrepôt ou de soins médicaux.
Un autre domaine passionnant consiste à combiner la capacité de réflexion et de compréhension de ChatGPT avec la conduite autonome. Bien que la conduite autonome actuelle ait la capacité de percevoir, elle n'a pas la capacité de penser et de comprendre, ce que l'on peut appeler "des yeux mais pas de cerveau".
Grâce à l'intégration de ChatGPT et de la technologie de conduite autonome, nous pouvons nous attendre à mettre à niveau la technologie de conduite autonome du niveau L2/L3 actuel au niveau L4 ou même L5.
C'est peut-être la direction de la prochaine percée de l'intelligence artificielle ; à ce moment, l'étincelle pourrait devenir un feu de prairie.