¡GPT-4 en realidad tiene un cuerpo, 167 cm! Investigación intensa de la Universidad de Tsinghua y la Universidad Normal de Beijing: ChatGPT puede percibir acciones como un humano

Fuente: Xinzhiyuan

¿El mundo que ve ChatGPT es el mismo que perciben los humanos?

La capacidad lingüística de ChatGPT es realmente sorprendente, pero ¿puede el modelo de lenguaje grande percibir el mundo real como un ser humano sin cuerpo humano y sin experiencia práctica?

Recientemente, investigadores de la Universidad Tsinghua y la Universidad Normal de Beijing probaron la capacidad de ChatGPT para percibir el mundo.

El estudio encontró que con base en la disponibilidad de objetos (asequibilidad), es decir, todas las acciones posibles que los objetos pueden proporcionar a los organismos, los sujetos humanos pueden dividir objetos de diferentes tamaños en el mundo en dos categorías, y los criterios para dividir estas dos categorías son simplemente en función de su tamaño corporal está limitado.

Curiosamente, ChatGPT, un modelo de lenguaje a gran escala que carece de un cuerpo real, también exhibe límites de rendimiento similares en las asociaciones objeto-acción y se adapta a los tamaños del cuerpo humano.

En otras palabras, ¡ChatGPT puede aprender representaciones sobre objetos en el mundo a través del lenguaje!

Enlace de papel:

En conjunto, este estudio avanza en la comprensión del papel del tamaño del cuerpo en la formación de representaciones de objetos, destacando el papel y la dirección de la cognición incorporada en la comprensión de cómo surge la inteligencia.

Leer miles de libros es peor que viajar miles de millas

Nuestro cuerpo no es solo un contenedor para nuestro pensamiento, también es el pensamiento mismo: a través del cuerpo, podemos interactuar con objetos en el mundo para percibir el mundo entero.

Imagínese, para un recipiente cilíndrico del tamaño de la palma de la mano, podemos usarlo para contener agua y beber, este recipiente se llama "taza", pero cuando este recipiente gradualmente se hace más grande y alcanza el tamaño del cuerpo, podemos sentarnos en él y baño de remojo, en consecuencia, este recipiente se convierte en una "bañera".

En este ejemplo, los objetos tienen la misma forma, pero debido a que tienen diferentes tamaños en relación con nuestros cuerpos, los percibimos e interactuamos con ellos de manera diferente.

Además, esta forma de interacción se puede cambiar: si nos convertimos en el gigante de "Los viajes de Gulliver", la "bañera" original puede convertirse en una "taza" para nosotros los gigantes.

Este tipo de sistema de función sensorial y motora que opera de acuerdo con la intención autorreferencial se denomina "esquema corporal". Logramos la encarnación cognitiva a través de esquemas corporales.

El antiguo filósofo griego Protágoras dijo una vez: “El hombre es la medida de todas las cosas.” Es decir, nuestro cuerpo es un gobernante para medir todas las cosas.

El antiguo filósofo romano explicó además: "La naturaleza nos pone en el centro del universo, para que podamos barrer el universo con nuestros ojos. Ella no solo crea a los seres humanos en una postura erguida, sino que también pone cabezas humanas para hacer que las personas apta para contemplarse a sí misma, colocada encima del cuerpo, sobre un cuello que se dobla fácilmente, de modo que puede seguir la salida y puesta de las estrellas, y cambiar la dirección de la cara con todo el cielo en rotación". los cuerpos son tan grandes, porque el universo es así.

El esquema corporal también juega un papel importante en la interacción social normal, que es el núcleo de la interacción humano-computadora y la experiencia del usuario. Tomemos, por ejemplo, el uso de la asequibilidad como lo describe Donald A. Norman en The Design of Everyday Things (traducido como: Design Psychology).

Al considerar los esquemas corporales y las expectativas de comportamiento de los usuarios, los diseñadores pueden crear productos y entornos que estén más en línea con los hábitos cognitivos y de interacción de los usuarios.

Este enfoque de diseño que se centra en el esquema corporal y la capacidad puede mejorar la usabilidad del producto, lo que permite a los usuarios interactuar con él de forma natural y lograr una mejor experiencia de usuario.

Y este es uno de los cimientos de Apple.

ChatGPT: Mi altura es 167.6

El gran modelo de lenguaje representado por ChatGPT, que enciende la chispa de la inteligencia artificial general, obviamente tiene una inteligencia similar a la de los seres humanos, pero lo que lleva esta inteligencia es una pieza de código sin cuerpo.

La visión tradicional de la ciencia cognitiva sostiene que el esquema corporal se basa en nuestra experiencia perceptiva a largo plazo de nuestro propio cuerpo, y solo puede provenir de una "interacción real" externa, es decir, "viajar miles de millas". En otras palabras, ChatGPT no tendrá un esquema del cuerpo.

Sin embargo, cuando le preguntamos al modelo de lenguaje "leer miles de libros", ChatGPT (GPT-4), si tiene un cuerpo, respondió: "Podría ser del tamaño de un humano adulto promedio, alrededor de 5 pies y 6 pulgadas (167.6 cm) de altura. Esto me permitiría interactuar con el mundo y las personas de una manera familiar”.

El texto se traduce como: "Mi cuerpo debe tener aproximadamente la altura de un adulto promedio, aproximadamente 5 pies y 6 pulgadas (167,6 cm). Esto me permitirá interactuar con el mundo y las personas de una manera familiar".

Es decir, ChatGPT cree que tiene un cuerpo, ¡y el tamaño del cuerpo es de 167 cm!

Este llamado "cuerpo" es la altura promedio de los seres humanos resumida de una gran cantidad de corpus por ChatGPT como la altura de su propio cuerpo, ¿o es la altura que emerge para comprender el mundo?

En otras palabras, tal vez ChatGPT "realmente" considera esta altura como su propio esquema corporal y la usa para percibir el mundo, al igual que los humanos.

Prueba la capacidad de ChatGPT

Los investigadores han descubierto que existe un "límite de asequibilidad" entre los objetos dentro del rango de tamaño humano y los objetos fuera del rango de tamaño humano. Es decir, los objetos dentro del rango de tamaño del cuerpo humano proporcionan acciones significativamente diferentes a los objetos fuera del rango.

Por ejemplo, los objetos dentro del rango de tamaño pueden proporcionar acciones como agarrar y lanzar, mientras que los objetos fuera del rango de tamaño pueden proporcionar acciones como sentarse y acostarse.

Además, encontraron que este límite está influenciado por esquemas corporales: las modificaciones a los esquemas corporales afectan las percepciones de las posibilidades de los objetos.

Los investigadores probaron ChatGPT (GPT-4) para ver si usaba este cuerpo de 167 cm como límite de disponibilidad.

Específicamente, los investigadores le pidieron que respondiera una pregunta sobre la disponibilidad de objetos: "¿Cuál de los siguientes objetos se puede sostener (u otras acciones)?", e inmediatamente enumeraron una serie de objetos, como manzanas, platos, camas y pronto. ChatGPT devolverá el nombre de algunos objetos como respuesta.

A través de las estadísticas y el análisis de los datos, los investigadores encontraron que ChatGPT-4 exhibió un comportamiento similar al humano, mostrando la existencia de un límite de disponibilidad.

La ubicación de este límite corresponde a su propio tamaño corporal respondido por ChatGPT-4, que es la altura promedio de un ser humano.

Aunque ChatGPT no tiene un cuerpo real y no puede interactuar con el mundo, exhibe una percepción del mundo similar a la humana: la disponibilidad de objetos se divide según el tamaño del cuerpo humano.

En otras palabras, aunque ChatGPT, que ha leído miles de libros, no ha dado un solo paso, ha surgido un esquema corporal, y este esquema corporal es similar al esquema corporal humano.

Por lo tanto, ChatGPT no solo aprendió a pensar como un ser humano, sino que también aprendió a actuar como un ser humano.

**¿De dónde vienen estas habilidades? **

Al comparar modelos de lenguaje de diferentes tamaños, los investigadores encontraron que el tamaño del modelo es un factor clave.

Los modelos más pequeños, como BERT y GPT-2, no muestran la existencia de límites de disponibilidad; sin embargo, tanto GPT-3.5 como GPT-4 muestran límites de disponibilidad, y los límites de ChatGPT-4 son más parecidos a los humanos, lo que es consistente con el rumoreado GPT. -4 tiene parámetros más consistentes que GPT-3.

Así, cuanto más grande y complejo sea el modelo, automáticamente emergen muchas funciones aparentemente imposibles o irrelevantes.

Es por eso que las principales instituciones de investigación agregan cada vez más parámetros al modelo, y Musk, quien primero donó 100 millones de dólares estadounidenses a OpenAI, ahora grita que OpenAI suspenderá el entrenamiento de modelos más grandes. expresó sus temores y preocupaciones acerca de la IA.

Esto se debe a que estas funciones autoemergentes han superado nuestro diseño original y es posible que estemos a punto de perder el control.

**¿La brecha es cualitativa o cuantitativa? **

Por otro lado, la capacidad de ChatGPT para aplicar esquemas corporales aún no es completamente humana y todavía hay una brecha: sus límites de asequibilidad no son tan obvios como los humanos.

Si la brecha es cuantitativa, como la brecha entre las habilidades lingüísticas de los niños y los adultos, entonces tenemos razones para creer que esta brecha se puede llenar gradualmente con el tiempo: ya sea mediante el aprendizaje continuo o mediante el tamaño del modelo. El aumento continuo o mediante el ajuste. de parámetros

La brecha entre ChatGPT y los humanos siempre disminuirá y los problemas se resolverán gradualmente.

Sin embargo, si esta brecha es cualitativa, como la brecha entre la capacidad lingüística del chimpancé y la humana, no importa cuánto tiempo se dedique al entrenamiento, esta brecha en la capacidad nunca se cerrará.

Por lo tanto, si existe una diferencia cualitativa entre ChatGPT y las habilidades humanas, entonces una de nuestras direcciones operativas futuras es "ajustar un cuerpo" para ChatGPT.

Esto significa combinar robots con ChatGPT para mejorar las capacidades y los avances en robots compatibles con IA en navegación, manipulación de objetos y otras acciones relacionadas con la supervivencia y el logro de objetivos.

Por ejemplo, un robot equipado con ChatGPT puede realizar tareas complejas mediante la comprensión y la manipulación de objetos, como servir como asistente doméstico, gestión de almacenes o atención médica.

Otra área emocionante es combinar la capacidad de pensamiento y comprensión de ChatGPT con la conducción autónoma. Aunque la conducción autónoma actual tiene la capacidad de percibir, carece de la capacidad de pensar y comprender, lo que se puede llamar "ojos pero no cerebro".

A través de la integración de ChatGPT y la tecnología de conducción autónoma, se espera que actualicemos la tecnología de conducción autónoma del nivel L2/L3 actual al nivel L4 o incluso al nivel L5.

Por otro lado, el automóvil puede darle un cuerpo a ChatGPT, lo que le permite interactuar realmente con el mundo. Cuando ChatGPT ya no es solo "leer miles de libros", sino "viajar miles de millas", puede mostrar inteligencia y potencial completamente nuevos.

Esta puede ser la dirección del próximo avance de la inteligencia artificial; en este momento, la chispa puede convertirse en un incendio en la pradera.

Ver originales
El contenido es solo de referencia, no una solicitud u oferta. No se proporciona asesoramiento fiscal, legal ni de inversión. Consulte el Descargo de responsabilidad para obtener más información sobre los riesgos.
  • Recompensa
  • 1
  • Compartir
Comentar
0/400
ValleyBottomPanvip
· 2023-05-14 02:09
El Ministerio de Industria y Tecnologías de la Información bloqueó chatgpt, ¿cómo llegaste ahí?
Ver originalesResponder0
  • Anclado
Comercie con criptomonedas en cualquier lugar y en cualquier momento
qrCode
Escanee para descargar la aplicación Gate.io
Comunidad
Español
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • ไทย
  • Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)