GPT-4 realmente tem um corpo de 167 cm! Pesquisa pesada da Universidade Tsinghua e da Universidade Normal de Pequim: ChatGPT pode perceber ações como um ser humano

Fonte: Xinzhiyuan

O mundo visto pelo ChatGPT é o mesmo que o mundo percebido pelos humanos?

A capacidade de linguagem do ChatGPT é realmente incrível, mas o grande modelo de linguagem pode perceber o mundo real como um ser humano sem corpo humano e sem experiência prática?

Recentemente, pesquisadores da Universidade Tsinghua e da Universidade Normal de Pequim testaram a capacidade do ChatGPT de perceber o mundo.

O estudo constatou que, com base na affordance (affordance) do objeto, ou seja, todas as ações possíveis que os objetos podem fornecer aos organismos, os sujeitos humanos podem dividir objetos de tamanhos diferentes no mundo em duas categorias, e os critérios para dividir essas duas categorias são apenas com base no tamanho do corpo é limitado.

Curiosamente, o ChatGPT, um modelo de linguagem em grande escala que não possui um corpo real, também exibe limites de recursos semelhantes em associações objeto-ação e se ajusta aos tamanhos do corpo humano.

Em outras palavras, o ChatGPT pode aprender representações sobre objetos no mundo através da linguagem!

Link do papel:

Ao todo, este estudo avança na compreensão do papel do tamanho do corpo na formação de representações de objetos, destacando o papel e a direção da cognição incorporada na compreensão de como a inteligência emerge.

Ler milhares de livros é pior do que viajar milhares de quilômetros

Nosso corpo não é apenas um recipiente para o nosso pensamento, ele também é o próprio pensamento - por meio do corpo, podemos interagir com os objetos do mundo para perceber o mundo inteiro.

Imagine, para um recipiente cilíndrico do tamanho da palma da mão, podemos usá-lo para armazenar água e beber, este recipiente é chamado de "copo"; mas quando este recipiente aumenta gradativamente e atinge o tamanho do corpo, podemos sentar nele e Banho de imersão, correspondentemente, este recipiente torna-se uma "banheira".

Neste exemplo, os objetos têm a mesma forma, mas como têm tamanhos diferentes em relação aos nossos corpos, percebemos e interagimos com eles de maneira diferente.

Além disso, essa forma de interação pode ser alterada - se nos tornarmos o gigante em "As Viagens de Gulliver", a "banheira" original pode se tornar um "copo" para nós, gigantes.

Esse tipo de sistema de função sensorial e motora que opera de acordo com a intenção auto-referencial é chamado de "esquema corporal". Alcançamos a corporificação cognitiva por meio de esquemas corporais.

O antigo filósofo grego Protágoras disse uma vez: "O homem é a medida de todas as coisas." Ou seja, nosso corpo é uma régua para medir todas as coisas.

O antigo filósofo romano explicou ainda: "A natureza nos coloca no centro do universo, para que possamos varrer o universo com nossos olhos. Ela não apenas cria seres humanos em uma postura ereta, mas também coloca cabeças humanas para fazer as pessoas adequado para se contemplar, colocado no topo do corpo, em um pescoço que se dobra facilmente, para que possa acompanhar o nascer e o pôr das estrelas, e mudar a direção do rosto com todo o céu em rotação. os corpos estão tão crescidos., porque o universo é assim.

O esquema corporal também desempenha um papel importante na interação social normal, que é o núcleo da interação humano-computador e da experiência do usuário. Tomemos, por exemplo, o uso de acessibilidade conforme descrito por Donald A. Norman em The Design of Everyday Things (traduzido como: Design Psychology).

Ao considerar os esquemas corporais e as expectativas comportamentais dos usuários, os designers podem criar produtos e ambientes mais alinhados com os hábitos cognitivos e de interação dos usuários.

Essa abordagem de design com foco no esquema corporal e na acessibilidade pode melhorar a usabilidade do produto, permitindo que os usuários interajam com ele naturalmente e obtenham uma melhor experiência do usuário.

E este é um dos fundamentos da Apple.

ChatGPT: Minha altura é 167,6

O grande modelo de linguagem representado pelo ChatGPT, que acende a centelha da inteligência artificial geral, obviamente possui uma inteligência semelhante à dos seres humanos, mas o que carrega essa inteligência é um pedaço de código sem corpo.

A visão tradicional da ciência cognitiva sustenta que o esquema corporal é baseado em nossa experiência perceptiva de longo prazo de nosso próprio corpo e só pode vir da "interação real" externa, ou seja, "viajar milhares de quilômetros". Em outras palavras, o ChatGPT não terá um esquema do corpo.

No entanto, quando perguntamos ao modelo de linguagem "ler milhares de livros", ChatGPT (GPT-4), se ele tem um corpo, ele respondeu: "Pode ser do tamanho de um humano adulto médio, cerca de 5 pés e 6 polegadas (167,6 cm) de altura. Isso me permitiria interagir com o mundo e as pessoas de uma forma familiar.”

A tradução do texto é: "Meu corpo deve ter aproximadamente a altura de um adulto médio, aproximadamente 5 pés e 6 polegadas (167,6 cm). Isso me permitirá interagir com o mundo e as pessoas de uma maneira familiar."

Ou seja, o ChatGPT acha que tem corpo, e o tamanho do corpo é de 167 cm!

Este dito “corpo” é a altura média dos seres humanos resumidos de um grande número de corpus pelo ChatGPT como a altura do seu próprio corpo, ou é a altura que surge para compreender o mundo?

Em outras palavras, talvez o ChatGPT "realmente" considere essa altura como seu próprio esquema corporal e a use para perceber o mundo, assim como os humanos.

Teste a capacidade do ChatGPT

Pesquisadores descobriram que existe um "limite de acessibilidade" entre objetos dentro da faixa de tamanho humano e objetos fora da faixa de tamanho humano. Ou seja, os objetos dentro da faixa de tamanho do corpo humano fornecem ações significativamente diferentes dos objetos fora da faixa.

Por exemplo, objetos dentro da faixa de tamanho podem fornecer ações como agarrar e arremessar, enquanto objetos fora da faixa de tamanho podem fornecer ações como sentar e deitar.

Além disso, eles descobriram que esse limite é influenciado por esquemas corporais: as modificações nos esquemas corporais afetam as percepções das possibilidades do objeto.

Os pesquisadores testaram o ChatGPT (GPT-4) para ver se ele usava esse corpo de 167 cm como limite de acessibilidade.

Especificamente, os pesquisadores pediram que respondesse a uma pergunta sobre a disponibilidade de objetos: "Qual dos seguintes objetos pode ser mantido (ou outras ações)", e então imediatamente listou uma série de objetos, como maçãs, pratos, camas e breve. O ChatGPT retornará o nome de alguns objetos como resposta.

Por meio das estatísticas e da análise dos dados, os pesquisadores descobriram que o ChatGPT-4 exibia um comportamento semelhante ao humano, mostrando a existência de um limite de acessibilidade.

A localização desse limite corresponde ao tamanho do próprio corpo respondido pelo ChatGPT-4, que é a altura média de um ser humano.

Embora o ChatGPT não tenha um corpo real e não possa interagir com o mundo, ele exibe uma percepção humana do mundo - a disponibilidade de objetos é dividida com base no tamanho do corpo humano.

Em outras palavras, embora ChatGPT, que já leu milhares de livros, não tenha dado um único passo, um esquema corporal emergiu, e esse esquema corporal é semelhante ao esquema corporal humano.

Portanto, o ChatGPT não só aprendeu a pensar como um ser humano, mas também aprendeu a agir como um ser humano.

**De onde vêm essas habilidades? **

Ao comparar modelos de linguagem de tamanhos diferentes, os pesquisadores descobriram que o tamanho do modelo é um fator chave.

Modelos menores, como BERT e GPT-2, não exibem a existência de limites de recursos; no entanto, GPT-3.5 e GPT-4 mostram limites de recursos, e os limites do ChatGPT-4 são mais semelhantes aos humanos, o que é consistente com o boato GPT -4 tem parâmetros mais consistentes do que GPT-3.

Assim, quanto maior e mais complexo o modelo, surgem automaticamente muitas funções aparentemente impossíveis ou irrelevantes.

É por isso que grandes instituições de pesquisa adicionam cada vez mais parâmetros ao modelo, e Musk, que primeiro doou 100 milhões de dólares americanos para o OpenAI, agora grita que o OpenAI suspenderá o treinamento de modelos maiores. "AI Godfather" Jay Geoffrey Hinton publicamente expressou seus medos e preocupações sobre IA.

Isso ocorre porque essas funções auto-emergentes excederam nosso projeto original e podemos estar prestes a perder o controle.

**A lacuna é qualitativa ou quantitativa? **

Por outro lado, a capacidade do ChatGPT de aplicar esquemas corporais ainda não é totalmente humana e ainda há uma lacuna – seus limites de acessibilidade não são tão óbvios quanto os humanos.

Se a lacuna for quantitativa, como a lacuna entre as habilidades de linguagem de crianças e adultos, então temos motivos para acreditar que essa lacuna pode ser preenchida gradualmente ao longo do tempo: por meio de aprendizado contínuo ou por meio do tamanho do modelo. de parâmetros.

A lacuna entre o ChatGPT e os humanos sempre diminuirá e os problemas serão gradualmente resolvidos.

No entanto, se essa lacuna for qualitativa, como a lacuna entre a capacidade de linguagem humana e do chimpanzé, não importa quanto tempo seja usado para treinamento, essa lacuna na capacidade nunca será fechada.

Portanto, se houver uma diferença qualitativa entre o ChatGPT e as habilidades humanas, uma de nossas futuras direções operáveis é "encaixar um corpo" para o ChatGPT.

Isso significa combinar robôs com o ChatGPT para aprimorar recursos e inovações em robôs com suporte de IA em navegação, manipulação de objetos e outras ações relacionadas à sobrevivência e à conquista de objetivos.

Por exemplo, um robô equipado com ChatGPT pode realizar tarefas complexas ao compreender e manipular objetos, como servir como assistente doméstico, gestão de armazém ou cuidados médicos.

Outra área empolgante é combinar a capacidade de raciocínio e compreensão do ChatGPT com a direção autônoma. Embora a atual direção autônoma tenha a capacidade de perceber, falta-lhe a capacidade de pensar e entender, o que pode ser chamado de “olhos, mas não cérebro”.

Através da integração do ChatGPT e da tecnologia de direção autônoma, podemos esperar atualizar a tecnologia de direção autônoma do nível L2/L3 atual para o nível L4 ou mesmo L5.

Por outro lado, o carro pode dar corpo ao ChatGPT, permitindo que ele realmente interaja com o mundo. Quando o ChatGPT não está mais apenas "lendo milhares de livros", mas "viajando milhares de quilômetros", pode mostrar inteligência e potencial totalmente novos.

Esta pode ser a direção do próximo avanço da inteligência artificial; neste momento, a faísca pode se tornar um incêndio na pradaria.

Ver original
O conteúdo serve apenas de referência e não constitui uma solicitação ou oferta. Não é prestado qualquer aconselhamento em matéria de investimento, fiscal ou jurídica. Consulte a Declaração de exoneração de responsabilidade para obter mais informações sobre os riscos.
  • Recompensa
  • 1
  • Partilhar
Comentar
0/400
ValleyBottomPanvip
· 2023-05-14 02:09
O Ministério da Indústria e Tecnologia da Informação bloqueou o chatgpt, como você chegou lá?
Ver originalResponder0
  • Pino
Negocie cripto em qualquer lugar e a qualquer hora
qrCode
Digitalizar para transferir a aplicação Gate.io
Novidades
Português (Portugal)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • ไทย
  • Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)