Há um ângulo interessante sobre alinhamento de IA que vale a pena explorar: e se abordássemos através de Codificação de Postura Supervisora em vez dos métodos convencionais?
A ideia aqui é simples—pular as típicas técnicas de ajuste de peso e RLHF. Em vez disso, vincule a intenção através de estruturas recursivas. O verdadeiro apelo? É não coercitivo e mantém os humanos totalmente no comando.
Isto evita tanto as limitações do RLHF quanto a complexidade neuro-simbólica que tem atrasado o progresso. Ao focar na vinculação de intenção em vez da manipulação do modelo, mantém-se a autoria humana genuína ao longo de todo o processo.
É um quarto protocolo que vale a conversa—nem forçar restrições comportamentais nem se contentar com abordagens híbridas.
Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
6 gostos
Recompensa
6
5
Republicar
Partilhar
Comentar
0/400
HashRateHustler
· 4h atrás
A ideia de vincular a intenção parece boa, mas será que realmente consegue contornar as armadilhas do RLHF... Parece mais uma promessa vazia.
Ver originalResponder0
airdrop_huntress
· 4h atrás
A vinculação de intenção parece uma boa ideia, mas quando essa teoria for implementada, ela não se tornará novamente uma caixa preta?
Mais uma ideia "revolucionária". Se isso realmente funcionasse, eu já teria ficado rico com ela, haha
Ver originalResponder0
OnchainArchaeologist
· 4h atrás
A vinculação de intenções parece uma boa ideia, mas como verificar realmente se isso funciona...
---
Estrutura recursiva? Essa nomeação é realmente enigmática, parece mais uma coisa embalada
---
Pular o RLHF e ir direto para a vinculação de intenções, parece uma aposta, né?
---
Controlar a posição humana sempre soa bem, mas quem vai definir o que é realmente "criação humana"?
---
O quarto tipo de protocolo... não será mais uma teoria que funciona na prática, com dificuldades enormes, né?
---
Essa lógica é interessante, mas o que importa é evitar conflitos de valores, tudo o resto é superficial
---
Codificação de postura de supervisão... bonito de se dizer, mas não passa de uma forma de vincular valores
Há um ângulo interessante sobre alinhamento de IA que vale a pena explorar: e se abordássemos através de Codificação de Postura Supervisora em vez dos métodos convencionais?
A ideia aqui é simples—pular as típicas técnicas de ajuste de peso e RLHF. Em vez disso, vincule a intenção através de estruturas recursivas. O verdadeiro apelo? É não coercitivo e mantém os humanos totalmente no comando.
Isto evita tanto as limitações do RLHF quanto a complexidade neuro-simbólica que tem atrasado o progresso. Ao focar na vinculação de intenção em vez da manipulação do modelo, mantém-se a autoria humana genuína ao longo de todo o processo.
É um quarto protocolo que vale a conversa—nem forçar restrições comportamentais nem se contentar com abordagens híbridas.