Anthropic publie une mise à jour de 80 pages de la « Constitution de Claude » pour le cadre d'alignement de l'IA

PANews 23 janvier : la société d'IA de grande taille Anthropic a récemment publié une nouvelle version de la « Constitution de Claude » sous licence de partage des connaissances CC0 1.0, en tant que « référence ultime » pour générer des données d'entraînement synthétiques et des retours de classement ; passant de « énumérer les principes » à « expliquer pourquoi », afin d'améliorer la généralisation à de nouvelles situations. Le document est classé selon : sécurité large > éthique large > lignes directrices > tri sincère, en listant des « contraintes strictes » telles que ( ne pas fournir d'aide substantielle pour des armes biologiques ), et en ajoutant des chapitres sur la vertu, la sécurité psychologique et la conscience de soi du modèle, en insistant sur la transparence et l'itération continue.
Avertissement : Les informations figurant sur cette page peuvent provenir de sources tierces et sont fournies à titre indicatif uniquement. Elles ne reflètent pas les points de vue ou opinions de Gate et ne constituent pas un conseil financier, d’investissement ou juridique. Le trading des actifs virtuels comporte des risques élevés. Veuillez ne pas vous fonder uniquement sur les informations de cette page pour prendre vos décisions. Pour en savoir plus, consultez l’avertissement.
Commentaire
0/400
Aucun commentaire