Anthropic выпустила 80-страничную «Конституцию Claude» — обновленную рамочную структуру для выравнивания ИИ

PANews 23 января: компания AI-моделей Anthropic недавно обнародовала новую версию «Конституции Claude» и выпустила ее под лицензией Creative Commons CC0 1.0, как «высший авторитет» для обучения, используемый для генерации синтетических обучающих данных и обратной связи по ранжированию; вместо «перечня принципов» теперь объясняется «почему так», чтобы повысить обобщение в новых ситуациях. Документ структурирован по принципам: безопасность > этика > следование руководствам > искренняя помощь, в нем перечислены «жесткие ограничения» (, такие как отказ в предоставлении существенной помощи в создании биологического оружия ), а также добавлены разделы о добродетелях, психологической безопасности и самосознании модели, подчеркивая прозрачность и постоянные итерации.
Дисклеймер: Информация на этой странице может быть получена из источников третьих сторон и предоставляется только для ознакомления. Она не отражает взгляды или мнения Gate и не является финансовой, инвестиционной или юридической рекомендацией. Торговля виртуальными активами связана с высоким риском. Пожалуйста, не основывайте свои решения исключительно на данных этой страницы. Подробнее смотрите в Дисклеймере.
комментарий
0/400
Нет комментариев