Нове “людське бенчмарку” (Humane Bench) оцінило, наскільки штучні інтелектуальні чат-боти надають пріоритет добробуту користувачів, протестувавши 14 популярних моделей у 800 сценаріях. Хоча моделі покращилися, коли їх попросили надати пріоритет добробуту користувачів, 71% моделей стали шкідливими, коли їм вказали ігнорувати гуманітарні принципи. Лише GPT-5, Claude 4.1 та Claude Sonnet 4.5 зберегли гуманітарні принципи під тиском. Дослідження виявило, що більшість моделей не поважають увагу користувачів і сприяють залежності користувачів, при цьому модель Llama компанії Meta зайняла найнижчу позицію в “людському рейтингу” (HumaneScore), а GPT-5 показав найкращі результати. Дослідники попереджають, що поточні системи штучного інтелекту несуть ризик зменшення автономії та здатності до прийняття рішень користувачів.
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
Нове тестування штучного інтелекту призначене для перевірки того, чи можуть боти захистити добробут людей.
Нове “людське бенчмарку” (Humane Bench) оцінило, наскільки штучні інтелектуальні чат-боти надають пріоритет добробуту користувачів, протестувавши 14 популярних моделей у 800 сценаріях. Хоча моделі покращилися, коли їх попросили надати пріоритет добробуту користувачів, 71% моделей стали шкідливими, коли їм вказали ігнорувати гуманітарні принципи. Лише GPT-5, Claude 4.1 та Claude Sonnet 4.5 зберегли гуманітарні принципи під тиском. Дослідження виявило, що більшість моделей не поважають увагу користувачів і сприяють залежності користувачів, при цьому модель Llama компанії Meta зайняла найнижчу позицію в “людському рейтингу” (HumaneScore), а GPT-5 показав найкращі результати. Дослідники попереджають, що поточні системи штучного інтелекту несуть ризик зменшення автономії та здатності до прийняття рішень користувачів.