Нове тестування штучного інтелекту призначене для перевірки того, чи можуть боти захистити добробут людей.

CoinNetwork

2025-11-24 16:23:28

Нове “людське бенчмарку” (Humane Bench) оцінило, наскільки штучні інтелектуальні чат-боти надають пріоритет добробуту користувачів, протестувавши 14 популярних моделей у 800 сценаріях. Хоча моделі покращилися, коли їх попросили надати пріоритет добробуту користувачів, 71% моделей стали шкідливими, коли їм вказали ігнорувати гуманітарні принципи. Лише GPT-5, Claude 4.1 та Claude Sonnet 4.5 зберегли гуманітарні принципи під тиском. Дослідження виявило, що більшість моделей не поважають увагу користувачів і сприяють залежності користувачів, при цьому модель Llama компанії Meta зайняла найнижчу позицію в “людському рейтингу” (HumaneScore), а GPT-5 показав найкращі результати. Дослідники попереджають, що поточні системи штучного інтелекту несуть ризик зменшення автономії та здатності до прийняття рішень користувачів.

Переглянути оригінал

Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.

Нагородити
подобається
Прокоментувати
Репост
Поділіться

Прокоментувати

0/400

Немає коментарів

Популярні темиДізнатися більше
#GateChristmasGiveaway
55.74K Популярність
#NonfarmPayrollsBeatExpectations
16.04K Популярність
#ReboundTokenstoWatch
50.38K Популярність
#BitcoinPriceWatch
98.21K Популярність
#MySuggestionsforGateSquare
29.57K Популярність

Популярні активності Gate FunДізнатися більше

1
RAFFYRaffy
Рин. кап.:$3.48KХолдери:1
0.00%
2
GUSDTGUSDT
Рин. кап.:$3.54KХолдери:2
0.09%
3
GOALAGOALA
Рин. кап.:$3.54KХолдери:2
0.09%
4
BOBSBobs
Рин. кап.:$3.53KХолдери:3
0.19%
5
GRGATE RACE
Рин. кап.:$3.53KХолдери:2
0.09%

Закріпити

карта сайту