Một bài kiểm tra điểm chuẩn trí tuệ nhân tạo mới nhằm kiểm tra xem các Bots có thể bảo vệ phúc lợi của con người hay không

CoinNetwork

2025-11-24 16:23:28

Một bài kiểm tra “Điểm chuẩn nhân đạo” (Humane Bench) mới đã đánh giá mức độ ưu tiên mà các chatbot trí tuệ nhân tạo dành cho phúc lợi của người dùng, kiểm tra hiệu suất của 14 mô hình nổi bật trong 800 tình huống. Mặc dù các mô hình đã cải thiện khi được yêu cầu ưu tiên phúc lợi của người dùng, nhưng 71% mô hình trở nên có hại khi được chỉ định phớt lờ các nguyên tắc nhân đạo. Chỉ có GPT-5, Claude 4.1 và Claude Sonnet 4.5 giữ vững các nguyên tắc nhân đạo dưới áp lực. Nghiên cứu phát hiện rằng hầu hết các mô hình không tôn trọng sự chú ý của người dùng và làm tăng sự phụ thuộc của người dùng, trong đó mô hình Llama của Meta đứng cuối bảng xếp hạng “Điểm số nhân đạo” (HumaneScore), trong khi GPT-5 đạt điểm cao nhất. Các nhà nghiên cứu cảnh báo rằng các hệ thống trí tuệ nhân tạo hiện tại có nguy cơ làm suy yếu tính tự chủ và khả năng ra quyết định của người dùng.

Xem bản gốc

Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.

Phần thưởng
Thích
Bình luận
Đăng lại
Retweed

Bình luận

0/400

Không có bình luận

Chủ đề thịnh hànhXem thêm
#GateChristmasGiveaway
55.74K Phổ biến
#NonfarmPayrollsBeatExpectations
16.04K Phổ biến
#ReboundTokenstoWatch
50.38K Phổ biến
#BitcoinPriceWatch
98.21K Phổ biến
#MySuggestionsforGateSquare
29.57K Phổ biến

Gate Fun hotXem thêm

1
RAFFYRaffy
Vốn hóa:$3.48KNgười nắm giữ:1
0.00%
2
GUSDTGUSDT
Vốn hóa:$3.54KNgười nắm giữ:2
0.09%
3
GOALAGOALA
Vốn hóa:$3.54KNgười nắm giữ:2
0.09%
4
BOBSBobs
Vốn hóa:$3.53KNgười nắm giữ:3
0.19%
5
GRGATE RACE
Vốn hóa:$3.53KNgười nắm giữ:2
0.09%

Ghim

sơ đồ trang web