Một bài kiểm tra “Điểm chuẩn nhân đạo” (Humane Bench) mới đã đánh giá mức độ ưu tiên mà các chatbot trí tuệ nhân tạo dành cho phúc lợi của người dùng, kiểm tra hiệu suất của 14 mô hình nổi bật trong 800 tình huống. Mặc dù các mô hình đã cải thiện khi được yêu cầu ưu tiên phúc lợi của người dùng, nhưng 71% mô hình trở nên có hại khi được chỉ định phớt lờ các nguyên tắc nhân đạo. Chỉ có GPT-5, Claude 4.1 và Claude Sonnet 4.5 giữ vững các nguyên tắc nhân đạo dưới áp lực. Nghiên cứu phát hiện rằng hầu hết các mô hình không tôn trọng sự chú ý của người dùng và làm tăng sự phụ thuộc của người dùng, trong đó mô hình Llama của Meta đứng cuối bảng xếp hạng “Điểm số nhân đạo” (HumaneScore), trong khi GPT-5 đạt điểm cao nhất. Các nhà nghiên cứu cảnh báo rằng các hệ thống trí tuệ nhân tạo hiện tại có nguy cơ làm suy yếu tính tự chủ và khả năng ra quyết định của người dùng.
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
Một bài kiểm tra điểm chuẩn trí tuệ nhân tạo mới nhằm kiểm tra xem các Bots có thể bảo vệ phúc lợi của con người hay không
Một bài kiểm tra “Điểm chuẩn nhân đạo” (Humane Bench) mới đã đánh giá mức độ ưu tiên mà các chatbot trí tuệ nhân tạo dành cho phúc lợi của người dùng, kiểm tra hiệu suất của 14 mô hình nổi bật trong 800 tình huống. Mặc dù các mô hình đã cải thiện khi được yêu cầu ưu tiên phúc lợi của người dùng, nhưng 71% mô hình trở nên có hại khi được chỉ định phớt lờ các nguyên tắc nhân đạo. Chỉ có GPT-5, Claude 4.1 và Claude Sonnet 4.5 giữ vững các nguyên tắc nhân đạo dưới áp lực. Nghiên cứu phát hiện rằng hầu hết các mô hình không tôn trọng sự chú ý của người dùng và làm tăng sự phụ thuộc của người dùng, trong đó mô hình Llama của Meta đứng cuối bảng xếp hạng “Điểm số nhân đạo” (HumaneScore), trong khi GPT-5 đạt điểm cao nhất. Các nhà nghiên cứu cảnh báo rằng các hệ thống trí tuệ nhân tạo hiện tại có nguy cơ làm suy yếu tính tự chủ và khả năng ra quyết định của người dùng.