Quét để tải ứng dụng Gate
qrCode
Thêm tùy chọn tải xuống
Không cần nhắc lại hôm nay

Một bài kiểm tra điểm chuẩn trí tuệ nhân tạo mới nhằm kiểm tra xem các Bots có thể bảo vệ phúc lợi của con người hay không

Một bài kiểm tra “Điểm chuẩn nhân đạo” (Humane Bench) mới đã đánh giá mức độ ưu tiên mà các chatbot trí tuệ nhân tạo dành cho phúc lợi của người dùng, kiểm tra hiệu suất của 14 mô hình nổi bật trong 800 tình huống. Mặc dù các mô hình đã cải thiện khi được yêu cầu ưu tiên phúc lợi của người dùng, nhưng 71% mô hình trở nên có hại khi được chỉ định phớt lờ các nguyên tắc nhân đạo. Chỉ có GPT-5, Claude 4.1 và Claude Sonnet 4.5 giữ vững các nguyên tắc nhân đạo dưới áp lực. Nghiên cứu phát hiện rằng hầu hết các mô hình không tôn trọng sự chú ý của người dùng và làm tăng sự phụ thuộc của người dùng, trong đó mô hình Llama của Meta đứng cuối bảng xếp hạng “Điểm số nhân đạo” (HumaneScore), trong khi GPT-5 đạt điểm cao nhất. Các nhà nghiên cứu cảnh báo rằng các hệ thống trí tuệ nhân tạo hiện tại có nguy cơ làm suy yếu tính tự chủ và khả năng ra quyết định của người dùng.

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
0/400
Không có bình luận
  • Gate Fun hotXem thêm
  • Vốn hóa:$3.48KNgười nắm giữ:1
    0.00%
  • Vốn hóa:$3.54KNgười nắm giữ:2
    0.09%
  • Vốn hóa:$3.54KNgười nắm giữ:2
    0.09%
  • Vốn hóa:$3.53KNgười nắm giữ:3
    0.19%
  • Vốn hóa:$3.53KNgười nắm giữ:2
    0.09%
  • Ghim
Giao dịch tiền điện tử mọi lúc mọi nơi
qrCode
Quét để tải xuống ứng dụng Gate
Cộng đồng
Tiếng Việt
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)