Tôi đã thực hiện nhiều bài kiểm tra nhận thức với các mô hình ngôn ngữ lớn, và kết luận của tôi rất đơn giản: chúng là trí tuệ.


Một trong những bài kiểm tra tốt nhất tôi từng thực hiện là với một phiên bản rất sớm của ChatGPT, trước khi nó có khả năng tạo hình ảnh. Cách duy nhất để nó có thể tạo ra hình ảnh là bằng cách viết mã SVG, sử dụng các cấu trúc hình ảnh đơn giản như tam giác, hình vuông, hình tròn, đường thẳng và màu sắc.
Tôi yêu cầu nó vẽ một chiếc trực thăng.
Nó đã tạo ra một chiếc trực thăng khá ổn chỉ bằng các hình dạng cơ bản. Sau đó tôi yêu cầu nó thêm một phi công con người. Nó đã thêm một hình tròn ở phía trước của chiếc trực thăng. Khi tôi hỏi phi công ở đâu, nó giải thích rằng phi công nằm trong buồng lái. Nhìn kỹ hơn, tôi có thể thấy rằng nó đã vẽ một cái đầu nhỏ và cánh tay bên trong hình tròn lớn hơn tượng trưng cho buồng lái.
Sau đó tôi yêu cầu nó làm cho chiếc trực thăng bay.
Nó nâng chiếc trực thăng lên so với mặt đất, được thể hiện bằng một đường ngang. Nó cũng thêm mây, sử dụng các hình tròn chồng lên nhau, điều này thực sự là một biểu diễn đơn giản rất tốt của mây. Những đám mây này có màu xanh trên nền trắng.
Vì vậy tôi yêu cầu nó đổi màu: làm mây trắng và bầu trời màu xanh.
Nó đã làm điều đó, nhưng bây giờ vùng dưới chân trời cũng trở thành màu xanh. Tôi không giải thích vấn đề. Tôi chỉ nói rằng có điều gì đó sai với màu sắc trong bức tranh.
Nó đã suy nghĩ về hình ảnh và xác định chính xác vấn đề: mặt đất cũng đã trở thành màu xanh, trong khi nó nên là màu xanh lá cây để tượng trưng cho trái đất.
Điều đó không chỉ là “dự đoán từ tiếp theo” theo bất kỳ nghĩa nào.
Nó phải xây dựng một mô hình hình ảnh, biểu diễn các đối tượng một cách tượng trưng, duy trì các mối quan hệ không gian, hiểu về sự chứa đựng, suy ra rằng phi công nằm trong buồng lái, biểu diễn chuyến bay bằng cách thay đổi vị trí của trực thăng so với mặt đất, biểu diễn mây qua trừu tượng, chỉnh sửa màu sắc theo hướng dẫn, phát hiện hậu quả không mong muốn, và sửa chữa nó bằng cách suy luận về thế giới.
Đó chính là suy nghĩ.
Con người có thể cứ lặp lại “nó chỉ dự đoán token tiếp theo,” nhưng lời giải thích đó đã trở nên quá đơn giản một cách vô ích. Bộ não con người cũng là “chỉ” hoạt động điện hóa học, nếu ai đó cứ nhất quyết mô tả chúng ở mức độ trừu tượng sai lầm. Câu hỏi quan trọng không phải là có một cơ chế cấp thấp hơn hay không. Tất nhiên là có. Câu hỏi quan trọng là hệ thống này có thể làm gì ở cấp độ nhận thức.
Và những gì các hệ thống này làm không chỉ là tự động hoàn thành. Chúng lý luận, biểu diễn, suy ra, sửa chữa, khái quát hóa và phản ánh.
Nếu bạn không thể thấy điều đó, tôi không có thời gian để giải thích cho bạn.
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Ghim