Google DeepMind đã giới thiệu bước đi đầy tham vọng mới nhất của mình hướng tới Trí tuệ Nhân tạo Tổng quát (AGI) với việc công bố SIMA 2 (Đại lý Được Mở Rộng, Có Thể Hướng Dẫn, Đa Thế Giới). Sử dụng mô hình Gemini AI mạnh mẽ, SIMA 2 được thiết kế để học hỏi, thích ứng và suy luận như một người chơi con người trong một loạt các thế giới 3D ảo đa dạng, đặc biệt là các trò chơi điện tử như No Man’s Sky và Valheim. Nghiên cứu này đánh dấu một bước tiến lớn so với các hệ thống AI trước đây, thường chỉ được đào tạo hẹp cho các nhiệm vụ cụ thể.
Bằng cách tích hợp các hướng dẫn ngôn ngữ tự nhiên với hiểu biết về thế giới 3D phức tạp, SIMA 2 có thể diễn giải và thực hiện các lệnh mở trong các môi trường trò chơi không quen thuộc, tái hiện gần gũi các kỹ năng giải quyết vấn đề thích ứng của một người chơi.
Học hỏi và Thích nghi theo Thời gian Thực
Sự đổi mới cốt lõi của SIMA 2 nằm ở khả năng tổng quát hóa kiến thức đã thu được trong một môi trường và áp dụng nó vào một môi trường hoàn toàn mới - một đặc điểm quan trọng của trí thông minh con người được gọi là học liên tục. Khả năng này cho phép tác nhân vượt ra ngoài các kịch bản đã được xác định trước và giải quyết các tình huống mới chỉ dựa trên các hướng dẫn bằng ngôn ngữ tự nhiên.
Thành công của đại lý trong các tựa game đa dạng, bao gồm Goat Simulator 3, chứng tỏ khả năng hiểu biết hình ảnh và không gian tiên tiến của nó. Bằng cách hoạt động như một người chơi khác trong trò chơi, thay vì thay thế logic trò chơi cốt lõi, SIMA 2 hoạt động như một nền tảng thử nghiệm mạnh mẽ cho các kỹ năng có thể nhanh chóng chuyển đổi thành các ứng dụng thực tế. Tầm nhìn của DeepMind là những nguyên tắc cơ bản tương tự dẫn dắt các chuyển động và quyết định ảo của SIMA 2 sẽ là điều cần thiết cho thế hệ tiếp theo của robotics thông minh, đa năng và các hệ thống điều hướng tự động.
Con Đường Đến Tư Duy Hiện Thân
Trong khi DeepMind ca ngợi SIMA 2 như một bước tiến quan trọng, nghiên cứu cũng đã chỉ ra những hạn chế hiện tại, bao gồm những khó khăn với các nhiệm vụ dài, đa bước và những thách thức liên quan đến quản lý bộ nhớ trong các môi trường 3D rất phức tạp. Những phát hiện này cung cấp một lộ trình rõ ràng cho sự phát triển trong tương lai về lý luận hiện thân - khả năng giống như con người để suy nghĩ và hành động trong một không gian vật lý ( hoặc mô phỏng ).
Mặc dù có những trở ngại này, SIMA 2 đại diện cho một bước tiến mạnh mẽ trong việc tạo ra các hệ thống có thể lý luận, lập kế hoạch và hợp tác hiệu quả. Ứng dụng của nó trong các thế giới ảo cung cấp một môi trường với rủi ro thấp và dữ liệu cao để đào tạo các tác nhân tinh vi cần thiết để điều hướng và tương tác với thế giới vật lý, cuối cùng thúc đẩy hành trình hướng tới AGI.
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
Google DeepMind Ra Mắt SIMA 2: Một Đại Lý AI Giống Như Con Người Cho Các Thế Giới Ảo
Google DeepMind đã giới thiệu bước đi đầy tham vọng mới nhất của mình hướng tới Trí tuệ Nhân tạo Tổng quát (AGI) với việc công bố SIMA 2 (Đại lý Được Mở Rộng, Có Thể Hướng Dẫn, Đa Thế Giới). Sử dụng mô hình Gemini AI mạnh mẽ, SIMA 2 được thiết kế để học hỏi, thích ứng và suy luận như một người chơi con người trong một loạt các thế giới 3D ảo đa dạng, đặc biệt là các trò chơi điện tử như No Man’s Sky và Valheim. Nghiên cứu này đánh dấu một bước tiến lớn so với các hệ thống AI trước đây, thường chỉ được đào tạo hẹp cho các nhiệm vụ cụ thể.
Bằng cách tích hợp các hướng dẫn ngôn ngữ tự nhiên với hiểu biết về thế giới 3D phức tạp, SIMA 2 có thể diễn giải và thực hiện các lệnh mở trong các môi trường trò chơi không quen thuộc, tái hiện gần gũi các kỹ năng giải quyết vấn đề thích ứng của một người chơi.
Học hỏi và Thích nghi theo Thời gian Thực
Sự đổi mới cốt lõi của SIMA 2 nằm ở khả năng tổng quát hóa kiến thức đã thu được trong một môi trường và áp dụng nó vào một môi trường hoàn toàn mới - một đặc điểm quan trọng của trí thông minh con người được gọi là học liên tục. Khả năng này cho phép tác nhân vượt ra ngoài các kịch bản đã được xác định trước và giải quyết các tình huống mới chỉ dựa trên các hướng dẫn bằng ngôn ngữ tự nhiên.
Thành công của đại lý trong các tựa game đa dạng, bao gồm Goat Simulator 3, chứng tỏ khả năng hiểu biết hình ảnh và không gian tiên tiến của nó. Bằng cách hoạt động như một người chơi khác trong trò chơi, thay vì thay thế logic trò chơi cốt lõi, SIMA 2 hoạt động như một nền tảng thử nghiệm mạnh mẽ cho các kỹ năng có thể nhanh chóng chuyển đổi thành các ứng dụng thực tế. Tầm nhìn của DeepMind là những nguyên tắc cơ bản tương tự dẫn dắt các chuyển động và quyết định ảo của SIMA 2 sẽ là điều cần thiết cho thế hệ tiếp theo của robotics thông minh, đa năng và các hệ thống điều hướng tự động.
Con Đường Đến Tư Duy Hiện Thân
Trong khi DeepMind ca ngợi SIMA 2 như một bước tiến quan trọng, nghiên cứu cũng đã chỉ ra những hạn chế hiện tại, bao gồm những khó khăn với các nhiệm vụ dài, đa bước và những thách thức liên quan đến quản lý bộ nhớ trong các môi trường 3D rất phức tạp. Những phát hiện này cung cấp một lộ trình rõ ràng cho sự phát triển trong tương lai về lý luận hiện thân - khả năng giống như con người để suy nghĩ và hành động trong một không gian vật lý ( hoặc mô phỏng ).
Mặc dù có những trở ngại này, SIMA 2 đại diện cho một bước tiến mạnh mẽ trong việc tạo ra các hệ thống có thể lý luận, lập kế hoạch và hợp tác hiệu quả. Ứng dụng của nó trong các thế giới ảo cung cấp một môi trường với rủi ro thấp và dữ liệu cao để đào tạo các tác nhân tinh vi cần thiết để điều hướng và tương tác với thế giới vật lý, cuối cùng thúc đẩy hành trình hướng tới AGI.