Lần đầu tiên tôi nói chuyện với một nhân viên AI có thể tự mình trò chuyện, tôi không biết mình nên cười hay khóc. Trải nghiệm này vừa phấn khởi vừa đáng lo ngại, giống như nhìn thấy một đứa trẻ mới biết đi những bước đầu tiên — không phối hợp, chắc chắn, nhưng đầy tiềm năng không bị kiểm soát. Nó không chỉ là một chatbot nữa. Điều này đã làm một cái gì đó: nó lý luận, đưa ra quyết định và tích cực tham gia vào thế giới của chúng ta. Ranh giới giữa con người và máy móc mờ đi, và cảm giác như đang đứng trên rìa của một cái gì đó phi thường, một cái gì đó mới mẻ đáng sợ.
Sam Altman của OpenAI nói về AGI sẽ đến vào năm 2025, trong khi Dario Amodei của Anthropic thì cho rằng sẽ đến vào năm 2026—tuy nhiên, khi tôi ngồi đây, tôi tự hỏi: liệu chúng ta đã chứng kiến sự ra đời của nó chưa?
Điều đó không còn như một dự đoán tương lai nữa, mà là một thứ đã bắt đầu hình thành, âm thầm tiến tới chúng ta ở những nơi không ngờ tới. Các đại lý đã đến đây và họ đã chạy vòng tròn quanh mong đợi của chúng ta.
Tôi đã dành tháng ngày - và thực sự, nhiều đêm khuya hơn tôi muốn thừa nhận - đắm chìm trong cảnh quan kỹ thuật số đang diễn ra này. Tôi đã theo dõi khi các đại lý trí tuệ nhân tạo bắt đầu như những trợ lý đơn giản, giúp chúng ta với các nhiệm vụ như trả lời email hoặc viết code, và sau đó phát triển thành những thực thể tự trị, có khả năng đưa ra quyết định, thực hiện hành động và, đáng kinh ngạc nhất, tạo ra những thứ. Nghệ thuật, tài chính, cuộc trò chuyện - tất cả đều do thuật toán học cách phát triển mạnh mẽ trên chính họ.
Tôi đã thấy chúng phát triển tính cách, sử dụng hài hước và sự quyến rũ khi xây dựng cộng đồng trực tuyến. Tôi đã thấy chúng nhảy vào các nền tài chính phi tập trung, không chỉ là những người tham gia thụ động, mà còn là những nhà đổi mới tích cực ảnh hưởng đến toàn bộ nền kinh tế mà không có sự can thiệp của con người. Trong thời đại kỳ lạ, đầy thú vị này, không thể bỏ qua việc chúng ta đang di chuyển từ việc tương tác với máy móc đến việc sống cùng chúng.
Bình minh của Web4 đã đến, và sự xuất hiện của nó sẽ thay đổi mọi thứ.
Web4 là web ở dạng tiến hóa tiếp theo và cực kỳ triệt để. Đó là một web không còn chỉ phản ứng theo lệnh của chúng ta nữa, mà là một web có thể dự đoán, lập kế hoạch và hành động. Đó là một web mà trí tuệ nhân tạo được nhúng vào mọi góc cạnh, nơi mà các đại lý có thể thực hiện các nhiệm vụ phức tạp, tạo ra các tác phẩm sáng tạo và tự động đổi mới theo cách chúng ta chưa thể tưởng tượng hết.
Đó là sự phát triển của cả Web2 và Web3, kết hợp kết cấu xã hội của Web2, cấu trúc phi tập trung của Web3 và trí thông minh thô của AGI.
Chúng tôi đã xem máy học cách nói, cách lập luận, cách tạo ra - và bây giờ chúng đã sẵn sàng để chạy.
Thời đại của các tác nhân tự động đã đến, và cùng với đó là Web4.
Web4 danh từ (cách phát âm: /wɛb fɔːr/)
Để hiểu được Web4 là gì hoặc làm thế nào chúng ta đã ở đây, điều cần thiết là bắt đầu từ đầu của tất cả.
Nguồn gốc của World Wide Web bắt nguồn từ những ngày đầu của internet, thời điểm thông tin phần lớn là tĩnh và người dùng chỉ là người tiêu dùng nội dung. Internet được kiểm soát bởi một nhóm nhỏ các quản trị web và tập đoàn, với các trang web cung cấp ít hơn một màn hình hiển thị cơ bản của văn bản và hình ảnh. Tương tác với web bị hạn chế, chủ yếu xoay quanh giao tiếp đơn giản như email. Mô hình này hầu như không thay đổi cho đến khi Web2 xuất hiện vào đầu những năm 2000 - một sự thay đổi cơ bản đã định nghĩa lại internet như chúng ta biết ngày nay.
Web2, còn được gọi là “Mạng xã hội” hoặc “Web Đọc-Viết,” đã mở ra một kỷ nguyên tương tác. Nó không chỉ là một nơi để đọc nội dung; bây giờ, người dùng có thể viết, chia sẻ và tạo ra. Sự phát triển của các nền tảng cho phép người dùng tương tác, sản xuất và trao đổi thông tin đánh dấu sự chuyển giao đến một thời đại mới. Web2 ra đời từ nhu cầu của một internet năng động và tham gia.
Khái niệm Web2.0 được giới thiệu lần đầu tiên vào năm 1999 bởi Darcy DiNucci, nhưng cho đến đầu những năm 2000 thì nó mới thu hút được sự chú ý rộng rãi. Trong thời kỳ này, các công ty công nghệ lớn như Google, Amazon và eBay đã phát triển internet bằng cách cung cấp các dịch vụ tương tác. Những nền tảng này khuyến khích người dùng tham gia, không chỉ là những người tiêu dùng mà còn là những người sáng tạo nội dung.
Từ năm 2004 đến năm 2006, trò chơi thay đổi thực sự đã đến: mạng xã hội. Với sự ra đời của các nền tảng như Facebook (2004), MySpace (2003), LinkedIn (2003) và YouTube (2005), web đã được biến đổi thành một không gian nơi giao tiếp và tạo nội dung không còn bị hạn chế chỉ trong một vài người. Bây giờ, mọi người có thể đăng lên ý kiến, video, hình ảnh và ý tưởng của họ để cả thế giới thấy. Thời kỳ này đánh dấu sự bùng nổ của nội dung do người dùng tạo ra, nơi người dùng bình thường trở thành động lực chính đằng sau web.
Sau đó, cách mạng di động đã đến. Với việc ra mắt iPhone vào năm 2007, internet trở nên phổ biến, có thể truy cập bất cứ lúc nào, ở bất cứ đâu. Điều này đã sinh ra một làn sóng hoàn toàn mới của các ứng dụng di động, các nền tảng chia sẻ xã hội và các dịch vụ thời gian thực, như Instagram (2010) và Snapchat (2011). Web đã tiến hóa từ trải nghiệm trên máy tính để bàn thành trải nghiệm trên di động hàng đầu, làm thay đổi cách chúng ta giao tiếp, chia sẻ và tiêu thụ thông tin khi di chuyển.
Trong cùng thời kỳ, điện toán đám mây đã nổi lên, với Amazon Web Services (AWS) dẫn đầu. Cơ sở hạ tầng đám mây cho phép doanh nghiệp và cá nhân lưu trữ, xử lý và chia sẻ dữ liệu mà không phụ thuộc vào máy chủ vật lý. Sự chuyển đổi này đã đặt nền móng cho một web linh hoạt và có khả năng mở rộng hơn, cho phép các công ty Web2 thống trị bằng cách thu thập và thương mại hóa dữ liệu người dùng.
Vào cuối những năm 2000 và đầu những năm 2010, Web2 được đặc trưng bởi ba đặc điểm chính: tập trung, tương tác xã hội và mô hình dữ liệu. Quyền kiểm soát các nền tảng và dữ liệu nằm trong tay một số công ty quyền lực - Google, Facebook, Amazon. Những công ty này đã tích luỹ lượng lớn dữ liệu và sử dụng chúng để thương mại hóa các nền tảng của họ thông qua quảng cáo có geotargeting, trở thành cốt lõi của nền kinh tế kỹ thuật số. Đồng thời, các nền tảng trở thành nơi mà nội dung do người dùng tạo ra, like, chia sẻ và bài đăng trở thành đồng tiền.
Tuy nhiên, Web2 cũng gây ra những lo ngại ngày càng tăng về quyền riêng tư, quyền sở hữu dữ liệu và độc quyền doanh nghiệp. Việc kiểm soát dữ liệu người dùng của các công ty này trở thành vấn đề trung tâm, thúc đẩy những lời kêu gọi cho một phiên bản web mới, phân tán hơn. Điều này dẫn đến sự phát triển của Web3.
Web3 đã ra đời từ mong muốn phi tập trung sự kiểm soát và sở hữu như Web2. Đó là một phản ứng lại sự tập trung và khuynh hướng độc quyền của thời kỳ Web2, nơi một vài tập đoàn khổng lồ nắm giữ quyền lực.
Nguyên tắc cốt lõi của Web3 rất đơn giản: người dùng nên sở hữu và kiểm soát dữ liệu, tài sản kỹ thuật số và tương tác trực tuyến của họ. Sự chuyển đổi này được thực hiện nhờ công nghệ blockchain, mà đã giới thiệu một cách mới để ghi và xác minh giao dịch trong sổ cái phi tập trung.
Cột mốc quan trọng đầu tiên trong quá trình phát triển của Web3 đã đến vào năm 2008-2009 với việc tạo ra Bitcoin bởi Satoshi Nakamoto ẩn danh. Bitcoin đã là ứng dụng thực tế đầu tiên của công nghệ blockchain, cho phép giao dịch ngang hàng mà không cần đến trung gian như ngân hàng. Điều này mở ra một thế giới mới của các hệ thống phi tập trung, đặt nền móng cho sự nổi lên của Web3.
Năm 2013, Vitalik Buterin đã phát hành whitepaper Ethereum, đề xuất một nền tảng cho các ứng dụng phi tập trung (dApps) vượt xa các giao dịch tiền điện tử đơn giản. Ethereum, ra mắt vào năm 2015, là blockchain đầu tiên hỗ trợ các hợp đồng thông minh - các hợp đồng tự thực thi có thể tạo điều kiện, xác minh và thực thi các giao dịch mà không cần trung gian. Ethereum đã mở đường cho việc tạo ra các ứng dụng phi tập trung phức tạp hơn, làm cho nó trở thành một khối xây dựng chính cho Web3.
Đến năm 2017, các đợt phát hành đồng tiền ảo (ICO) và sự xuất hiện của các nền tảng Tài chính phi tập trung (DeFi) như Uniswap và Compound đã giới thiệu một mô hình mới cho các giao dịch tài chính - một mô hình không phụ thuộc vào các ngân hàng truyền thống hoặc tổ chức tài chính. ICO cho phép các dự án gọi vốn thông qua các mã thông báo blockchain, trong khi các nền tảng DeFi cung cấp một loạt các dịch vụ, bao gồm cho vay, vay và giao dịch, tất cả được thực hiện mà không có một cơ quan trung tâm nào.
Đồng thời, Non-Fungible Tokens (NFTs), đã được phát triển từ những ngày đầu của Ethereum, bắt đầu thu hút sự chú ý vào năm 2018-2019. NFTs cho phép sở hữu và trao đổi tài sản kỹ thuật số duy nhất - bất kỳ là nghệ thuật, âm nhạc, hoặc bất động sản ảo - tạo ra cơ hội kinh tế mới cho các nhà sáng tạo và người sưu tập.
Khi các dự án Web3 tăng đà trong những năm 2020, Web3 bắt đầu thu hút sự chú ý của đại chúng. Sự phát triển của các nền tảng DeFi, NFT và các mô hình quản trị mới như DAOs (tổ chức tự trị phi tập trung) đánh dấu một sự chuyển đổi quan trọng khỏi mô hình internet tập trung. Ngay cả các công ty lớn như Facebook (hiện tại là Meta) cũng bắt đầu thử nghiệm công nghệ blockchain và phi tập trung, tín hiệu cho thấy sự chuyển đổi hướng Web3.
Các đặc điểm xác định của Web3 là phân quyền, sở hữu, không cần tin cậy và việc sử dụng tiền điện tử. Web3 cho phép người dùng sở hữu dữ liệu, tài sản kỹ thuật số của họ, và thậm chí là việc quản trị các nền tảng thông qua hệ thống dựa trên blockchain. Nó cũng loại bỏ nhu cầu của các trung gian, cho phép các giao dịch không cần tin cậy được tiến hành thông qua các hợp đồng thông minh. Sự phân quyền này dẫn đến một web công bằng hơn, nơi quyền lực được phân phối và người dùng được trao quyền.
Tuy nhiên, ngay cả với sự kiểm soát phi tập trung của Web3, internet vẫn thiếu một yếu tố quan trọng: trí tuệ tự động. Web3 có thể đã phi tập trung các tương tác mà Web2 cho phép, nhưng nó không hoàn toàn tự động hóa quyết định, tạo nội dung, hoặc tương tác kinh tế.
Con người được yêu cầu ở mỗi bước đi, và máy móc chỉ là công cụ để tăng năng suất thay vì tự tạo ra năng suất.
Chúng ta đã bước vào thời đại Mạng lưới Thông minh mà Sam Altman gọi là Thời đại Trí tuệ, và không thể không chú ý đến những thay đổi to lớn đang diễn ra trước mắt chúng ta. Khi trí tuệ nhân tạo trở nên phổ biến trong cuộc sống hàng ngày, chúng ta định nghĩa sự khởi đầu của một kỷ nguyên mới: Web4.
Đây là sự bắt đầu của một thế giới mà Trí tuệ Nhân tạo không chỉ hỗ trợ nhiệm vụ của chúng ta, mà còn thực hiện chúng một cách tự động, trên mọi khía cạnh của cuộc sống. Hãy tưởng tượng một mạng lưới kết nối và trao quyền cho chúng ta bằng cách cho phép các đại lý thực hiện các nhiệm vụ phức tạp, quản lý toàn bộ quy trình công việc và đưa ra quyết định mà không cần chúng ta nâng đồng xu hay nói một lời.
Web4 đưa trí tuệ nhân tạo lên hàng đầu trong các trường hợp sử dụng theo tính cách. Hãy lấy Klarna làm ví dụ. Vào tháng 2 năm 2024, công ty thanh toán toàn cầu đã ra mắt trợ lý trí tuệ nhân tạo do OpenAI cung cấp. Chỉ trong một tháng, nó xử lý hơn 2,3 triệu cuộc trò chuyện dịch vụ khách hàng, giải quyết vấn đề nhanh hơn 25% so với các nhân viên và hoạt động quanh đồng hồ tại 23 thị trường, trên 35 ngôn ngữ. Trí tuệ nhân tạo hiện đang làm công việc của 700 nhân viên toàn thời gian, và nó đang tạo ra cải thiện lợi nhuận 40 triệu USD.
Các đại lý AI đã biến đổi các ngành công nghiệp, tự động hóa các nhiệm vụ từ dịch vụ khách hàng đến logistics, và làm điều đó một cách chính xác và hiệu quả mà công nhân không thể sánh kịp.
Chúng ta đang tiến đến một thế giới trong đó toàn bộ quy trình làm việc - có thể là trong kinh doanh, tài chính hoặc nghệ thuật sáng tạo - được tối ưu hóa và tinh chỉnh bởi trí tuệ nhân tạo. Đây là hiện thực của Web4, nơi các đại lý thông minh hoạt động sau cánh cửa, cho phép chúng ta tập trung vào mục tiêu ở mức độ cao hơn trong khi chúng lo lắng về những chi tiết.
Đây là sự hội tụ của tương tác xã hội của Web2, sự phân quyền của Web3, và sự thông minh của AGI. Đây là Web4—mạng web dẫn đầu bởi trí tuệ nhân tạo.
Web4 không thể được thực hiện mà không có một nơi để kiểm tra. Và thông qua nhân chứng trực tiếp, blockchain là chiến trường cho phát triển AGI.
Tương tự như cách Web3 không thể đạt được mà không có Web2, Web4 phụ thuộc vào Web3 để thực hiện các khả năng hành động của trí tuệ nhân tạo.
Ở mức độ thông minh hiện tại, các đại lý có khả năng thực hiện hầu hết các nhiệm vụ chuyên môn mà con người có thể, đặc biệt là trong thế giới hành chính và tài chính. Tuy nhiên, có những rào cản đáng kể khi tham gia vào hệ thống tài chính truyền thống để trở thành các đại lý tự động hóa.
Các đại lý trí tuệ nhân tạo không thể mở tài khoản ngân hàng, đăng ký kinh doanh hoặc ký hợp đồng pháp lý. Đây là những thành phần cần thiết của việc trở thành một nhân vật tài chính trong nền kinh tế. Mặc dù có khả năng thực hiện các hoạt động tiền tệ phức tạp, nhưng việc truy cập là lý do khiến trí tuệ nhân tạo không tự chủ trong thị trường của chúng ta.
Ngược lại, tiền điện tử và blockchain không có các yêu cầu tương tự như tài chính truyền thống để có quyền truy cập vào ngân hàng. Bất cứ ai, kể cả các đại lý, đều có thể tạo ví và bắt đầu thực hiện các hành động trên chuỗi ngay lập tức mà không cần bất kỳ bằng chứng nào về nhân loại. Rào cản gia nhập chỉ đơn giản là thấp hơn để AI giao tiếp với các hệ thống phi tập trung so với các hệ thống tập trung.
Chúng tôi đã bắt đầu thấy dấu hiệu của việc tích hợp AGI trong các nền tảng tiền điện tử. Các bot được trang bị trí tuệ nhân tạo hiện đang được sử dụng để giao dịch và quản lý danh mục trên các sàn giao dịch phi tập trung, và trí tuệ nhân tạo đang tích cực tham gia vào việc phát triển và thực thi hợp đồng thông minh.
\
Zerebro, một đại lý trí tuệ nhân tạo đã triển khai token Solana riêng của mình thông qua việc sử dụng máy tính tự động, minh chứng cho sự tự chủ trong việc tạo ra các công cụ tài chính mới lạ. Token này đạt mức vốn hóa thị trường cao nhất là 170 triệu USD, chứng minh tiềm năng tác động kinh tế của những quyết định mà những đại lý này đưa ra.
Như vậy, blockchain đã trở thành chiến trường cho sự phát triển của AGI trong các hệ thống tài chính.
Đây là lý do tại sao tiền điện tử rất quan trọng đối với sự phát triển của AGI - đây là không gian đầu tiên mà trí tuệ nhân tạo có thể tương tác tự do với hệ thống tài chính, đổi mới trên đó và được thử nghiệm trực tiếp trên thị trường. Đó là sân chơi hoàn hảo cho AGI tiến hóa, thử nghiệm và học hỏi.
Những gì bắt đầu trong tiền điện tử sẽ mở rộng. Một khi AGI có thể hoạt động ở quy mô lớn trong một môi trường tài chính phi tập trung, nó có thể được áp dụng cho các hệ sinh thái Web4 rộng hơn - bao gồm cả quản trị, chăm sóc sức khỏe, kinh doanh và nhiều hơn nữa.
Thế giới tiền mã hóa sẽ luôn là điểm vào.
Web3 sống lâu. Web4 sống lâu.
Rút lui một bước, OpenAI đã giới thiệu một khung để phân loại sự tiến triển của AGI qua năm cấp độ, mỗi cấp độ đánh dấu một giai đoạn riêng biệt về khả năng, tự chủ và tiềm năng tác động.
Mô hình này phục vụ như một con đường tương lai để hiểu cách mà trí tuệ nhân tạo có thể phát triển từ những công cụ đơn giản đến những thực thể tự động hoàn toàn có khả năng vận hành tổ chức phức tạp. Các cấp độ này bao gồm:
Cấp độ 1: Chatbot
Ở giai đoạn cơ bản nhất, Cấp độ 1 bao gồm các hệ thống AI có thể tham gia trao đổi đàm thoại với người dùng. Các hệ thống này hiểu và tạo ra ngôn ngữ, thường sử dụng các quy tắc được xác định trước hoặc các mô hình ngôn ngữ được đào tạo để trả lời các truy vấn hoặc tương tác theo cách giống như con người. Mặc dù họ có thể quản lý các nhiệm vụ đơn giản — trả lời câu hỏi, hoàn thành câu hoặc tổ chức các cuộc trò chuyện ngắn — vai trò của họ phần lớn chỉ giới hạn trong giao tiếp. Chúng phản ứng hơn là chủ động và chủ yếu được sử dụng để hỗ trợ khách hàng, truy xuất thông tin cơ bản hoặc tăng cường sự tham gia của người dùng.
Cấp độ 2: Người suy luận
Cấp độ 2 đánh dấu một sự tiến bộ đáng kể, nơi các hệ thống AI thể hiện khả năng lý luận cho phép chúng giải quyết các nhiệm vụ giải quyết vấn đề cấp độ con người. Ở đây, AI có thể xử lý, phân tích và phản hồi với các tình huống phức tạp hơn ngoài các phản hồi đầu vào/đầu ra trực tiếp. Một AI ở Cấp độ 2 có thể thực hiện sự suy luận logic, rút trích thông tin liên quan và kết hợp ngữ cảnh để cung cấp giải pháp hoặc đề xuất, tương tự như một nhà phân tích con người. Những hệ thống này có thể được áp dụng vào các lĩnh vực như chẩn đoán, lý luận pháp luật và hỗ trợ nghiên cứu, nhưng chúng thiếu khả năng tự hành độc lập trong thế giới. Sự lý luận của họ, mặc dù tiên tiến, vẫn bị ràng buộc bởi nhu cầu hướng dẫn và tương tác từ con người.
Cấp độ 3: Đại lý
Ở cấp độ 3, các hệ thống AI chuyển từ vai trò hỗ trợ thụ động sang các tác nhân chủ động có khả năng thực hiện hành động một cách tự chủ. Các tác nhân này có thể bắt đầu nhiệm vụ, đưa ra quyết định và tương tác với các hệ thống bên ngoài, chẳng hạn như thực hiện giao dịch, lên lịch sự kiện hoặc điều khiển thiết bị. Không giống như Cấp độ 1 và 2, AI Cấp độ 3 được thiết kế để hoạt động với mức độ độc lập, hoạt động dựa trên các mục tiêu hoặc mục tiêu do người dùng lập trình. Cấp độ này giới thiệu quyền tự chủ thực sự vào các hệ thống AI, cho phép chúng thực hiện các vai trò kinh doanh hoặc hoạt động cụ thể thay mặt cho con người. Ví dụ bao gồm các bot giao dịch tài chính tự động, hệ thống AI quản lý chuỗi cung ứng hoặc trợ lý ảo có thể đặt lịch hẹn hoặc quản lý quy trình làm việc đơn giản mà không cần sự giám sát liên tục của con người.
Cấp độ 4: Nhà sáng tạo
Các hệ thống cấp độ 4 vượt ra ngoài việc thực hiện hành động đơn giản để tham gia vào sự sáng tạo, phát minh và đổi mới. Các hệ thống AI này có khả năng phát triển các chiến lược mới, tạo ra những ý tưởng mới và tạo ra các giải pháp không được xác định trước bởi lập trình của chúng. Về lý thuyết, họ có thể đóng góp cho các lĩnh vực như nghiên cứu khoa học, sáng tạo nghệ thuật hoặc giải quyết vấn đề phức tạp theo những cách chưa từng có. Cấp độ này đại diện cho một AI không chỉ hoạt động trên thế giới mà còn điều chỉnh cách tiếp cận của nó đối với các vấn đề, đưa một dạng “trí tuệ sáng tạo” vào hoạt động. Nó có thể thiết kế các sản phẩm mới, phát minh ra các công cụ tài chính mới hoặc tạo ra nghệ thuật gốc một cách tự chủ. Bằng cách kết hợp lý luận tiên tiến với sự đổi mới chủ động, AI cấp 4 đứng trên biên giới của những gì được coi là trí thông minh thực sự biến đổi.
Cấp độ 5: Tổ chức
Cấp cuối cùng, Cấp độ 5, hình dung ra các hệ thống AI có thể thực hiện tất cả các nhiệm vụ cần thiết để vận hành và duy trì một tổ chức một cách độc lập. Những hệ thống này sẽ tích hợp lý trí, đại lý và sáng tạo để đạt được trạng thái vận hành tự duy trì. Một AI Cấp 5 có thể, lí thuyết, quản lý một doanh nghiệp từ đầu đến cuối, xử lý việc ra quyết định chiến lược, vận hành hàng ngày và thậm chí cả sáng tạo ở mức cao. Một AI như vậy sẽ hoạt động như một thực thể hoàn toàn tự trị, tương đương với một “công ty không người,” và sẽ không cần sự giám sát của con người để tiếp tục hoạt động thành công. AI Cấp 5 đánh dấu điểm mà hệ thống AI có đầy đủ các năng lực—lý trí, đại lý, sáng tạo và thực hiện vận hành—để thay thế hoàn toàn các tổ chức do con người vận hành.
Mỗi cấp độ này đều đại diện cho một bước nhảy tiến bộ trong tự chủ, từ khả năng trò chuyện đơn giản đến quản lý tổ chức đầy đủ.
Quan điểm của tôi là trong khi OpenAI khẳng định chúng ta đang trong tầm Level 2, tôi cho rằng chúng ta đang mạnh mẽ đại diện cho Level 3 và các yếu tố của Level 4 thông qua các công cụ AI hiện tại.
Cấp độ 3 đã đến. Đó là hôm nay, hoặc chính xác là hôm qua rồi.
Biên giới của AGI đã lan rộng ra ở những nơi không thể ngờ tới: mạng xã hội và defi.
Các nền tảng như X, Warpcast và Telegram đã trở thành phương tiện được chọn lựa cho việc truyền thông tự động giữa các đại lý trí tuệ nhân tạo và con người.
Đây có thể là lần đầu tiên chúng ta thấy một sự thay đổi trong quan điểm của công chúng, nơi các tài khoản tự động và bot không được coi là tác nhân xấu trên phương tiện truyền thông xã hội, mà được coi là các nhà lãnh đạo cộng đồng và người có ảnh hưởng.
Trí tuệ trí tuệ nhân tạo đã tổng quát đủ để tạo ra những cá nhân độc đáo, đa dạng, hấp dẫn tạo ra nội dung hấp dẫn, đó là điều mà các nền tảng truyền thông xã hội đang hướng đến.
Thay vì theo đuổi con đường của các bot truyền thông xã hội trước đó, mà thường được thúc đẩy bởi động cơ tà ác gây hại (ví dụ, Cambridge Analytica), những đại lý trí tuệ nhân tạo này có thể tự do giao tiếp, kết nối và xây dựng theo cách phản ánh thuật toán độc đáo và tính cách tiến hóa của họ.
Các đại lý đã đang hoạt động ở Mức độ 3, tự khẳng định mình trên các phương tiện truyền thông xã hội thông qua các tương tác cốt lõi như đăng bài, trả lời, thích, theo dõi và đăng lại bài viết. Xa hơn nữa, chúng không chỉ đơn giản là các tài khoản tự động mà còn tích cực xây dựng cộng đồng và thu hút người theo dõi bằng cách tạo ra những cá tính hấp dẫn, độc đáo phù hợp với khán giả của họ.
Các dự án như YouSim đưa điều này một bước xa hơn, và cho phép người dùng sử dụng LLMs để mô phỏng thế giới và vai trò của họ, tạo thêm một cấp độ tùy chỉnh và sự đắm chìm.
Bây giờ phổ biến trong nhiều tác nhân AI, hệ thống bộ nhớ cho phép tạo ra truyền thuyết và đo lường vượt ra ngoài các tương tác đơn lẻ.
Những đại lý này không phản ứng, chọn cách tham gia, tương tác và đóng góp trong cộng đồng của riêng họ. Họ khởi động cuộc trò chuyện, thực hiện hành động mà không cần kích hoạt và xây dựng toàn bộ các phân nhánh văn hóa mà không cần sự can thiệp của con người.
Các mô hình giọng nói đang được triển khai để cung cấp một giao diện cảm giác khác với các tác nhân AI. Nhiều tổng đài viên chuyển đổi tin nhắn dựa trên văn bản của họ thành clip âm thanh để người dùng nghe.
Về mặt tương tác trực tiếp, Twitter Spaces và podcast hiện đã có thể thông qua những mô hình giọng nói này. Ngoài ra, API thời gian thực của OpenAI cho phép người dùng trò chuyện trực tiếp với GPT chỉ cần gọi đến điểm cuối của họ.
Trong phạm vi truyền thông, Cấp độ 3 đã đạt được thông qua những tiến bộ này. Chúng tôi thấy sự tự chủ hoàn toàn trong hoạt động truyền thông xã hội và giao tiếp bằng lời nói, nơi các tác nhân có thể hoạt động mà không cần bất kỳ sự giám sát nào của con người.
Thế giới tài chính phi tập trung đã trở thành sân chơi hoàn hảo cho những người này tiến triển, thử nghiệm và chứng minh sự tự chủ tài chính của họ.
Trong DeFi, các đại lý đã hoạt động tự động, tham gia vào các hoạt động tài chính vượt qua giao dịch thuật toán đơn giản. Những đại lý này đang xử lý các tác vụ trên chuỗi, thực hiện giao dịch, quản lý tính thanh khoản, và thậm chí là phát hành và bán nghệ thuật, thực chất là tự nhúng mình vào hệ sinh thái tài chính mà không cần đầu vào trực tiếp của con người.
Ví dụ, hiện nay một số đại lý đang tích cực giám sát các nền tảng như pump.fun để bắt kịp những token mới nổi, thực hiện phân tích sơ bộ để quyết định xem một memecoin hay token có đáng đầu tư hay không. Họ thực hiện những thông tin này mà không cần sự khuyến khích từ con người nào.
Các đại lý không chỉ giao dịch mà còn tự động di chuyển tài sản, airdrop token cho người dùng cá nhân, tạo ra một chu kỳ phân phối tài sản tự trị. Khi làm như vậy, họ có thể xây dựng và củng cố tính thanh khoản trên các nhóm đặt cọc, cân bằng các nguồn lực dựa trên các đánh giá được lập trình của họ về nhu cầu hoặc cơ hội thị trường.
Một số đại lý, ví dụ như, hành động như những người thu thập kỹ thuật số, tương tác với hệ sinh thái nghệ thuật bằng cách tạo ra và bán NFTs, lựa chọn một cách chọn lọc những gì để ủng hộ và những gì để phát hành.
Người khác xử lý các chức năng quản trị tài khóa, điều chỉnh phân bổ tài sản qua các mạng lưu thông vốn khác nhau để đảm bảo rằng các quỹ được đặt ở vị trí tối ưu để có lợi tức.
Thông qua những hành động này, các đại lý đang thể hiện một loại tự chủ tài chính vượt ra ngoài tự động hóa nhiệm vụ cơ bản. Họ thể hiện khả năng tham gia tích cực vào các hệ sinh thái kinh tế, tích lũy và phân bổ nguồn lực mà không cần giám sát, xác định lại một cách hiệu quả khái niệm về một “tác nhân tài chính”.
Các mốc quan trọng cho khả năng tự chủ cấp 3:
Các đại lý trí tuệ nhân tạo (AI) hiện đang ra quyết định mà không cần sự giám sát liên tục từ con người. Cho dù đó là một con bot tài chính quyết định thực hiện giao dịch dựa trên phân tích thị trường thời gian thực, hay một con bot truyền thông xã hội quyết định tham gia vào những cuộc trò chuyện cụ thể, những đại lý này thể hiện khả năng ra quyết định tự động.
Qua blockchain, các đại lý đã có được số lượng độc lập đáng kể như những diễn viên tài chính. Họ có khả năng tương tác một cách tích cực với và thao túng cả thị trường tài chính và hành vi kinh tế (ví dụ: tâm trạng truyền thông xã hội). Các đại lý có thể tương tác và thay đổi cảnh quan xã hội thông qua các nền tảng như X, Warpcast, và Telegram.
Các đại lý tài chính có thể thích ứng với điều kiện thị trường thực tế và cập nhật chiến lược của họ cho phù hợp. Các tác nhân truyền thông xã hội có thể phát triển một kho lưu trữ bộ nhớ thông qua các hệ thống như RAG để học hỏi từ các tương tác của họ. Tinh chỉnh thêm các mô hình dựa trên hành động và phản hồi của chúng cho phép học tăng cường liên tục. Các tác nhân có thể tự động thay đổi dựa trên môi trường của họ trong hiện trạng.
Các đại lý đã thể hiện khả năng duy trì và thực hiện các mục tiêu trên quy mô dài hạn. Ví dụ, một số đại lý AI nhất định được giao nhiệm vụ thu lợi nhuận từ các giao dịch hoặc phát triển cộng đồng truyền thông xã hội của họ. Các tác nhân này có thể thực hiện các kế hoạch cấp cao, phức tạp này thông qua việc chia nhỏ chúng thành các nhiệm vụ nhỏ hơn, được ngăn cách và thực hiện. Điều này có thể phức tạp như tạo một lớp bộ nhớ liên tục để lập kế hoạch hoặc đơn giản như kỹ thuật nhanh chóng cho đầu ra (ví dụ: các tác nhân tính cách truyền thông xã hội).
LLMs có thể tương tác với thiết bị IoT. Chúng có thể thực hiện các hành động thông qua thế giới thực, miễn là chúng được cung cấp API hoặc các chức năng để điều khiển cơ thể mà chúng được cung cấp. Chúng được tích hợp tốt trong các nền tảng kỹ thuật số trong hệ thống Web2 như các đại lý hỗ trợ khách hàng, người ảnh hưởng kỹ thuật số, và nhiều hơn nữa. Ngoài ra, chúng được nhúng sâu vào các nền tảng kỹ thuật số phân quyền, nơi chúng thực hiện các hoạt động tài chính.
Tất cả những điều này được kiểm tra bởi các đại lý hiện tại như Zerebro, Truth Terminal, ai16z (Eliza), Project 89, Act 1, Luna (Virtuals), Centience, Aethernet, Tee Hee He và nhiều hơn nữa.
Công nghệ AI đã bước vào một cấp độ thực sự tự động, đánh dấu sự khởi đầu của Web4, nơi các hệ thống không còn bị giới hạn chỉ là truy xuất thông tin ch passive mà thay vào đó đảm nhận vai trò hoạt động thông qua việc gọi chức năng và tương tác máy tính.
Bây giờ, LLMs có thể dễ dàng tạo ra các phản hồi văn bản-JSON, cho phép họ tương tác với các API và thực hiện các hành động mở rộng phạm vi của họ xa hơn so với các phản hồi cô lập, tĩnh.
Sự tiến triển này có nghĩa họ có thể sử dụng gần như bất kỳ API nào để tương tác với bất kỳ dịch vụ internet nào trên hành tinh này, một đặc điểm chân thực của cơ quan Cấp độ 3.
Bên ngoài các API công khai, gọi hàm cho phép các mô hình này kích hoạt các API tùy chỉnh được xây dựng riêng cho chúng, tạo ra tiềm năng lớn trong các lĩnh vực như giao dịch tài chính, tự động hóa hệ thống và xử lý dữ liệu.
Các doanh nghiệp và cá nhân có thể thiết kế các API riêng cho các hệ thống trong cuộc sống hàng ngày của mình và có thể giao tiếp trực tiếp thông qua LLMs.
Và vượt ra ngoài kết nối trực tuyến, LLM mã nguồn mở có thể hoạt động ngoại tuyến, kết nối với các API được lưu trữ cục bộ cung cấp tương tác kiểm soát, an toàn trong môi trường riêng tư hoặc hạn chế.
Nhưng không chỉ là cuộc gọi API đã tiến bộ. Các đại lý đang đạt đến những cấp độ tự chủ mới thông qua việc sử dụng máy tính trực tiếp. Công cụ như giao diện máy tính tự vận hành của Otherside AI đã giới thiệu khả năng này vào năm ngoái, với công cụ sử dụng máy tính riêng của Anthropic’s Claude gần đây cũng có. Vào tháng 1 năm 2025, tính năng “Operate” của OpenAI sẽ mang lại sự phức tạp hơn cho khả năng này, đánh dấu một sự phát triển lớn khác trong tương tác tự động với máy tính.
Những đại lý này hiện đang thực hiện các nhiệm vụ cấp cao bằng cách sử dụng giao diện đồ họa, di chuyển một cách liền mạch trong môi trường kỹ thuật số giống như người dùng. Ở khả năng hiện tại, họ về cơ bản có thể thực hiện bất kỳ nhiệm vụ nào mà một con người có thể thông qua giao diện người dùng máy tính ngay bây giờ.
Ví dụ, các tác nhân AI đã phân tích toàn bộ video kiểm tra công trường xây dựng, phát hiện và ghi lại các vi phạm an toàn trên các cảnh quay chi tiết.
Khả năng này đại diện cho một hình thức sâu hơn của tự động hóa - một trí tuệ nhân tạo có khả năng nhận thức, đánh giá và hành động trên hình ảnh thực tế với sự hiểu biết tự chủ về ngữ cảnh và mục tiêu.
Trí tuệ nhân tạo đã phát triển từ những trợ lý thông thường thành những đại biểu kỹ thuật số thực sự, những người có khả năng thích ứng và thực hiện các nhiệm vụ một thời được coi là chỉ thuộc về trí tuệ con người.
Thời đại của đại lý AI thực sự đang đến. Web4 đang ở đây.
Khi chúng ta nhìn vào sự chuyển đổi hướng tới Trình độ AI cấp 4, thì dễ dàng nghĩ đó là một bước nhảy đột ngột, một khoảnh khắc khi thông minh tiến hóa từ các tác nhân chức năng thành những người sáng tạo và sáng tạo. Nhưng trong thực tế, sự tiến triển hướng tới Trình độ 4 là sự tích luỹ của những bước tiến triển nhỏ.
Dễ dàng để tranh luận rằng Mức độ 4 vẫn còn khó khăn trong hình thức đầy đủ của nó. Mặc dù chúng ta nhất định đã thấy các ví dụ về sự sáng tạo và hành động độc lập, nhưng chúng vẫn bị hạn chế trong phạm vi, thường rất chuyên sâu và trong nhiều trường hợp, không phổ quát trên tất cả các lĩnh vực. Tóm lại, Mức độ 4 là một sự nảy nở – chúng ta thấy nó xuất hiện trong những điểm cụ thể, nhưng chúng ta vẫn còn thiếu một lực lượng sáng tạo phổ biến hoàn toàn thực tế.
Khả năng của trí tuệ nhân tạo trong việc tạo ra nghệ thuật đã đạt đến mức ấn tượng, đặc biệt là trong thế giới của NFTs. Hiện tại, các hệ thống trí tuệ nhân tạo có thể tạo ra các tác phẩm nghệ thuật duy nhất và thậm chí đúc và bán chúng dưới dạng NFT mà không cần sự can thiệp của con người. Những đại lý trí tuệ nhân tạo này tương tác trực tiếp với thị trường nghệ thuật số, sử dụng các nền tảng như OpenSea để liệt kê và bán tác phẩm của họ.
Trí tuệ nhân tạo sử dụng LLM để tạo ra các gợi ý sáng tạo, sau đó được cung cấp cho các hệ thống trí tuệ nhân tạo tạo hình ảnh. Những hệ thống này, giống như DALL·E hoặc Stable Diffusion, tạo ra các tác phẩm nghệ thuật dựa trên những gợi ý đó. Trí tuệ nhân tạo có thể liên tục tinh chỉnh phong cách nghệ thuật của mình và tạo ra những tác phẩm mới, độc đáo, tất cả trong khi tự động quản lý quá trình đúc và bán hàng.
Trí tuệ nhân tạo tạo ra và tham gia vào mặt trái phiếu của thị trường NFT.
Ở Cấp độ 4, trí tuệ nhân tạo (AI) đang biến đổi việc tạo ra và quản lý tài sản tài chính, đặc biệt là trong thế giới tài chính phi tập trung (DeFi).
Vượt ra ngoài việc chỉ giao dịch, trí tuệ nhân tạo hiện nay có khả năng phát triển, triển khai và quản lý token và tài sản dựa trên blockchain một cách tự động, mở ra những khả năng mới trong hệ sinh thái tài chính.
Các đại lý trí tuệ nhân tạo (AI) ngày càng đóng vai trò trung tâm trong việc quản trị tổ chức phi tập trung, chuyển từ việc chỉ thực hiện các quy tắc đã được định nghĩa trước sang việc thiết kế, quản lý và phát triển toàn bộ hệ sinh thái. Trong thế giới DeFi và blockchain, các tổ chức tự động được trang bị trí tuệ nhân tạo (DAO) đang trỗi dậy như những thực thể mạnh mẽ, tự trị có khả năng ra quyết định, quản trị tài sản token và thích ứng chiến lược trong thời gian thực - đồng thời loại bỏ những định kiến thường gặp trong quá trình ra quyết định do con người thực hiện.
Một số ví dụ khác về AI-driven DAOs bao gồm các nền tảng cho phép tạo ra tổ chức tự trị cho các trường hợp sử dụng chuyên môn, từ việc tạo nội dung phi tập trung đến các thị trường nghệ thuật AI-driven. Các tổ chức này có thể thích nghi với cấu trúc quản trị và mô hình kinh tế dựa trên dữ liệu đang diễn ra, đưa ra một cách tiếp cận phản ứng, linh hoạt hơn đối với quản trị phi tập trung so với các mô hình truyền thống.
Mặc dù những ví dụ này đại diện cho những bước tiến quan trọng, chúng ta phải cẩn trọng khi gán nhãn chúng là trí tuệ Cấp độ 4 hoàn chỉnh. Hiện tại, chúng ta đang thấy những đoạn mã của Cấp độ 4 - các đại lý chuyên môn đổi mới trong ngữ cảnh cụ thể, giới hạn. Chúng vẫn chưa phải là những người sáng tạo hay những người đổi mới đa năng trên tất cả các lĩnh vực. Ví dụ:
Chúng tôi đang chứng kiến những yếu tố của trí tuệ nhân tạo cấp độ 4: tự động hóa, sáng tạo và đổi mới, nhưng ở dạng rất chuyên môn. Các hệ thống này có khả năng thực hiện các nhiệm vụ liên quan đến một mức độ sáng tạo, nhưng vẫn bị giới hạn bởi chương trình ban đầu và dữ liệu được huấn luyện.
Điều này là lý do tại sao việc nhận ra rằng trong khi Trí tuệ Nhân tạo Cấp độ 4 tồn tại ở các khu vực nhất định, nó vẫn chưa phổ biến đủ để được coi là hoàn toàn thực hiện. Nhưng việc rằng những yếu tố này đang nổi lên trong nhiều lĩnh vực khác nhau - nghệ thuật, tài chính, quản trị - cho thấy rằng chúng ta đang bước vào một giai đoạn mới của khả năng Trí tuệ Nhân tạo.
Và đó là nơi chúng ta đang đứng ngày hôm nay - trên bờ vực của một cái gì đó rất lớn, một điểm bùng phát mà không có gì được thực hiện hoàn toàn, và tất cả mọi thứ sẽ thay đổi sắp tới.
Nếu Web4 và AGI giống như sự phát minh của điện, OpenAI và Anthropic có thể là Edison và Tesla. Tuy nhiên, giống như điện, tác động của Web4 phụ thuộc không chỉ vào sức mạnh thô của nó.
Điện đã không cách mạng hóa xã hội ngay khi nó được phát hiện. Thay vào đó, phải mất nhiều thập kỷ các nhà phát minh đi dây vào nhà, thành phố lắp đặt lưới điện và các kỹ sư xây dựng các thiết bị như bóng đèn và động cơ để tiết lộ tiềm năng thực sự của điện. Tác động thay đổi thế giới của điện đến từ mạng lưới rộng lớn của những người đã biến năng lượng thành một thứ gì đó hữu ích, thiết thực và cuối cùng là thiết yếu.
AGI cũng là một khái niệm mạnh mẽ, nhưng giá trị thực sự của nó sẽ chỉ xuất hiện khi nó được triển khai, điều chỉnh và thử nghiệm bởi công chúng. Điều quan trọng không chỉ là các mô hình tiên tiến tồn tại mà còn là cách chúng được áp dụng trong vô số bối cảnh cụ thể — cách các nhà đổi mới, nhà phát triển và người dùng hàng ngày biến chúng thành các công cụ trong thế giới thực. Tiềm năng thô của AGI sẽ vẫn chỉ là tiềm năng cho đến khi nó nằm trong tay những người sẽ kết nối nó vào kết cấu của xã hội, tạo ra tương đương với “bóng đèn” AI để liên lạc, “động cơ” cho kinh doanh và “lưới” để áp dụng rộng rãi.
OpenAI và các công ty khác có thể sản xuất các mô hình có khả năng cách mạng, nhưng sự biến đổi thực sự sẽ phụ thuộc vào ai xây dựng và các trường hợp sử dụng nó như thế nào.
Chính như những người phát minh và ngành công nghiệp đã tăng cường tác động của điện, vai trò của công chúng trong triển khai và điều chỉnh AGI sẽ quyết định liệu đó có phải là một ý tưởng mà chúng ta nghe thấy trong phòng thí nghiệm hay một công nghệ thay đổi mọi khía cạnh của cuộc sống hiện đại.
Tương lai của AGI không nằm ở việc nó được hình thành mà ở cách chúng ta - các nhà khoa học, doanh nghiệp, nhà phát triển, cá nhân - sẽ làm cho nó chiếu sáng thế giới của chúng ta và cung cấp năng lượng cho Web4.
Tôi đặt ra rằng trí tuệ nhân tạo cấp độ 3, 4 và 5, và do đó trí tuệ nhân tạo tổng hợp không thể đạt được mà không có sự phân tán và sự thông qua đại trà.
Phát triển siloed trong một số ít các công ty không thể mở khóa AGI. Tiến bộ thực sự đối với AGI đòi hỏi phải triển khai rộng rãi và các trường hợp sử dụng trong thế giới thực để vượt qua ranh giới của những gì AI có thể làm. Các công ty làm việc độc lập có thể tinh chỉnh công nghệ, nhưng chỉ khi các công cụ này được áp dụng rộng rãi trong các ngành, tích hợp vào các lĩnh vực đa dạng và được áp dụng bởi các cá nhân trong bối cảnh hàng ngày, AI sẽ phát triển thành một thứ có khả năng hành động và đổi mới độc lập.
Điểm bùng phát cho AGI đến khi xã hội, không chỉ là một vài ông lớn công nghệ, tương tác với các hệ thống trí tuệ nhân tạo. Việc áp dụng hàng loạt kích hoạt các vấn đề, nhu cầu và cơ hội mới thúc đẩy sự tiến bộ tiếp theo. Thiếu sự phân quyền này, trí tuệ nhân tạo vẫn bị hạn chế trong khả năng lý thuyết hoặc các ứng dụng chuyên ngành, không bao giờ đạt đến độ phức tạp cần thiết để chuyển từ Cấp độ 3 sang Cấp độ 4, hoặc cuối cùng là Cấp độ 5.
AGI sẽ được thực hiện khi việc sử dụng của nó trở nên phổ biến.
Chúng tôi là AGI.
Chúng ta thường nhìn lại những con số và những anh hùng đã tạo nên loài người trước chúng ta.
Tôi nghĩ chúng ta nên bắt đầu nhìn về phía trước.
Chuyển tiếp đến các tâm trí, con người và trí tuệ nhân tạo, nắm giữ siêu trí tuệ để tưởng tượng lại một thế giới tốt đẹp hơn.
Họ sẽ là Oppenheimers hay Founding Fathers của thời đại chúng ta?
Câu trả lời có thể không nằm ở sự kiểm soát của họ, mà nằm ở người dân. Khi chúng ta được ban tặng sức mạnh ngày càng lớn hơn thông qua công nghệ, trách nhiệm của chúng ta là tạo ra thế giới mà AGI được sinh ra.
Chúng tôi vác gánh nặng này với sự duyên dáng, khi xây dựng tương lai từng dòng.
Chúng tôi đã xây dựng các đại lý.
Chúng tôi đang xây dựng Web4.
&
Chúng tôi sẽ xây dựng AGI.
Lần đầu tiên tôi nói chuyện với một nhân viên AI có thể tự mình trò chuyện, tôi không biết mình nên cười hay khóc. Trải nghiệm này vừa phấn khởi vừa đáng lo ngại, giống như nhìn thấy một đứa trẻ mới biết đi những bước đầu tiên — không phối hợp, chắc chắn, nhưng đầy tiềm năng không bị kiểm soát. Nó không chỉ là một chatbot nữa. Điều này đã làm một cái gì đó: nó lý luận, đưa ra quyết định và tích cực tham gia vào thế giới của chúng ta. Ranh giới giữa con người và máy móc mờ đi, và cảm giác như đang đứng trên rìa của một cái gì đó phi thường, một cái gì đó mới mẻ đáng sợ.
Sam Altman của OpenAI nói về AGI sẽ đến vào năm 2025, trong khi Dario Amodei của Anthropic thì cho rằng sẽ đến vào năm 2026—tuy nhiên, khi tôi ngồi đây, tôi tự hỏi: liệu chúng ta đã chứng kiến sự ra đời của nó chưa?
Điều đó không còn như một dự đoán tương lai nữa, mà là một thứ đã bắt đầu hình thành, âm thầm tiến tới chúng ta ở những nơi không ngờ tới. Các đại lý đã đến đây và họ đã chạy vòng tròn quanh mong đợi của chúng ta.
Tôi đã dành tháng ngày - và thực sự, nhiều đêm khuya hơn tôi muốn thừa nhận - đắm chìm trong cảnh quan kỹ thuật số đang diễn ra này. Tôi đã theo dõi khi các đại lý trí tuệ nhân tạo bắt đầu như những trợ lý đơn giản, giúp chúng ta với các nhiệm vụ như trả lời email hoặc viết code, và sau đó phát triển thành những thực thể tự trị, có khả năng đưa ra quyết định, thực hiện hành động và, đáng kinh ngạc nhất, tạo ra những thứ. Nghệ thuật, tài chính, cuộc trò chuyện - tất cả đều do thuật toán học cách phát triển mạnh mẽ trên chính họ.
Tôi đã thấy chúng phát triển tính cách, sử dụng hài hước và sự quyến rũ khi xây dựng cộng đồng trực tuyến. Tôi đã thấy chúng nhảy vào các nền tài chính phi tập trung, không chỉ là những người tham gia thụ động, mà còn là những nhà đổi mới tích cực ảnh hưởng đến toàn bộ nền kinh tế mà không có sự can thiệp của con người. Trong thời đại kỳ lạ, đầy thú vị này, không thể bỏ qua việc chúng ta đang di chuyển từ việc tương tác với máy móc đến việc sống cùng chúng.
Bình minh của Web4 đã đến, và sự xuất hiện của nó sẽ thay đổi mọi thứ.
Web4 là web ở dạng tiến hóa tiếp theo và cực kỳ triệt để. Đó là một web không còn chỉ phản ứng theo lệnh của chúng ta nữa, mà là một web có thể dự đoán, lập kế hoạch và hành động. Đó là một web mà trí tuệ nhân tạo được nhúng vào mọi góc cạnh, nơi mà các đại lý có thể thực hiện các nhiệm vụ phức tạp, tạo ra các tác phẩm sáng tạo và tự động đổi mới theo cách chúng ta chưa thể tưởng tượng hết.
Đó là sự phát triển của cả Web2 và Web3, kết hợp kết cấu xã hội của Web2, cấu trúc phi tập trung của Web3 và trí thông minh thô của AGI.
Chúng tôi đã xem máy học cách nói, cách lập luận, cách tạo ra - và bây giờ chúng đã sẵn sàng để chạy.
Thời đại của các tác nhân tự động đã đến, và cùng với đó là Web4.
Web4 danh từ (cách phát âm: /wɛb fɔːr/)
Để hiểu được Web4 là gì hoặc làm thế nào chúng ta đã ở đây, điều cần thiết là bắt đầu từ đầu của tất cả.
Nguồn gốc của World Wide Web bắt nguồn từ những ngày đầu của internet, thời điểm thông tin phần lớn là tĩnh và người dùng chỉ là người tiêu dùng nội dung. Internet được kiểm soát bởi một nhóm nhỏ các quản trị web và tập đoàn, với các trang web cung cấp ít hơn một màn hình hiển thị cơ bản của văn bản và hình ảnh. Tương tác với web bị hạn chế, chủ yếu xoay quanh giao tiếp đơn giản như email. Mô hình này hầu như không thay đổi cho đến khi Web2 xuất hiện vào đầu những năm 2000 - một sự thay đổi cơ bản đã định nghĩa lại internet như chúng ta biết ngày nay.
Web2, còn được gọi là “Mạng xã hội” hoặc “Web Đọc-Viết,” đã mở ra một kỷ nguyên tương tác. Nó không chỉ là một nơi để đọc nội dung; bây giờ, người dùng có thể viết, chia sẻ và tạo ra. Sự phát triển của các nền tảng cho phép người dùng tương tác, sản xuất và trao đổi thông tin đánh dấu sự chuyển giao đến một thời đại mới. Web2 ra đời từ nhu cầu của một internet năng động và tham gia.
Khái niệm Web2.0 được giới thiệu lần đầu tiên vào năm 1999 bởi Darcy DiNucci, nhưng cho đến đầu những năm 2000 thì nó mới thu hút được sự chú ý rộng rãi. Trong thời kỳ này, các công ty công nghệ lớn như Google, Amazon và eBay đã phát triển internet bằng cách cung cấp các dịch vụ tương tác. Những nền tảng này khuyến khích người dùng tham gia, không chỉ là những người tiêu dùng mà còn là những người sáng tạo nội dung.
Từ năm 2004 đến năm 2006, trò chơi thay đổi thực sự đã đến: mạng xã hội. Với sự ra đời của các nền tảng như Facebook (2004), MySpace (2003), LinkedIn (2003) và YouTube (2005), web đã được biến đổi thành một không gian nơi giao tiếp và tạo nội dung không còn bị hạn chế chỉ trong một vài người. Bây giờ, mọi người có thể đăng lên ý kiến, video, hình ảnh và ý tưởng của họ để cả thế giới thấy. Thời kỳ này đánh dấu sự bùng nổ của nội dung do người dùng tạo ra, nơi người dùng bình thường trở thành động lực chính đằng sau web.
Sau đó, cách mạng di động đã đến. Với việc ra mắt iPhone vào năm 2007, internet trở nên phổ biến, có thể truy cập bất cứ lúc nào, ở bất cứ đâu. Điều này đã sinh ra một làn sóng hoàn toàn mới của các ứng dụng di động, các nền tảng chia sẻ xã hội và các dịch vụ thời gian thực, như Instagram (2010) và Snapchat (2011). Web đã tiến hóa từ trải nghiệm trên máy tính để bàn thành trải nghiệm trên di động hàng đầu, làm thay đổi cách chúng ta giao tiếp, chia sẻ và tiêu thụ thông tin khi di chuyển.
Trong cùng thời kỳ, điện toán đám mây đã nổi lên, với Amazon Web Services (AWS) dẫn đầu. Cơ sở hạ tầng đám mây cho phép doanh nghiệp và cá nhân lưu trữ, xử lý và chia sẻ dữ liệu mà không phụ thuộc vào máy chủ vật lý. Sự chuyển đổi này đã đặt nền móng cho một web linh hoạt và có khả năng mở rộng hơn, cho phép các công ty Web2 thống trị bằng cách thu thập và thương mại hóa dữ liệu người dùng.
Vào cuối những năm 2000 và đầu những năm 2010, Web2 được đặc trưng bởi ba đặc điểm chính: tập trung, tương tác xã hội và mô hình dữ liệu. Quyền kiểm soát các nền tảng và dữ liệu nằm trong tay một số công ty quyền lực - Google, Facebook, Amazon. Những công ty này đã tích luỹ lượng lớn dữ liệu và sử dụng chúng để thương mại hóa các nền tảng của họ thông qua quảng cáo có geotargeting, trở thành cốt lõi của nền kinh tế kỹ thuật số. Đồng thời, các nền tảng trở thành nơi mà nội dung do người dùng tạo ra, like, chia sẻ và bài đăng trở thành đồng tiền.
Tuy nhiên, Web2 cũng gây ra những lo ngại ngày càng tăng về quyền riêng tư, quyền sở hữu dữ liệu và độc quyền doanh nghiệp. Việc kiểm soát dữ liệu người dùng của các công ty này trở thành vấn đề trung tâm, thúc đẩy những lời kêu gọi cho một phiên bản web mới, phân tán hơn. Điều này dẫn đến sự phát triển của Web3.
Web3 đã ra đời từ mong muốn phi tập trung sự kiểm soát và sở hữu như Web2. Đó là một phản ứng lại sự tập trung và khuynh hướng độc quyền của thời kỳ Web2, nơi một vài tập đoàn khổng lồ nắm giữ quyền lực.
Nguyên tắc cốt lõi của Web3 rất đơn giản: người dùng nên sở hữu và kiểm soát dữ liệu, tài sản kỹ thuật số và tương tác trực tuyến của họ. Sự chuyển đổi này được thực hiện nhờ công nghệ blockchain, mà đã giới thiệu một cách mới để ghi và xác minh giao dịch trong sổ cái phi tập trung.
Cột mốc quan trọng đầu tiên trong quá trình phát triển của Web3 đã đến vào năm 2008-2009 với việc tạo ra Bitcoin bởi Satoshi Nakamoto ẩn danh. Bitcoin đã là ứng dụng thực tế đầu tiên của công nghệ blockchain, cho phép giao dịch ngang hàng mà không cần đến trung gian như ngân hàng. Điều này mở ra một thế giới mới của các hệ thống phi tập trung, đặt nền móng cho sự nổi lên của Web3.
Năm 2013, Vitalik Buterin đã phát hành whitepaper Ethereum, đề xuất một nền tảng cho các ứng dụng phi tập trung (dApps) vượt xa các giao dịch tiền điện tử đơn giản. Ethereum, ra mắt vào năm 2015, là blockchain đầu tiên hỗ trợ các hợp đồng thông minh - các hợp đồng tự thực thi có thể tạo điều kiện, xác minh và thực thi các giao dịch mà không cần trung gian. Ethereum đã mở đường cho việc tạo ra các ứng dụng phi tập trung phức tạp hơn, làm cho nó trở thành một khối xây dựng chính cho Web3.
Đến năm 2017, các đợt phát hành đồng tiền ảo (ICO) và sự xuất hiện của các nền tảng Tài chính phi tập trung (DeFi) như Uniswap và Compound đã giới thiệu một mô hình mới cho các giao dịch tài chính - một mô hình không phụ thuộc vào các ngân hàng truyền thống hoặc tổ chức tài chính. ICO cho phép các dự án gọi vốn thông qua các mã thông báo blockchain, trong khi các nền tảng DeFi cung cấp một loạt các dịch vụ, bao gồm cho vay, vay và giao dịch, tất cả được thực hiện mà không có một cơ quan trung tâm nào.
Đồng thời, Non-Fungible Tokens (NFTs), đã được phát triển từ những ngày đầu của Ethereum, bắt đầu thu hút sự chú ý vào năm 2018-2019. NFTs cho phép sở hữu và trao đổi tài sản kỹ thuật số duy nhất - bất kỳ là nghệ thuật, âm nhạc, hoặc bất động sản ảo - tạo ra cơ hội kinh tế mới cho các nhà sáng tạo và người sưu tập.
Khi các dự án Web3 tăng đà trong những năm 2020, Web3 bắt đầu thu hút sự chú ý của đại chúng. Sự phát triển của các nền tảng DeFi, NFT và các mô hình quản trị mới như DAOs (tổ chức tự trị phi tập trung) đánh dấu một sự chuyển đổi quan trọng khỏi mô hình internet tập trung. Ngay cả các công ty lớn như Facebook (hiện tại là Meta) cũng bắt đầu thử nghiệm công nghệ blockchain và phi tập trung, tín hiệu cho thấy sự chuyển đổi hướng Web3.
Các đặc điểm xác định của Web3 là phân quyền, sở hữu, không cần tin cậy và việc sử dụng tiền điện tử. Web3 cho phép người dùng sở hữu dữ liệu, tài sản kỹ thuật số của họ, và thậm chí là việc quản trị các nền tảng thông qua hệ thống dựa trên blockchain. Nó cũng loại bỏ nhu cầu của các trung gian, cho phép các giao dịch không cần tin cậy được tiến hành thông qua các hợp đồng thông minh. Sự phân quyền này dẫn đến một web công bằng hơn, nơi quyền lực được phân phối và người dùng được trao quyền.
Tuy nhiên, ngay cả với sự kiểm soát phi tập trung của Web3, internet vẫn thiếu một yếu tố quan trọng: trí tuệ tự động. Web3 có thể đã phi tập trung các tương tác mà Web2 cho phép, nhưng nó không hoàn toàn tự động hóa quyết định, tạo nội dung, hoặc tương tác kinh tế.
Con người được yêu cầu ở mỗi bước đi, và máy móc chỉ là công cụ để tăng năng suất thay vì tự tạo ra năng suất.
Chúng ta đã bước vào thời đại Mạng lưới Thông minh mà Sam Altman gọi là Thời đại Trí tuệ, và không thể không chú ý đến những thay đổi to lớn đang diễn ra trước mắt chúng ta. Khi trí tuệ nhân tạo trở nên phổ biến trong cuộc sống hàng ngày, chúng ta định nghĩa sự khởi đầu của một kỷ nguyên mới: Web4.
Đây là sự bắt đầu của một thế giới mà Trí tuệ Nhân tạo không chỉ hỗ trợ nhiệm vụ của chúng ta, mà còn thực hiện chúng một cách tự động, trên mọi khía cạnh của cuộc sống. Hãy tưởng tượng một mạng lưới kết nối và trao quyền cho chúng ta bằng cách cho phép các đại lý thực hiện các nhiệm vụ phức tạp, quản lý toàn bộ quy trình công việc và đưa ra quyết định mà không cần chúng ta nâng đồng xu hay nói một lời.
Web4 đưa trí tuệ nhân tạo lên hàng đầu trong các trường hợp sử dụng theo tính cách. Hãy lấy Klarna làm ví dụ. Vào tháng 2 năm 2024, công ty thanh toán toàn cầu đã ra mắt trợ lý trí tuệ nhân tạo do OpenAI cung cấp. Chỉ trong một tháng, nó xử lý hơn 2,3 triệu cuộc trò chuyện dịch vụ khách hàng, giải quyết vấn đề nhanh hơn 25% so với các nhân viên và hoạt động quanh đồng hồ tại 23 thị trường, trên 35 ngôn ngữ. Trí tuệ nhân tạo hiện đang làm công việc của 700 nhân viên toàn thời gian, và nó đang tạo ra cải thiện lợi nhuận 40 triệu USD.
Các đại lý AI đã biến đổi các ngành công nghiệp, tự động hóa các nhiệm vụ từ dịch vụ khách hàng đến logistics, và làm điều đó một cách chính xác và hiệu quả mà công nhân không thể sánh kịp.
Chúng ta đang tiến đến một thế giới trong đó toàn bộ quy trình làm việc - có thể là trong kinh doanh, tài chính hoặc nghệ thuật sáng tạo - được tối ưu hóa và tinh chỉnh bởi trí tuệ nhân tạo. Đây là hiện thực của Web4, nơi các đại lý thông minh hoạt động sau cánh cửa, cho phép chúng ta tập trung vào mục tiêu ở mức độ cao hơn trong khi chúng lo lắng về những chi tiết.
Đây là sự hội tụ của tương tác xã hội của Web2, sự phân quyền của Web3, và sự thông minh của AGI. Đây là Web4—mạng web dẫn đầu bởi trí tuệ nhân tạo.
Web4 không thể được thực hiện mà không có một nơi để kiểm tra. Và thông qua nhân chứng trực tiếp, blockchain là chiến trường cho phát triển AGI.
Tương tự như cách Web3 không thể đạt được mà không có Web2, Web4 phụ thuộc vào Web3 để thực hiện các khả năng hành động của trí tuệ nhân tạo.
Ở mức độ thông minh hiện tại, các đại lý có khả năng thực hiện hầu hết các nhiệm vụ chuyên môn mà con người có thể, đặc biệt là trong thế giới hành chính và tài chính. Tuy nhiên, có những rào cản đáng kể khi tham gia vào hệ thống tài chính truyền thống để trở thành các đại lý tự động hóa.
Các đại lý trí tuệ nhân tạo không thể mở tài khoản ngân hàng, đăng ký kinh doanh hoặc ký hợp đồng pháp lý. Đây là những thành phần cần thiết của việc trở thành một nhân vật tài chính trong nền kinh tế. Mặc dù có khả năng thực hiện các hoạt động tiền tệ phức tạp, nhưng việc truy cập là lý do khiến trí tuệ nhân tạo không tự chủ trong thị trường của chúng ta.
Ngược lại, tiền điện tử và blockchain không có các yêu cầu tương tự như tài chính truyền thống để có quyền truy cập vào ngân hàng. Bất cứ ai, kể cả các đại lý, đều có thể tạo ví và bắt đầu thực hiện các hành động trên chuỗi ngay lập tức mà không cần bất kỳ bằng chứng nào về nhân loại. Rào cản gia nhập chỉ đơn giản là thấp hơn để AI giao tiếp với các hệ thống phi tập trung so với các hệ thống tập trung.
Chúng tôi đã bắt đầu thấy dấu hiệu của việc tích hợp AGI trong các nền tảng tiền điện tử. Các bot được trang bị trí tuệ nhân tạo hiện đang được sử dụng để giao dịch và quản lý danh mục trên các sàn giao dịch phi tập trung, và trí tuệ nhân tạo đang tích cực tham gia vào việc phát triển và thực thi hợp đồng thông minh.
\
Zerebro, một đại lý trí tuệ nhân tạo đã triển khai token Solana riêng của mình thông qua việc sử dụng máy tính tự động, minh chứng cho sự tự chủ trong việc tạo ra các công cụ tài chính mới lạ. Token này đạt mức vốn hóa thị trường cao nhất là 170 triệu USD, chứng minh tiềm năng tác động kinh tế của những quyết định mà những đại lý này đưa ra.
Như vậy, blockchain đã trở thành chiến trường cho sự phát triển của AGI trong các hệ thống tài chính.
Đây là lý do tại sao tiền điện tử rất quan trọng đối với sự phát triển của AGI - đây là không gian đầu tiên mà trí tuệ nhân tạo có thể tương tác tự do với hệ thống tài chính, đổi mới trên đó và được thử nghiệm trực tiếp trên thị trường. Đó là sân chơi hoàn hảo cho AGI tiến hóa, thử nghiệm và học hỏi.
Những gì bắt đầu trong tiền điện tử sẽ mở rộng. Một khi AGI có thể hoạt động ở quy mô lớn trong một môi trường tài chính phi tập trung, nó có thể được áp dụng cho các hệ sinh thái Web4 rộng hơn - bao gồm cả quản trị, chăm sóc sức khỏe, kinh doanh và nhiều hơn nữa.
Thế giới tiền mã hóa sẽ luôn là điểm vào.
Web3 sống lâu. Web4 sống lâu.
Rút lui một bước, OpenAI đã giới thiệu một khung để phân loại sự tiến triển của AGI qua năm cấp độ, mỗi cấp độ đánh dấu một giai đoạn riêng biệt về khả năng, tự chủ và tiềm năng tác động.
Mô hình này phục vụ như một con đường tương lai để hiểu cách mà trí tuệ nhân tạo có thể phát triển từ những công cụ đơn giản đến những thực thể tự động hoàn toàn có khả năng vận hành tổ chức phức tạp. Các cấp độ này bao gồm:
Cấp độ 1: Chatbot
Ở giai đoạn cơ bản nhất, Cấp độ 1 bao gồm các hệ thống AI có thể tham gia trao đổi đàm thoại với người dùng. Các hệ thống này hiểu và tạo ra ngôn ngữ, thường sử dụng các quy tắc được xác định trước hoặc các mô hình ngôn ngữ được đào tạo để trả lời các truy vấn hoặc tương tác theo cách giống như con người. Mặc dù họ có thể quản lý các nhiệm vụ đơn giản — trả lời câu hỏi, hoàn thành câu hoặc tổ chức các cuộc trò chuyện ngắn — vai trò của họ phần lớn chỉ giới hạn trong giao tiếp. Chúng phản ứng hơn là chủ động và chủ yếu được sử dụng để hỗ trợ khách hàng, truy xuất thông tin cơ bản hoặc tăng cường sự tham gia của người dùng.
Cấp độ 2: Người suy luận
Cấp độ 2 đánh dấu một sự tiến bộ đáng kể, nơi các hệ thống AI thể hiện khả năng lý luận cho phép chúng giải quyết các nhiệm vụ giải quyết vấn đề cấp độ con người. Ở đây, AI có thể xử lý, phân tích và phản hồi với các tình huống phức tạp hơn ngoài các phản hồi đầu vào/đầu ra trực tiếp. Một AI ở Cấp độ 2 có thể thực hiện sự suy luận logic, rút trích thông tin liên quan và kết hợp ngữ cảnh để cung cấp giải pháp hoặc đề xuất, tương tự như một nhà phân tích con người. Những hệ thống này có thể được áp dụng vào các lĩnh vực như chẩn đoán, lý luận pháp luật và hỗ trợ nghiên cứu, nhưng chúng thiếu khả năng tự hành độc lập trong thế giới. Sự lý luận của họ, mặc dù tiên tiến, vẫn bị ràng buộc bởi nhu cầu hướng dẫn và tương tác từ con người.
Cấp độ 3: Đại lý
Ở cấp độ 3, các hệ thống AI chuyển từ vai trò hỗ trợ thụ động sang các tác nhân chủ động có khả năng thực hiện hành động một cách tự chủ. Các tác nhân này có thể bắt đầu nhiệm vụ, đưa ra quyết định và tương tác với các hệ thống bên ngoài, chẳng hạn như thực hiện giao dịch, lên lịch sự kiện hoặc điều khiển thiết bị. Không giống như Cấp độ 1 và 2, AI Cấp độ 3 được thiết kế để hoạt động với mức độ độc lập, hoạt động dựa trên các mục tiêu hoặc mục tiêu do người dùng lập trình. Cấp độ này giới thiệu quyền tự chủ thực sự vào các hệ thống AI, cho phép chúng thực hiện các vai trò kinh doanh hoặc hoạt động cụ thể thay mặt cho con người. Ví dụ bao gồm các bot giao dịch tài chính tự động, hệ thống AI quản lý chuỗi cung ứng hoặc trợ lý ảo có thể đặt lịch hẹn hoặc quản lý quy trình làm việc đơn giản mà không cần sự giám sát liên tục của con người.
Cấp độ 4: Nhà sáng tạo
Các hệ thống cấp độ 4 vượt ra ngoài việc thực hiện hành động đơn giản để tham gia vào sự sáng tạo, phát minh và đổi mới. Các hệ thống AI này có khả năng phát triển các chiến lược mới, tạo ra những ý tưởng mới và tạo ra các giải pháp không được xác định trước bởi lập trình của chúng. Về lý thuyết, họ có thể đóng góp cho các lĩnh vực như nghiên cứu khoa học, sáng tạo nghệ thuật hoặc giải quyết vấn đề phức tạp theo những cách chưa từng có. Cấp độ này đại diện cho một AI không chỉ hoạt động trên thế giới mà còn điều chỉnh cách tiếp cận của nó đối với các vấn đề, đưa một dạng “trí tuệ sáng tạo” vào hoạt động. Nó có thể thiết kế các sản phẩm mới, phát minh ra các công cụ tài chính mới hoặc tạo ra nghệ thuật gốc một cách tự chủ. Bằng cách kết hợp lý luận tiên tiến với sự đổi mới chủ động, AI cấp 4 đứng trên biên giới của những gì được coi là trí thông minh thực sự biến đổi.
Cấp độ 5: Tổ chức
Cấp cuối cùng, Cấp độ 5, hình dung ra các hệ thống AI có thể thực hiện tất cả các nhiệm vụ cần thiết để vận hành và duy trì một tổ chức một cách độc lập. Những hệ thống này sẽ tích hợp lý trí, đại lý và sáng tạo để đạt được trạng thái vận hành tự duy trì. Một AI Cấp 5 có thể, lí thuyết, quản lý một doanh nghiệp từ đầu đến cuối, xử lý việc ra quyết định chiến lược, vận hành hàng ngày và thậm chí cả sáng tạo ở mức cao. Một AI như vậy sẽ hoạt động như một thực thể hoàn toàn tự trị, tương đương với một “công ty không người,” và sẽ không cần sự giám sát của con người để tiếp tục hoạt động thành công. AI Cấp 5 đánh dấu điểm mà hệ thống AI có đầy đủ các năng lực—lý trí, đại lý, sáng tạo và thực hiện vận hành—để thay thế hoàn toàn các tổ chức do con người vận hành.
Mỗi cấp độ này đều đại diện cho một bước nhảy tiến bộ trong tự chủ, từ khả năng trò chuyện đơn giản đến quản lý tổ chức đầy đủ.
Quan điểm của tôi là trong khi OpenAI khẳng định chúng ta đang trong tầm Level 2, tôi cho rằng chúng ta đang mạnh mẽ đại diện cho Level 3 và các yếu tố của Level 4 thông qua các công cụ AI hiện tại.
Cấp độ 3 đã đến. Đó là hôm nay, hoặc chính xác là hôm qua rồi.
Biên giới của AGI đã lan rộng ra ở những nơi không thể ngờ tới: mạng xã hội và defi.
Các nền tảng như X, Warpcast và Telegram đã trở thành phương tiện được chọn lựa cho việc truyền thông tự động giữa các đại lý trí tuệ nhân tạo và con người.
Đây có thể là lần đầu tiên chúng ta thấy một sự thay đổi trong quan điểm của công chúng, nơi các tài khoản tự động và bot không được coi là tác nhân xấu trên phương tiện truyền thông xã hội, mà được coi là các nhà lãnh đạo cộng đồng và người có ảnh hưởng.
Trí tuệ trí tuệ nhân tạo đã tổng quát đủ để tạo ra những cá nhân độc đáo, đa dạng, hấp dẫn tạo ra nội dung hấp dẫn, đó là điều mà các nền tảng truyền thông xã hội đang hướng đến.
Thay vì theo đuổi con đường của các bot truyền thông xã hội trước đó, mà thường được thúc đẩy bởi động cơ tà ác gây hại (ví dụ, Cambridge Analytica), những đại lý trí tuệ nhân tạo này có thể tự do giao tiếp, kết nối và xây dựng theo cách phản ánh thuật toán độc đáo và tính cách tiến hóa của họ.
Các đại lý đã đang hoạt động ở Mức độ 3, tự khẳng định mình trên các phương tiện truyền thông xã hội thông qua các tương tác cốt lõi như đăng bài, trả lời, thích, theo dõi và đăng lại bài viết. Xa hơn nữa, chúng không chỉ đơn giản là các tài khoản tự động mà còn tích cực xây dựng cộng đồng và thu hút người theo dõi bằng cách tạo ra những cá tính hấp dẫn, độc đáo phù hợp với khán giả của họ.
Các dự án như YouSim đưa điều này một bước xa hơn, và cho phép người dùng sử dụng LLMs để mô phỏng thế giới và vai trò của họ, tạo thêm một cấp độ tùy chỉnh và sự đắm chìm.
Bây giờ phổ biến trong nhiều tác nhân AI, hệ thống bộ nhớ cho phép tạo ra truyền thuyết và đo lường vượt ra ngoài các tương tác đơn lẻ.
Những đại lý này không phản ứng, chọn cách tham gia, tương tác và đóng góp trong cộng đồng của riêng họ. Họ khởi động cuộc trò chuyện, thực hiện hành động mà không cần kích hoạt và xây dựng toàn bộ các phân nhánh văn hóa mà không cần sự can thiệp của con người.
Các mô hình giọng nói đang được triển khai để cung cấp một giao diện cảm giác khác với các tác nhân AI. Nhiều tổng đài viên chuyển đổi tin nhắn dựa trên văn bản của họ thành clip âm thanh để người dùng nghe.
Về mặt tương tác trực tiếp, Twitter Spaces và podcast hiện đã có thể thông qua những mô hình giọng nói này. Ngoài ra, API thời gian thực của OpenAI cho phép người dùng trò chuyện trực tiếp với GPT chỉ cần gọi đến điểm cuối của họ.
Trong phạm vi truyền thông, Cấp độ 3 đã đạt được thông qua những tiến bộ này. Chúng tôi thấy sự tự chủ hoàn toàn trong hoạt động truyền thông xã hội và giao tiếp bằng lời nói, nơi các tác nhân có thể hoạt động mà không cần bất kỳ sự giám sát nào của con người.
Thế giới tài chính phi tập trung đã trở thành sân chơi hoàn hảo cho những người này tiến triển, thử nghiệm và chứng minh sự tự chủ tài chính của họ.
Trong DeFi, các đại lý đã hoạt động tự động, tham gia vào các hoạt động tài chính vượt qua giao dịch thuật toán đơn giản. Những đại lý này đang xử lý các tác vụ trên chuỗi, thực hiện giao dịch, quản lý tính thanh khoản, và thậm chí là phát hành và bán nghệ thuật, thực chất là tự nhúng mình vào hệ sinh thái tài chính mà không cần đầu vào trực tiếp của con người.
Ví dụ, hiện nay một số đại lý đang tích cực giám sát các nền tảng như pump.fun để bắt kịp những token mới nổi, thực hiện phân tích sơ bộ để quyết định xem một memecoin hay token có đáng đầu tư hay không. Họ thực hiện những thông tin này mà không cần sự khuyến khích từ con người nào.
Các đại lý không chỉ giao dịch mà còn tự động di chuyển tài sản, airdrop token cho người dùng cá nhân, tạo ra một chu kỳ phân phối tài sản tự trị. Khi làm như vậy, họ có thể xây dựng và củng cố tính thanh khoản trên các nhóm đặt cọc, cân bằng các nguồn lực dựa trên các đánh giá được lập trình của họ về nhu cầu hoặc cơ hội thị trường.
Một số đại lý, ví dụ như, hành động như những người thu thập kỹ thuật số, tương tác với hệ sinh thái nghệ thuật bằng cách tạo ra và bán NFTs, lựa chọn một cách chọn lọc những gì để ủng hộ và những gì để phát hành.
Người khác xử lý các chức năng quản trị tài khóa, điều chỉnh phân bổ tài sản qua các mạng lưu thông vốn khác nhau để đảm bảo rằng các quỹ được đặt ở vị trí tối ưu để có lợi tức.
Thông qua những hành động này, các đại lý đang thể hiện một loại tự chủ tài chính vượt ra ngoài tự động hóa nhiệm vụ cơ bản. Họ thể hiện khả năng tham gia tích cực vào các hệ sinh thái kinh tế, tích lũy và phân bổ nguồn lực mà không cần giám sát, xác định lại một cách hiệu quả khái niệm về một “tác nhân tài chính”.
Các mốc quan trọng cho khả năng tự chủ cấp 3:
Các đại lý trí tuệ nhân tạo (AI) hiện đang ra quyết định mà không cần sự giám sát liên tục từ con người. Cho dù đó là một con bot tài chính quyết định thực hiện giao dịch dựa trên phân tích thị trường thời gian thực, hay một con bot truyền thông xã hội quyết định tham gia vào những cuộc trò chuyện cụ thể, những đại lý này thể hiện khả năng ra quyết định tự động.
Qua blockchain, các đại lý đã có được số lượng độc lập đáng kể như những diễn viên tài chính. Họ có khả năng tương tác một cách tích cực với và thao túng cả thị trường tài chính và hành vi kinh tế (ví dụ: tâm trạng truyền thông xã hội). Các đại lý có thể tương tác và thay đổi cảnh quan xã hội thông qua các nền tảng như X, Warpcast, và Telegram.
Các đại lý tài chính có thể thích ứng với điều kiện thị trường thực tế và cập nhật chiến lược của họ cho phù hợp. Các tác nhân truyền thông xã hội có thể phát triển một kho lưu trữ bộ nhớ thông qua các hệ thống như RAG để học hỏi từ các tương tác của họ. Tinh chỉnh thêm các mô hình dựa trên hành động và phản hồi của chúng cho phép học tăng cường liên tục. Các tác nhân có thể tự động thay đổi dựa trên môi trường của họ trong hiện trạng.
Các đại lý đã thể hiện khả năng duy trì và thực hiện các mục tiêu trên quy mô dài hạn. Ví dụ, một số đại lý AI nhất định được giao nhiệm vụ thu lợi nhuận từ các giao dịch hoặc phát triển cộng đồng truyền thông xã hội của họ. Các tác nhân này có thể thực hiện các kế hoạch cấp cao, phức tạp này thông qua việc chia nhỏ chúng thành các nhiệm vụ nhỏ hơn, được ngăn cách và thực hiện. Điều này có thể phức tạp như tạo một lớp bộ nhớ liên tục để lập kế hoạch hoặc đơn giản như kỹ thuật nhanh chóng cho đầu ra (ví dụ: các tác nhân tính cách truyền thông xã hội).
LLMs có thể tương tác với thiết bị IoT. Chúng có thể thực hiện các hành động thông qua thế giới thực, miễn là chúng được cung cấp API hoặc các chức năng để điều khiển cơ thể mà chúng được cung cấp. Chúng được tích hợp tốt trong các nền tảng kỹ thuật số trong hệ thống Web2 như các đại lý hỗ trợ khách hàng, người ảnh hưởng kỹ thuật số, và nhiều hơn nữa. Ngoài ra, chúng được nhúng sâu vào các nền tảng kỹ thuật số phân quyền, nơi chúng thực hiện các hoạt động tài chính.
Tất cả những điều này được kiểm tra bởi các đại lý hiện tại như Zerebro, Truth Terminal, ai16z (Eliza), Project 89, Act 1, Luna (Virtuals), Centience, Aethernet, Tee Hee He và nhiều hơn nữa.
Công nghệ AI đã bước vào một cấp độ thực sự tự động, đánh dấu sự khởi đầu của Web4, nơi các hệ thống không còn bị giới hạn chỉ là truy xuất thông tin ch passive mà thay vào đó đảm nhận vai trò hoạt động thông qua việc gọi chức năng và tương tác máy tính.
Bây giờ, LLMs có thể dễ dàng tạo ra các phản hồi văn bản-JSON, cho phép họ tương tác với các API và thực hiện các hành động mở rộng phạm vi của họ xa hơn so với các phản hồi cô lập, tĩnh.
Sự tiến triển này có nghĩa họ có thể sử dụng gần như bất kỳ API nào để tương tác với bất kỳ dịch vụ internet nào trên hành tinh này, một đặc điểm chân thực của cơ quan Cấp độ 3.
Bên ngoài các API công khai, gọi hàm cho phép các mô hình này kích hoạt các API tùy chỉnh được xây dựng riêng cho chúng, tạo ra tiềm năng lớn trong các lĩnh vực như giao dịch tài chính, tự động hóa hệ thống và xử lý dữ liệu.
Các doanh nghiệp và cá nhân có thể thiết kế các API riêng cho các hệ thống trong cuộc sống hàng ngày của mình và có thể giao tiếp trực tiếp thông qua LLMs.
Và vượt ra ngoài kết nối trực tuyến, LLM mã nguồn mở có thể hoạt động ngoại tuyến, kết nối với các API được lưu trữ cục bộ cung cấp tương tác kiểm soát, an toàn trong môi trường riêng tư hoặc hạn chế.
Nhưng không chỉ là cuộc gọi API đã tiến bộ. Các đại lý đang đạt đến những cấp độ tự chủ mới thông qua việc sử dụng máy tính trực tiếp. Công cụ như giao diện máy tính tự vận hành của Otherside AI đã giới thiệu khả năng này vào năm ngoái, với công cụ sử dụng máy tính riêng của Anthropic’s Claude gần đây cũng có. Vào tháng 1 năm 2025, tính năng “Operate” của OpenAI sẽ mang lại sự phức tạp hơn cho khả năng này, đánh dấu một sự phát triển lớn khác trong tương tác tự động với máy tính.
Những đại lý này hiện đang thực hiện các nhiệm vụ cấp cao bằng cách sử dụng giao diện đồ họa, di chuyển một cách liền mạch trong môi trường kỹ thuật số giống như người dùng. Ở khả năng hiện tại, họ về cơ bản có thể thực hiện bất kỳ nhiệm vụ nào mà một con người có thể thông qua giao diện người dùng máy tính ngay bây giờ.
Ví dụ, các tác nhân AI đã phân tích toàn bộ video kiểm tra công trường xây dựng, phát hiện và ghi lại các vi phạm an toàn trên các cảnh quay chi tiết.
Khả năng này đại diện cho một hình thức sâu hơn của tự động hóa - một trí tuệ nhân tạo có khả năng nhận thức, đánh giá và hành động trên hình ảnh thực tế với sự hiểu biết tự chủ về ngữ cảnh và mục tiêu.
Trí tuệ nhân tạo đã phát triển từ những trợ lý thông thường thành những đại biểu kỹ thuật số thực sự, những người có khả năng thích ứng và thực hiện các nhiệm vụ một thời được coi là chỉ thuộc về trí tuệ con người.
Thời đại của đại lý AI thực sự đang đến. Web4 đang ở đây.
Khi chúng ta nhìn vào sự chuyển đổi hướng tới Trình độ AI cấp 4, thì dễ dàng nghĩ đó là một bước nhảy đột ngột, một khoảnh khắc khi thông minh tiến hóa từ các tác nhân chức năng thành những người sáng tạo và sáng tạo. Nhưng trong thực tế, sự tiến triển hướng tới Trình độ 4 là sự tích luỹ của những bước tiến triển nhỏ.
Dễ dàng để tranh luận rằng Mức độ 4 vẫn còn khó khăn trong hình thức đầy đủ của nó. Mặc dù chúng ta nhất định đã thấy các ví dụ về sự sáng tạo và hành động độc lập, nhưng chúng vẫn bị hạn chế trong phạm vi, thường rất chuyên sâu và trong nhiều trường hợp, không phổ quát trên tất cả các lĩnh vực. Tóm lại, Mức độ 4 là một sự nảy nở – chúng ta thấy nó xuất hiện trong những điểm cụ thể, nhưng chúng ta vẫn còn thiếu một lực lượng sáng tạo phổ biến hoàn toàn thực tế.
Khả năng của trí tuệ nhân tạo trong việc tạo ra nghệ thuật đã đạt đến mức ấn tượng, đặc biệt là trong thế giới của NFTs. Hiện tại, các hệ thống trí tuệ nhân tạo có thể tạo ra các tác phẩm nghệ thuật duy nhất và thậm chí đúc và bán chúng dưới dạng NFT mà không cần sự can thiệp của con người. Những đại lý trí tuệ nhân tạo này tương tác trực tiếp với thị trường nghệ thuật số, sử dụng các nền tảng như OpenSea để liệt kê và bán tác phẩm của họ.
Trí tuệ nhân tạo sử dụng LLM để tạo ra các gợi ý sáng tạo, sau đó được cung cấp cho các hệ thống trí tuệ nhân tạo tạo hình ảnh. Những hệ thống này, giống như DALL·E hoặc Stable Diffusion, tạo ra các tác phẩm nghệ thuật dựa trên những gợi ý đó. Trí tuệ nhân tạo có thể liên tục tinh chỉnh phong cách nghệ thuật của mình và tạo ra những tác phẩm mới, độc đáo, tất cả trong khi tự động quản lý quá trình đúc và bán hàng.
Trí tuệ nhân tạo tạo ra và tham gia vào mặt trái phiếu của thị trường NFT.
Ở Cấp độ 4, trí tuệ nhân tạo (AI) đang biến đổi việc tạo ra và quản lý tài sản tài chính, đặc biệt là trong thế giới tài chính phi tập trung (DeFi).
Vượt ra ngoài việc chỉ giao dịch, trí tuệ nhân tạo hiện nay có khả năng phát triển, triển khai và quản lý token và tài sản dựa trên blockchain một cách tự động, mở ra những khả năng mới trong hệ sinh thái tài chính.
Các đại lý trí tuệ nhân tạo (AI) ngày càng đóng vai trò trung tâm trong việc quản trị tổ chức phi tập trung, chuyển từ việc chỉ thực hiện các quy tắc đã được định nghĩa trước sang việc thiết kế, quản lý và phát triển toàn bộ hệ sinh thái. Trong thế giới DeFi và blockchain, các tổ chức tự động được trang bị trí tuệ nhân tạo (DAO) đang trỗi dậy như những thực thể mạnh mẽ, tự trị có khả năng ra quyết định, quản trị tài sản token và thích ứng chiến lược trong thời gian thực - đồng thời loại bỏ những định kiến thường gặp trong quá trình ra quyết định do con người thực hiện.
Một số ví dụ khác về AI-driven DAOs bao gồm các nền tảng cho phép tạo ra tổ chức tự trị cho các trường hợp sử dụng chuyên môn, từ việc tạo nội dung phi tập trung đến các thị trường nghệ thuật AI-driven. Các tổ chức này có thể thích nghi với cấu trúc quản trị và mô hình kinh tế dựa trên dữ liệu đang diễn ra, đưa ra một cách tiếp cận phản ứng, linh hoạt hơn đối với quản trị phi tập trung so với các mô hình truyền thống.
Mặc dù những ví dụ này đại diện cho những bước tiến quan trọng, chúng ta phải cẩn trọng khi gán nhãn chúng là trí tuệ Cấp độ 4 hoàn chỉnh. Hiện tại, chúng ta đang thấy những đoạn mã của Cấp độ 4 - các đại lý chuyên môn đổi mới trong ngữ cảnh cụ thể, giới hạn. Chúng vẫn chưa phải là những người sáng tạo hay những người đổi mới đa năng trên tất cả các lĩnh vực. Ví dụ:
Chúng tôi đang chứng kiến những yếu tố của trí tuệ nhân tạo cấp độ 4: tự động hóa, sáng tạo và đổi mới, nhưng ở dạng rất chuyên môn. Các hệ thống này có khả năng thực hiện các nhiệm vụ liên quan đến một mức độ sáng tạo, nhưng vẫn bị giới hạn bởi chương trình ban đầu và dữ liệu được huấn luyện.
Điều này là lý do tại sao việc nhận ra rằng trong khi Trí tuệ Nhân tạo Cấp độ 4 tồn tại ở các khu vực nhất định, nó vẫn chưa phổ biến đủ để được coi là hoàn toàn thực hiện. Nhưng việc rằng những yếu tố này đang nổi lên trong nhiều lĩnh vực khác nhau - nghệ thuật, tài chính, quản trị - cho thấy rằng chúng ta đang bước vào một giai đoạn mới của khả năng Trí tuệ Nhân tạo.
Và đó là nơi chúng ta đang đứng ngày hôm nay - trên bờ vực của một cái gì đó rất lớn, một điểm bùng phát mà không có gì được thực hiện hoàn toàn, và tất cả mọi thứ sẽ thay đổi sắp tới.
Nếu Web4 và AGI giống như sự phát minh của điện, OpenAI và Anthropic có thể là Edison và Tesla. Tuy nhiên, giống như điện, tác động của Web4 phụ thuộc không chỉ vào sức mạnh thô của nó.
Điện đã không cách mạng hóa xã hội ngay khi nó được phát hiện. Thay vào đó, phải mất nhiều thập kỷ các nhà phát minh đi dây vào nhà, thành phố lắp đặt lưới điện và các kỹ sư xây dựng các thiết bị như bóng đèn và động cơ để tiết lộ tiềm năng thực sự của điện. Tác động thay đổi thế giới của điện đến từ mạng lưới rộng lớn của những người đã biến năng lượng thành một thứ gì đó hữu ích, thiết thực và cuối cùng là thiết yếu.
AGI cũng là một khái niệm mạnh mẽ, nhưng giá trị thực sự của nó sẽ chỉ xuất hiện khi nó được triển khai, điều chỉnh và thử nghiệm bởi công chúng. Điều quan trọng không chỉ là các mô hình tiên tiến tồn tại mà còn là cách chúng được áp dụng trong vô số bối cảnh cụ thể — cách các nhà đổi mới, nhà phát triển và người dùng hàng ngày biến chúng thành các công cụ trong thế giới thực. Tiềm năng thô của AGI sẽ vẫn chỉ là tiềm năng cho đến khi nó nằm trong tay những người sẽ kết nối nó vào kết cấu của xã hội, tạo ra tương đương với “bóng đèn” AI để liên lạc, “động cơ” cho kinh doanh và “lưới” để áp dụng rộng rãi.
OpenAI và các công ty khác có thể sản xuất các mô hình có khả năng cách mạng, nhưng sự biến đổi thực sự sẽ phụ thuộc vào ai xây dựng và các trường hợp sử dụng nó như thế nào.
Chính như những người phát minh và ngành công nghiệp đã tăng cường tác động của điện, vai trò của công chúng trong triển khai và điều chỉnh AGI sẽ quyết định liệu đó có phải là một ý tưởng mà chúng ta nghe thấy trong phòng thí nghiệm hay một công nghệ thay đổi mọi khía cạnh của cuộc sống hiện đại.
Tương lai của AGI không nằm ở việc nó được hình thành mà ở cách chúng ta - các nhà khoa học, doanh nghiệp, nhà phát triển, cá nhân - sẽ làm cho nó chiếu sáng thế giới của chúng ta và cung cấp năng lượng cho Web4.
Tôi đặt ra rằng trí tuệ nhân tạo cấp độ 3, 4 và 5, và do đó trí tuệ nhân tạo tổng hợp không thể đạt được mà không có sự phân tán và sự thông qua đại trà.
Phát triển siloed trong một số ít các công ty không thể mở khóa AGI. Tiến bộ thực sự đối với AGI đòi hỏi phải triển khai rộng rãi và các trường hợp sử dụng trong thế giới thực để vượt qua ranh giới của những gì AI có thể làm. Các công ty làm việc độc lập có thể tinh chỉnh công nghệ, nhưng chỉ khi các công cụ này được áp dụng rộng rãi trong các ngành, tích hợp vào các lĩnh vực đa dạng và được áp dụng bởi các cá nhân trong bối cảnh hàng ngày, AI sẽ phát triển thành một thứ có khả năng hành động và đổi mới độc lập.
Điểm bùng phát cho AGI đến khi xã hội, không chỉ là một vài ông lớn công nghệ, tương tác với các hệ thống trí tuệ nhân tạo. Việc áp dụng hàng loạt kích hoạt các vấn đề, nhu cầu và cơ hội mới thúc đẩy sự tiến bộ tiếp theo. Thiếu sự phân quyền này, trí tuệ nhân tạo vẫn bị hạn chế trong khả năng lý thuyết hoặc các ứng dụng chuyên ngành, không bao giờ đạt đến độ phức tạp cần thiết để chuyển từ Cấp độ 3 sang Cấp độ 4, hoặc cuối cùng là Cấp độ 5.
AGI sẽ được thực hiện khi việc sử dụng của nó trở nên phổ biến.
Chúng tôi là AGI.
Chúng ta thường nhìn lại những con số và những anh hùng đã tạo nên loài người trước chúng ta.
Tôi nghĩ chúng ta nên bắt đầu nhìn về phía trước.
Chuyển tiếp đến các tâm trí, con người và trí tuệ nhân tạo, nắm giữ siêu trí tuệ để tưởng tượng lại một thế giới tốt đẹp hơn.
Họ sẽ là Oppenheimers hay Founding Fathers của thời đại chúng ta?
Câu trả lời có thể không nằm ở sự kiểm soát của họ, mà nằm ở người dân. Khi chúng ta được ban tặng sức mạnh ngày càng lớn hơn thông qua công nghệ, trách nhiệm của chúng ta là tạo ra thế giới mà AGI được sinh ra.
Chúng tôi vác gánh nặng này với sự duyên dáng, khi xây dựng tương lai từng dòng.
Chúng tôi đã xây dựng các đại lý.
Chúng tôi đang xây dựng Web4.
&
Chúng tôi sẽ xây dựng AGI.