Ra mắt công chúng của Zhipu báo hiệu một bước ngoặt lớn: Phân tích sâu về GLM-5 và cuộc đua định hình lại nền tảng AI

Zhipu chính thức ra mắt công chúng vào ngày 8 tháng 1, đánh dấu một bước ngoặt quan trọng cho lĩnh vực mô hình ngôn ngữ lớn của Trung Quốc. Với cột mốc này, Giáo sư Tang Jie—Chủ tịch khoa học máy tính của Tsinghua và là Nhà khoa học chính sáng lập của công ty—đã phát hành một bản ghi nhớ chiến lược nội bộ làm thay đổi căn bản hướng đi của công ty đến năm 2026. Thay vì theo đuổi lợi ích thương mại ngắn hạn, Zhipu đang tăng cường nghiên cứu các mô hình nền tảng, báo hiệu một phản ứng quyết đoán trước các tác động lan tỏa do đột phá của DeepSeek tạo ra.

Trận chiến thực sự: Kiến trúc mô hình và các mô hình học mới

Bản ghi nhớ của Tang Jie làm rõ một điều: cảnh tranh đua trong tương lai sẽ không được quyết định bởi các ứng dụng hào nhoáng hay các sản phẩm ra mắt từng bước. Thay vào đó, nó phụ thuộc vào hai trụ cột quan trọng—đổi mới kiến trúc mô hình và các mô hình học hoàn toàn mới. Sự chuyển hướng chiến lược này phản ánh sự trưởng thành trong hiểu biết về những yếu tố thực sự thúc đẩy sự tiến bộ trong phát triển AGI.

Cam kết của công ty đối với các đột phá về kiến trúc đặc biệt thể hiện rõ nét. Mô hình Transformer, đã thống trị gần một thập kỷ, bắt đầu xuất hiện những vết nứt dưới áp lực thực tế. Các vấn đề về chi phí tính toán cho các ngữ cảnh siêu dài, cơ chế bộ nhớ, và các quy trình cập nhật mô hình đòi hỏi phải có cách tư duy kiến trúc mới. Lộ trình của Zhipu rõ ràng hướng tới việc vượt ra ngoài các probe von Neumann của hệ thống hiện tại, thay vào đó khám phá các mô hình thiết kế hoàn toàn mới và các phương pháp mở rộng quy mô. Điều này bao gồm các chiến lược đồng thiết kế chip-thuật toán nhằm cải thiện hiệu quả tính toán một cách căn bản.

GLM-5 sắp ra mắt: Những thay đổi khi nó xuất hiện

Thông báo chính là việc ra mắt GLM-5 trong thời gian tới gần. Trong khi các chi tiết vẫn còn hạn chế, quá trình phát triển mô hình trước đó của Zhipu cho chúng ta biết điều gì sẽ xảy ra. GLM-4.7, ra mắt vào tháng 12, đã đạt được một thành tựu đáng kể: xếp hạng nhất trong các mô hình nội địa và xếp thứ sáu toàn cầu cùng Claude 4.5 Sonnet trên chuẩn đánh giá Phân tích Nhân tạo. Thêm vào đó, phản hồi từ các nhà phát triển thực tế về lập trình và trải nghiệm tác nhân luôn tích cực.

Các con số hỗ trợ cho thành tích này thật đáng kinh ngạc. Chỉ trong 10 tháng, nền tảng MaaS của Zhipu đã bùng nổ từ 20 triệu lên 500 triệu doanh thu hàng năm—tăng gấp 25 lần. Các nhà phát triển từ 184 quốc gia, tổng cộng hơn 150.000 người, đã sử dụng bộ công cụ lập trình của GLM. Doanh thu từ nước ngoài riêng đã vượt quá 200 triệu, cho thấy công ty đã thành công trong việc thâm nhập thị trường quốc tế theo cách mà nhiều công ty AI Trung Quốc chưa làm được.

Điểm ngoặt của Reinforcement Learning

Các phương pháp RL phổ biến hiện nay, mặc dù có khả năng toán học và mã hóa xuất sắc, đang gặp phải giới hạn. Chúng dựa quá nhiều vào các môi trường xác minh nhân tạo, hạn chế khả năng tổng quát hóa của chúng. Lộ trình năm 2026 của Zhipu rõ ràng hướng tới các mô hình RL tổng quát hơn—những mô hình có khả năng xử lý các chuỗi nhiệm vụ kéo dài hàng giờ hoặc hàng ngày đòi hỏi sự hiểu biết thực sự chứ không chỉ là so khớp mẫu dựa trên tiêu chí do con người đặt ra.

Sự chuyển đổi này quan trọng vì nó đánh dấu bước AI từ một bộ công cụ tinh vi trở thành một dạng gần như lý luận tự chủ.

Ranh giới chưa ai đề cập: Học liên tục

Có lẽ yếu tố táo bạo nhất trong kế hoạch 2026 của Zhipu là việc khám phá học liên tục và tiến hóa mô hình tự động. Các hệ thống AI ngày nay khi triển khai thường bị đóng băng. Chúng tích lũy kiến thức qua các quá trình huấn luyện đắt đỏ, một lần và rồi dần mất hiệu quả khi thế giới thay đổi. Ngược lại, bộ não con người liên tục học hỏi và thích nghi qua tương tác thực tế.

Xây dựng khả năng này là một ranh giới thực sự. Nó đòi hỏi phải xem xét lại toàn bộ từ các quy trình học trực tuyến đến việc tích hợp kiến thức liên tục mà không gây ra quên lãng thảm khốc. Thành công ở đây sẽ đánh dấu một bước chuyển đổi căn bản trong cách các hệ thống AI vận hành.

Zhipu đã lạc lối ở đâu (và DeepSeek đã giúp sửa chữa như thế nào )

Khoảnh khắc trung thực nhất của bản ghi nhớ là khi Tang Jie thừa nhận những sai lầm trong quá khứ. Trong giai đoạn từ 2023 đến 2024, trong bối cảnh bùng nổ các mô hình lớn toàn cầu và cuộc chiến “trăm mô hình” của Trung Quốc, Zhipu đã mắc những sai lầm chiến thuật—cả về kỹ thuật lẫn thương mại. Công ty bị phân tâm bởi đà ngắn hạn, mất tập trung vào các nguyên tắc cốt lõi của AGI.

Sự xuất hiện của DeepSeek đã như một lời thức tỉnh. Thay vì xem đó là áp lực cạnh tranh thuần túy, Tang Jie xem đó như một tín hiệu đặt lại mục tiêu. Công ty đã tái cấu trúc một cách có hệ thống, cắt bỏ hoạt động To C, tinh giản các nhóm phát triển sản phẩm, và thu hẹp phạm vi trọng tâm. Quan trọng hơn, Zhipu xác định lập trình là hướng đột phá của mình—một quyết định đúng đắn khi GLM-4.5 và sau này là GLM-4.7 thể hiện khả năng cạnh tranh thực sự với các chuẩn mực quốc tế.

AI quốc gia và chiến lược mở rộng toàn cầu

Một điểm phát triển phụ nhưng đáng chú ý: sáng kiến “AI Quốc gia” của Zhipu đang ngày càng thu hút quốc tế. Malaysia đã xây dựng nền tảng MaaS quốc gia dựa trên mô hình mã nguồn mở của GLM, biến công nghệ của Zhipu thành một phần hạ tầng nhà nước. Điều này phù hợp với các chiến lược thúc đẩy công nghệ AI Trung Quốc đạt được sự chấp nhận toàn cầu—nhưng cũng chứng tỏ khả năng phù hợp sản phẩm-thị trường rõ ràng vượt ra ngoài biên giới nội địa.

2026: Năm AI thay thế các lĩnh vực công việc

Dưới tất cả các cuộc thảo luận kỹ thuật là một tuyên bố táo bạo hơn: năm 2026 sẽ là năm bùng nổ để AI thực sự thay thế các lĩnh vực nghề nghiệp và nhiệm vụ cụ thể. Đây không phải là lời đồn thổi—mà dựa trên sự mở rộng thực tế của khả năng mô hình và tỷ lệ chấp nhận của nhà phát triển đã rõ ràng trong dữ liệu năm 2025.

Sáng kiến mới của công ty, X-Lab—một trung tâm đổi mới nội bộ nhằm thu hút tài năng trẻ và theo đuổi các khám phá tiên tiến bao gồm các kiến trúc mới và các mô hình nhận thức—cho thấy ban lãnh đạo tin rằng họ đang ở một điểm ngoặt, nơi những cược lớn trở nên cần thiết. Điều này gợi nhớ những thời điểm trước đây khi Zhipu đưa ra các quyết định rủi ro cao: huấn luyện GLM-130B khi các mô hình nhỏ chiếm ưu thế, hoặc đặt cược vào lập trình như là đột phá chính.

Điều này có ý nghĩa gì cho ngành công nghiệp

Việc ra mắt công khai và việc thiết lập lại chiến lược của Zhipu quan trọng vì chúng báo hiệu một sự điều chỉnh trong cách ngành AI Trung Quốc nghĩ về cạnh tranh. Thay vì chạy đua theo các ứng dụng rộng nhất hoặc theo đuổi quy mô vì chính nó, công ty đang quay trở lại các nguyên tắc nền tảng—và xem đó là chiến lược thắng thế. Sự thành công của chiến lược này có thể sẽ rõ ràng qua phản hồi của GLM-5 và tiến bộ thực tế về RL và học liên tục trong năm 2026.

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
0/400
Không có bình luận
  • Ghim