Trong bối cảnh toàn cầu ngày càng bị đánh dấu bởi sự cạnh tranh công nghệ giữa Mỹ và Trung Quốc, Ant Group, do Alibaba kiểm soát, đang thực hiện những bước quan trọng để giảm sự phụ thuộc vào vi mạch của Mỹ và kiềm chế chi phí trong việc phát triển các mô hình trí tuệ nhân tạo (AI).
Theo các nguồn tin gần gũi với công ty, Ant đang dựa vào semiconduttori cinesi để đào tạo các mô hình ngôn ngữ tiên tiến của mình, sử dụng một phương pháp hứa hẹn sẽ cách mạng hóa cách sản xuất AI ở quốc gia châu Á này.
Bước ngoặt chiến lược trong đào tạo mô hình AI cho Tập đoàn Ant
Trong vài tháng gần đây, Ant Group đã áp dụng các chip do các công ty địa phương cung cấp, bao gồm các thực thể liên quan đến Alibaba và Huawei Technologies, để đào tạo các mô hình AI của mình bằng kỹ thuật Mixture of Experts (MoE).
Cách tiếp cận này, ngày càng phổ biến trong số các nhà nghiên cứu, cho phép phân chia hiệu quả các nhiệm vụ giữa các "experti" khác nhau trong mô hình, cải thiện hiệu suất tính toán của nó.
Các nguồn tin khẳng định rằng kết quả của các mô hình này không chỉ so sánh được với những kết quả đạt được bằng chip Nvidia H800. Tuy nhiên, trong một số thử nghiệm, chúng thậm chí còn vượt qua hiệu suất của các mô hình do Meta phát triển.
Mặc dù Bloomberg News chưa xác minh độc lập những thành tích này, nhưng dữ liệu cho thấy sự tiến bộ đáng kể trong nỗ lực của Trung Quốc nhằm giảm chi phí vận hành và giảm sự phụ thuộc vào công nghệ.
Kỹ thuật MoE được lấy cảm hứng từ nguyên tắc ủy quyền chuyên biệt: mỗi mô-đun con của mô hình chịu trách nhiệm cho một phần cụ thể của quá trình xử lý, cho phép khả năng mở rộng và hiệu quả cao hơn so với các phương pháp truyền thống.
Ngoài Ant Group, Google và công ty khởi nghiệp Trung Quốc từ Hàng Châu DeepSeek cũng đang áp dụng phương pháp này.
Ant đã nhấn mạnh cam kết của mình đối với việc phổ biến khoa học bằng cách công bố một bài báo nhấn mạnh mục tiêu mở rộng các mô hình mà không cần sử dụng GPU cao cấp.
Cách tiếp cận này trở nên quan trọng đối với các công ty mà do chi phí cao, không thể đủ khả năng sử dụng liên tục phần cứng hiệu suất cao.
Trung Quốc vs Hoa Kỳ: chip nội địa đối đầu với GPU của Mỹ
Sáng kiến của Ant phù hợp với bối cảnh địa chính trị trong đó các công ty công nghệ Trung Quốc đang cố gắng vượt qua các hạn chế của Mỹ đối với việc xuất khẩu các vi mạch tiên tiến, chẳng hạn như Nvidia H800.
Mặc dù nó không phải là chip tiên tiến nhất trên thị trường, nhưng H800 vẫn là một trong những GPU mạnh mẽ nhất có sẵn tại Trung Quốc.
Mặc dù Ant Group vẫn duy trì một phần sản xuất AI dựa trên chip Nvidia, công ty đang dần chuyển sang những lựa chọn kinh tế hơn và dễ tiếp cận hơn. Như những sản phẩm được cung cấp bởi AMD và các nhà sản xuất Trung Quốc.
Lựa chọn chiến lược này đánh dấu một sự ra đi khỏi tầm nhìn của Giám đốc Điều hành Nvidia, Jensen Huang, theo người mà các công ty sẽ tiếp tục yêu cầu ngày càng nhiều sức mạnh tính toán.
Theo Huang, đầu tư của khách hàng sẽ không giảm, ngay cả khi xuất hiện nhiều mô hình hiệu quả hơn như DeepSeek R1. Do đó, điều này cho thấy sự tương phản rõ rệt với triết lý được Ant áp dụng.
Một trong những điểm nổi bật trong phân tích của Ant liên quan đến việc giảm đáng kể chi phí đào tạo các mô hình AI
Theo tài liệu đã công bố, việc đào tạo một mô hình trên một triệu triệu token, các đơn vị cơ bản được sử dụng để học, truyền thống tốn khoảng 6,35 triệu nhân dân tệ ( khoảng 880.000 đô la ).
Bằng cách sử dụng các chip hiệu suất thấp hơn, được tối ưu hóa cho phương pháp MoE, chi phí đã được giảm xuống còn 5,1 triệu nhân dân tệ.
Một khoản tiết kiệm không nhỏ, có thể cách mạng hóa khả năng tiếp cận trí tuệ nhân tạo đặc biệt cho các công ty khởi nghiệp và các lĩnh vực công nghiệp đang nổi.
Các mô hình được phát triển, Ling-Lite và Ling-Plus, đã được thiết kế cho các ứng dụng trong các bối cảnh như chăm sóc sức khỏe và tài chính, hai lĩnh vực mà sức mạnh của AI có thể cung cấp các giải pháp cụ thể và ngay lập tức.
Chính xác trong lĩnh vực chăm sóc sức khỏe, Ant vừa mới mua lại Haodf.com, một trong những nền tảng y tế trực tuyến hàng đầu tại Trung Quốc. Do đó, xác nhận sự quan tâm của họ trong việc mở rộng cung cấp các giải pháp dựa trên trí tuệ nhân tạo.
Trong số các dịch vụ hiện có của công ty còn có Zhixiaobao, một trợ lý ảo, và nền tảng tư vấn tài chính Maxiaocai.
“html Mở đầu và tương lai của trí tuệ nhân tạo Trung Quốc “
Một điểm đặc biệt khác trong chiến lược của Ant là sự lựa chọn làm cho các mô hình của họ mã nguồn mở: Ling-Lite có 16,8 tỷ tham số, trong khi Ling-Plus đạt 290 tỷ.
Để so sánh, ước tính rằng GPT-4.5, mô hình tiên tiến được phát triển bởi OpenAI, có khoảng 1,8 triệu tỷ tham số. Mặc dù nó đã bị đóng và không thể truy cập công khai. Nghiên cứu được thực hiện bởi Ant không phải không có thách thức.
Nghiên cứu tương tự chỉ ra rằng, trong quá trình huấn luyện, những biến thể nhỏ trong cấu trúc của các mô hình hoặc trong loại phần cứng có thể tạo ra sự không ổn định trong hiệu suất, chẳng hạn như sự gia tăng trong tỷ lệ lỗi.
Một khó khăn cấu trúc cho thấy rằng, bất chấp sự tiến bộ, ngay cả những mô hình tiên tiến nhất cũng cần được chú ý liên tục.
Như Robin Yu, CTO của công ty công nghệ Bắc Kinh Shengshang Tech đã quan sát, những kết quả hữu hình đạt được trong thế giới thực mới là điều thực sự quan trọng:
“Nếu bạn tìm thấy một điểm yếu để đánh bại bậc thầy kung fu giỏi nhất thế giới, bạn vẫn đã chiến thắng.”
Một phép ẩn dụ hiệu quả nhấn mạnh giá trị của các ứng dụng thực tiễn so với sự so sánh lý thuyết đơn thuần.
Điều rõ ràng là Tập đoàn Ant đang đóng vai trò chủ chốt trong nỗ lực của Trung Quốc nhằm trở nên tự chủ hơn về công nghệ.
Theo đuổi một AI dễ tiếp cận hơn, ít phụ thuộc vào phần cứng phương Tây và có khả năng hiệu quả hơn cho các lĩnh vực công nghiệp chiến lược trong tương lai.
Thách thức đối với các ông lớn AI phương Tây đã được khởi xướng: không phải để vượt qua họ bằng sức mạnh thô bạo mà bằng trí tuệ, hiệu quả và tầm nhìn chiến lược.
Xem bản gốc
Nội dung chỉ mang tính chất tham khảo, không phải là lời chào mời hay đề nghị. Không cung cấp tư vấn về đầu tư, thuế hoặc pháp lý. Xem Tuyên bố miễn trừ trách nhiệm để biết thêm thông tin về rủi ro.
Tập đoàn Ant tập trung vào chip Trung Quốc để củng cố chiến lược của mình trong trí tuệ nhân tạo (AI)
Trong bối cảnh toàn cầu ngày càng bị đánh dấu bởi sự cạnh tranh công nghệ giữa Mỹ và Trung Quốc, Ant Group, do Alibaba kiểm soát, đang thực hiện những bước quan trọng để giảm sự phụ thuộc vào vi mạch của Mỹ và kiềm chế chi phí trong việc phát triển các mô hình trí tuệ nhân tạo (AI).
Theo các nguồn tin gần gũi với công ty, Ant đang dựa vào semiconduttori cinesi để đào tạo các mô hình ngôn ngữ tiên tiến của mình, sử dụng một phương pháp hứa hẹn sẽ cách mạng hóa cách sản xuất AI ở quốc gia châu Á này.
Bước ngoặt chiến lược trong đào tạo mô hình AI cho Tập đoàn Ant
Trong vài tháng gần đây, Ant Group đã áp dụng các chip do các công ty địa phương cung cấp, bao gồm các thực thể liên quan đến Alibaba và Huawei Technologies, để đào tạo các mô hình AI của mình bằng kỹ thuật Mixture of Experts (MoE).
Cách tiếp cận này, ngày càng phổ biến trong số các nhà nghiên cứu, cho phép phân chia hiệu quả các nhiệm vụ giữa các "experti" khác nhau trong mô hình, cải thiện hiệu suất tính toán của nó.
Các nguồn tin khẳng định rằng kết quả của các mô hình này không chỉ so sánh được với những kết quả đạt được bằng chip Nvidia H800. Tuy nhiên, trong một số thử nghiệm, chúng thậm chí còn vượt qua hiệu suất của các mô hình do Meta phát triển.
Mặc dù Bloomberg News chưa xác minh độc lập những thành tích này, nhưng dữ liệu cho thấy sự tiến bộ đáng kể trong nỗ lực của Trung Quốc nhằm giảm chi phí vận hành và giảm sự phụ thuộc vào công nghệ.
Kỹ thuật MoE được lấy cảm hứng từ nguyên tắc ủy quyền chuyên biệt: mỗi mô-đun con của mô hình chịu trách nhiệm cho một phần cụ thể của quá trình xử lý, cho phép khả năng mở rộng và hiệu quả cao hơn so với các phương pháp truyền thống.
Ngoài Ant Group, Google và công ty khởi nghiệp Trung Quốc từ Hàng Châu DeepSeek cũng đang áp dụng phương pháp này.
Ant đã nhấn mạnh cam kết của mình đối với việc phổ biến khoa học bằng cách công bố một bài báo nhấn mạnh mục tiêu mở rộng các mô hình mà không cần sử dụng GPU cao cấp.
Cách tiếp cận này trở nên quan trọng đối với các công ty mà do chi phí cao, không thể đủ khả năng sử dụng liên tục phần cứng hiệu suất cao.
Trung Quốc vs Hoa Kỳ: chip nội địa đối đầu với GPU của Mỹ
Sáng kiến của Ant phù hợp với bối cảnh địa chính trị trong đó các công ty công nghệ Trung Quốc đang cố gắng vượt qua các hạn chế của Mỹ đối với việc xuất khẩu các vi mạch tiên tiến, chẳng hạn như Nvidia H800.
Mặc dù nó không phải là chip tiên tiến nhất trên thị trường, nhưng H800 vẫn là một trong những GPU mạnh mẽ nhất có sẵn tại Trung Quốc.
Mặc dù Ant Group vẫn duy trì một phần sản xuất AI dựa trên chip Nvidia, công ty đang dần chuyển sang những lựa chọn kinh tế hơn và dễ tiếp cận hơn. Như những sản phẩm được cung cấp bởi AMD và các nhà sản xuất Trung Quốc.
Lựa chọn chiến lược này đánh dấu một sự ra đi khỏi tầm nhìn của Giám đốc Điều hành Nvidia, Jensen Huang, theo người mà các công ty sẽ tiếp tục yêu cầu ngày càng nhiều sức mạnh tính toán.
Theo Huang, đầu tư của khách hàng sẽ không giảm, ngay cả khi xuất hiện nhiều mô hình hiệu quả hơn như DeepSeek R1. Do đó, điều này cho thấy sự tương phản rõ rệt với triết lý được Ant áp dụng.
Một trong những điểm nổi bật trong phân tích của Ant liên quan đến việc giảm đáng kể chi phí đào tạo các mô hình AI
Theo tài liệu đã công bố, việc đào tạo một mô hình trên một triệu triệu token, các đơn vị cơ bản được sử dụng để học, truyền thống tốn khoảng 6,35 triệu nhân dân tệ ( khoảng 880.000 đô la ).
Bằng cách sử dụng các chip hiệu suất thấp hơn, được tối ưu hóa cho phương pháp MoE, chi phí đã được giảm xuống còn 5,1 triệu nhân dân tệ.
Một khoản tiết kiệm không nhỏ, có thể cách mạng hóa khả năng tiếp cận trí tuệ nhân tạo đặc biệt cho các công ty khởi nghiệp và các lĩnh vực công nghiệp đang nổi.
Các mô hình được phát triển, Ling-Lite và Ling-Plus, đã được thiết kế cho các ứng dụng trong các bối cảnh như chăm sóc sức khỏe và tài chính, hai lĩnh vực mà sức mạnh của AI có thể cung cấp các giải pháp cụ thể và ngay lập tức.
Chính xác trong lĩnh vực chăm sóc sức khỏe, Ant vừa mới mua lại Haodf.com, một trong những nền tảng y tế trực tuyến hàng đầu tại Trung Quốc. Do đó, xác nhận sự quan tâm của họ trong việc mở rộng cung cấp các giải pháp dựa trên trí tuệ nhân tạo.
Trong số các dịch vụ hiện có của công ty còn có Zhixiaobao, một trợ lý ảo, và nền tảng tư vấn tài chính Maxiaocai.
“
html Mở đầu và tương lai của trí tuệ nhân tạo Trung Quốc “
Một điểm đặc biệt khác trong chiến lược của Ant là sự lựa chọn làm cho các mô hình của họ mã nguồn mở: Ling-Lite có 16,8 tỷ tham số, trong khi Ling-Plus đạt 290 tỷ.
Để so sánh, ước tính rằng GPT-4.5, mô hình tiên tiến được phát triển bởi OpenAI, có khoảng 1,8 triệu tỷ tham số. Mặc dù nó đã bị đóng và không thể truy cập công khai. Nghiên cứu được thực hiện bởi Ant không phải không có thách thức.
Nghiên cứu tương tự chỉ ra rằng, trong quá trình huấn luyện, những biến thể nhỏ trong cấu trúc của các mô hình hoặc trong loại phần cứng có thể tạo ra sự không ổn định trong hiệu suất, chẳng hạn như sự gia tăng trong tỷ lệ lỗi.
Một khó khăn cấu trúc cho thấy rằng, bất chấp sự tiến bộ, ngay cả những mô hình tiên tiến nhất cũng cần được chú ý liên tục.
Như Robin Yu, CTO của công ty công nghệ Bắc Kinh Shengshang Tech đã quan sát, những kết quả hữu hình đạt được trong thế giới thực mới là điều thực sự quan trọng:
“Nếu bạn tìm thấy một điểm yếu để đánh bại bậc thầy kung fu giỏi nhất thế giới, bạn vẫn đã chiến thắng.”
Một phép ẩn dụ hiệu quả nhấn mạnh giá trị của các ứng dụng thực tiễn so với sự so sánh lý thuyết đơn thuần.
Điều rõ ràng là Tập đoàn Ant đang đóng vai trò chủ chốt trong nỗ lực của Trung Quốc nhằm trở nên tự chủ hơn về công nghệ.
Theo đuổi một AI dễ tiếp cận hơn, ít phụ thuộc vào phần cứng phương Tây và có khả năng hiệu quả hơn cho các lĩnh vực công nghiệp chiến lược trong tương lai.
Thách thức đối với các ông lớn AI phương Tây đã được khởi xướng: không phải để vượt qua họ bằng sức mạnh thô bạo mà bằng trí tuệ, hiệu quả và tầm nhìn chiến lược.