#Anthropic发布Fable5模型 Một mô hình, hai tên gọi: Anthropic phát hành Fable 5 và Mythos 5, mô hình mạnh nhất lần đầu tiên mở cho công chúng


6 tháng 9, Anthropic cùng lúc ra mắt hai mô hình mới——Claude Fable 5 và Claude Mythos 5. Điều thú vị là, chúng về cơ bản là cùng một mô hình nền, khác nhau chỉ ở mức "bảo vệ" và "mở rộng". Đây là lần đầu tiên mô hình mạnh nhất trong lịch sử của Anthropic được mở cho công chúng, đồng thời cũng là một cuộc thử nghiệm "phân cấp phát hành" hiếm hoi.
Bài viết này giúp bạn hiểu rõ: nó mạnh ở điểm nào, tại sao lại đặt hai tên, và cách sử dụng hiện tại.
Một, trước tiên cần rõ: mô hình "Mythos cấp" là gì?
Những người quen thuộc với Claude đều biết, các mô hình của Anthropic luôn chia thành ba cấp: Haiku (nhanh), Sonnet (cân đối), Opus (mạnh nhất). Và vào tháng 4 năm nay, Anthropic âm thầm giới thiệu một cấp mới vượt trên Opus——cấp Mythos. Mô hình Mythos đầu tiên (Claude Mythos Preview) không bán ra công khai, mà qua một kế hoạch gọi là Project Glasswing, hợp tác với chính phủ Mỹ, chỉ cung cấp cho một số tổ chức phòng thủ mạng và nhà cung cấp hạ tầng quan trọng.
Lý do rất rõ ràng: cấp độ này quá mạnh, đến mức có thể bị lạm dụng trong các lĩnh vực như tấn công mạng, nghiên cứu sinh học, nên Anthropic cho rằng không thể phát hành trực tiếp.
Hai mô hình ra mắt lần này chính là phiên bản chính thức của Mythos:
◆ Claude Fable 5: Phiên bản mở cho tất cả mọi người, đi kèm một bộ bảo vệ an toàn mới;
◆ Claude Mythos 5: Phiên bản giảm bớt phần bảo vệ, chỉ mở cho các đối tác hợp tác của Glasswing và các tổ chức tin cậy. Cả hai đều dựa trên cùng một mô hình nền. Tên gọi cũng có ý nghĩa: Fable xuất phát từ tiếng Latin fabula ("câu chuyện kể"), cùng nguồn gốc với mythos trong tiếng Hy Lạp——cùng gốc, khác biệt chỉ ở chỗ "có thể thoải mái nói chuyện" hay không.
Hai, nó mạnh đến mức nào?
Theo lời Anthropic, Fable 5 vượt xa bất kỳ mô hình nào công bố của công ty từ trước đến nay, đạt trình độ tiên tiến nhất (SOTA) trên hầu hết các chuẩn đánh giá AI, đặc biệt giỏi về kỹ thuật phần mềm, công việc tri thức, hiểu biết hình ảnh và nghiên cứu khoa học. Và càng dài, càng phức tạp, nó càng thể hiện sự vượt trội so với các mô hình cũ.
Viết mã: rút ngắn hai tháng thành một ngày. Công ty thanh toán Stripe trong thử nghiệm ban đầu báo cáo rằng, trong một kho mã Ruby 50 triệu dòng, Fable 5 hoàn thành toàn bộ di chuyển mã trong một ngày—— theo kế hoạch, cần một đội nhóm làm thủ công hơn hai tháng. Trong đánh giá FrontierCode của Cognition (nhà phát triển Devin), Fable 5 đạt điểm cao nhất trong các mô hình tiên tiến, đồng thời tiết kiệm token hơn.
Hình ảnh: chơi Pokémon FireRed không cần trợ giúp phức tạp. Các mô hình Claude trước đây phải dùng các công cụ hỗ trợ như bản đồ, điều hướng, trạng thái trò chơi để tiến, còn Fable 5 chỉ cần xem hình ảnh gốc của trò chơi là qua được toàn bộ. Nó còn có thể từ ảnh chụp màn hình trực tiếp tái tạo mã nguồn của một ứng dụng web.
Ký ức: chơi Slay the Spire đã ghi chú lại. Trong các nhiệm vụ dài hàng triệu token, Fable 5 duy trì sự tập trung liên tục, và dùng các ghi chú của chính nó để cải thiện hiệu suất. Trong thử nghiệm trò chơi thẻ bài Slay the Spire, sau khi cung cấp bộ nhớ dạng tập tin, hiệu năng của nó tăng gấp ba lần Opus 4.8.
Nghiên cứu: tăng tốc thiết kế thuốc khoảng 10 lần. Các chuyên gia thiết kế protein nội bộ của Anthropic dùng Mythos 5 để rút ngắn khoảng 10 lần các bước trong quy trình thiết kế thuốc——mô hình tự độc lập hoàn thành việc chọn vị trí liên kết, chạy công cụ thiết kế protein, phục hồi sau thất bại, tất cả đều thường do nhà khoa học thực hiện. Trong 14 mục tiêu protein, có 9 mục tạo ra các ứng viên thuốc đáng tiếp tục phát triển. Nó còn đề xuất một giả thuyết cơ chế mới về protein của vi khuẩn E. coli, sau đó được một phòng thí nghiệm độc lập xác nhận.
Ba, cách hoạt động của "bảo vệ": kích hoạt sẽ "hạ cấp" về Opus 4.8 Đây là thiết kế đáng chú ý nhất trong toàn bộ phát hành. Fable 5 trang bị một bộ phân loại an toàn mới (classifiers)——hệ thống AI độc lập ngoài mô hình chính, chuyên phát hiện các khả năng lạm dụng tiềm ẩn. Khi bộ phân loại cho rằng yêu cầu của bạn liên quan đến ba lĩnh vực nhạy cảm sau, câu trả lời sẽ không còn là Fable 5 nữa, mà tự động chuyển sang mô hình mạnh thứ hai Claude Opus 4.8 (người dùng sẽ nhận được thông báo):
1. An ninh mạng: Mythos rất giỏi phát hiện và khai thác lỗ hổng phần mềm, còn có khả năng "tấn công hacker tự động"——thăm dò, di chuyển ngang dọc toàn diện. Những khả năng này làm giảm đáng kể chi phí tấn công mạng, nên được đặc biệt chú ý phòng ngừa.
2. Sinh học và hóa học: mô hình đã có thể hoàn thành các nhiệm vụ nghiên cứu thực tế (ví dụ dự đoán cấu trúc virus), khả năng này rất nguy hiểm nếu rơi vào tay kẻ xấu, nên phần lớn yêu cầu trong lĩnh vực sinh hóa sẽ bị chuyển sang Opus.
3. Tấn công phân tán: ngăn chặn việc ai đó thu thập quy mô lớn khả năng của Fable 5 để huấn luyện các mô hình cạnh tranh.
Một số con số quan trọng: phần lớn các cuộc trò chuyện (trên 95%) không kích hoạt bộ phân loại, nghĩa là hơn 95% người dùng sẽ sử dụng gần như toàn bộ khả năng của Mythos 5. Anthropic thừa nhận rằng bộ phân loại còn khá bảo thủ, có thể gây nhầm lẫn với các yêu cầu vô hại, và sẽ cố gắng giảm thiểu các báo động sai. Về khả năng vượt tường, trong hơn 1000 giờ thử nghiệm lỗ hổng bên ngoài, chưa phát hiện "lỗ hổng toàn diện".
Một điểm đáng chú ý khác: toàn bộ lưu lượng của mô hình Mythos cấp sẽ bị giữ lại trong 30 ngày (kể cả khách hàng doanh nghiệp), để phòng chống các cuộc tấn công mới và vượt tường——Anthropic cam kết dữ liệu này không dùng để huấn luyện, đồng thời có các biện pháp bảo vệ quyền riêng tư như kiểm tra truy cập.
Bốn, Mythos 5: phiên bản không có bảo vệ dành cho "các nhóm tin cậy" Mythos 5 chính là phiên bản Fable 5 đã bỏ bớt phần bảo vệ, tự hào có khả năng an ninh mạng mạnh nhất toàn cầu. Hiện chỉ qua Project Glasswing cung cấp cho các tổ chức phòng thủ mạng, như một bản nâng cấp của Mythos Preview. Trong tương lai, Anthropic dự định mở rộng dần: đàm phán với chính phủ Mỹ để tăng số đối tác hợp tác; ra mắt kế hoạch truy cập tin cậy hệ thống hơn, để các tổ chức an ninh mạng có thể đăng ký; và mở cho các nhà nghiên cứu y sinh một kế hoạch tin cậy sinh học (bỏ phần bảo vệ sinh hóa, giữ phần bảo vệ an ninh mạng), nhằm thúc đẩy phát triển liệu pháp mới. Cách "cùng một mô hình, phân cấp theo danh tính" này là lần đầu tiên xuất hiện trong lịch sử phát hành AI tiên tiến.
Năm, giá cả và cách bắt đầu: trước ngày 22 tháng 6 là "thời gian miễn phí" giá API: nhập $10 / triệu token, xuất $50 / triệu token——ít hơn một nửa so với Mythos Preview. Định danh mô hình là claude-fable-5, API và các kế hoạch doanh nghiệp theo lượng tiêu thụ đều đã sẵn sàng. Người đăng ký cần chú ý lịch trình này:
◆ Từ nay đến 22 tháng 6: các gói Pro, Max, Team và doanh nghiệp miễn phí bao gồm Fable 5;
◆ Từ 23 tháng 6: sẽ bị loại khỏi các gói, muốn tiếp tục sử dụng phải mua điểm sử dụng (usage credits); nếu đủ khả năng, thời gian miễn phí có thể kéo dài;
◆ Sau đó: khi đủ năng lực tính toán, Anthropic dự định đưa Fable 5 trở lại các gói đăng ký tiêu chuẩn. Nói cách khác, hai tuần tới là thời gian trải nghiệm mô hình mạnh nhất miễn phí, độc giả quan tâm nên tranh thủ thử.
Sáu, kết luận: "Giải pháp mới" về khả năng và an toàn
Trong những năm gần đây, các phòng thí nghiệm tiên tiến thường chỉ có hai lựa chọn khi đối mặt với "mô hình quá mạnh": hoãn phát hành hoặc giảm khả năng. Anthropic lần này đưa ra một lựa chọn thứ ba——phát hành toàn diện, nhưng trang bị "bảo vệ động" cho phiên bản công chúng; đồng thời giữ lại bản đầy đủ cho các tổ chức tin cậy.
Phương án này không hoàn hảo: 5% các trường hợp nhầm lẫn có thể gây thất vọng cho một số người dùng chuyên nghiệp (đặc biệt là các nhà nghiên cứu an ninh và sinh học), và việc giữ dữ liệu trong 30 ngày có thể gây tranh cãi về quyền riêng tư. Nhưng nó thực sự giúp "mô hình mạnh nhất" lần đầu tiên không bị khóa trong các dự án hợp tác chính phủ, mà theo cách kiểm soát được đưa vào các cuộc đối thoại của mọi người. Khi AI có thể hoàn thành công việc của nhóm hai tháng trong một ngày, và tự thiết kế các thuốc protein tiềm năng, thì "cách phát hành" đã trở thành một phần quan trọng không kém "làm ra sản phẩm". Từ "Fable" và "Mythos" cùng nguồn gốc có thể trở thành mẫu tham khảo cho tất cả các mô hình tiên tiến trong tương lai.
Xem bản gốc
ShanDingMediaRyak
#Anthropic发布Fable5模型 Một mô hình, hai tên gọi: Anthropic phát hành Fable 5 và Mythos 5, mô hình mạnh nhất lần đầu tiên mở cho công chúng

9 tháng 6, Anthropic cùng lúc ra mắt hai mô hình mới—Claude Fable 5 và Claude Mythos 5. Điều thú vị là chúng về cơ bản là cùng một mô hình nền, khác nhau chỉ ở mức "bảo vệ" và "mở rộng". Đây là lần đầu tiên mô hình có khả năng mạnh nhất trong lịch sử của Anthropic được mở cho công chúng, đồng thời cũng là một thử nghiệm "phân cấp phát hành" hiếm hoi.
Bài viết này giúp bạn hiểu rõ: nó mạnh ở điểm nào, tại sao lại đặt hai tên khác nhau, và cách sử dụng nó hiện nay.

Một, trước tiên cần rõ: mô hình "Mythos cấp" là gì?
Những người quen thuộc với Claude đều biết, các mô hình của Anthropic luôn chia thành ba cấp: Haiku (nhanh), Sonnet (cân đối), Opus (mạnh nhất). Và vào tháng 4 năm nay, Anthropic âm thầm giới thiệu một cấp mới vượt trên Opus—cấp Mythos. Mô hình Mythos đầu tiên (Claude Mythos Preview) không được bán ra công khai, mà qua một kế hoạch gọi là Project Glasswing, hợp tác với chính phủ Mỹ, chỉ cung cấp cho một số tổ chức phòng thủ mạng và nhà cung cấp hạ tầng quan trọng.
Lý do rất rõ ràng: cấp độ này quá mạnh, có thể bị lạm dụng trong các lĩnh vực tấn công mạng, nghiên cứu sinh học, nên Anthropic cho rằng không thể phát hành trực tiếp.
Hai mô hình ra mắt lần này chính là phiên bản chính thức của cấp Mythos:
◆ Claude Fable 5: Phiên bản mở cho tất cả mọi người, đi kèm một bộ "bảo vệ an toàn" mới;
◆ Claude Mythos 5: Phiên bản giảm bớt phần bảo vệ, chỉ mở cho các đối tác hợp tác như Glasswing. Cả hai đều dựa trên cùng một mô hình nền. Tên gọi cũng có ý nghĩa: Fable xuất phát từ tiếng Latin fabula ("câu chuyện kể"), cùng nguồn gốc với mythos trong tiếng Hy Lạp—cùng gốc, khác biệt chỉ ở chỗ "có thể thoải mái nói chuyện" hay không.

Hai, nó mạnh đến mức nào?
Theo lời của Anthropic, Fable 5 vượt xa mọi mô hình mà công ty từng công bố, đạt trình độ tiên tiến nhất (SOTA) trên hầu hết các chuẩn đánh giá AI, đặc biệt giỏi trong lĩnh vực kỹ thuật phần mềm, công việc tri thức, hiểu thị giác và nghiên cứu khoa học. Và càng dài, càng phức tạp, nó càng thể hiện vượt trội so với các mô hình cũ.
Viết mã: rút ngắn hai tháng thành một ngày. Công ty thanh toán Stripe trong thử nghiệm ban đầu báo cáo rằng, trong một kho mã Ruby 50 triệu dòng, Fable 5 hoàn thành toàn bộ quá trình chuyển đổi mã trong một ngày—trong kế hoạch ban đầu, cần một đội nhóm làm thủ công hơn hai tháng. Trong đánh giá FrontierCode của Cognition (nhà phát triển Devin), Fable 5 đạt điểm cao nhất trong các mô hình tiên tiến, đồng thời tiết kiệm token hơn.
Thị giác: chơi Pokémon FireRed mà không cần công cụ hỗ trợ phức tạp (bản đồ, điều hướng, trạng thái trò chơi), chỉ dựa vào hình ảnh gốc của trò chơi để vượt qua toàn bộ. Nó còn có thể từ ảnh chụp màn hình trực tiếp tái tạo mã nguồn của một ứng dụng web.
Ký ức: chơi Slay the Spire và ghi chú lại. Trong các nhiệm vụ dài hàng triệu token, Fable 5 duy trì sự tập trung liên tục, và dùng các ghi chú của chính nó để cải thiện hiệu suất. Trong thử nghiệm trò chơi thẻ bài Slay the Spire, sau khi cung cấp bộ nhớ dạng tập tin, hiệu năng tăng gấp ba lần Opus 4.8.
Nghiên cứu: tăng tốc thiết kế thuốc khoảng 10 lần. Các chuyên gia thiết kế protein nội bộ của Anthropic dùng Mythos 5 để rút ngắn quy trình thiết kế thuốc khoảng mười lần—mô hình tự độc lập hoàn thành các bước chọn vị trí liên kết, chạy công cụ thiết kế protein, phục hồi sau thất bại, những bước thường do nhà khoa học thực hiện. Trong 14 mục tiêu protein, có 9 mục đã cho ra các ứng viên thuốc tiềm năng để tiếp tục nghiên cứu. Nó còn đề xuất một giả thuyết mới về cơ chế protein của E. coli, sau đó được một phòng thí nghiệm độc lập xác nhận.

Ba, cách hoạt động của "bảo vệ": kích hoạt sẽ "hạ cấp" về Opus 4.8
Đây là điểm thiết kế thú vị nhất trong toàn bộ phát hành. Fable 5 đi kèm một bộ phân loại an toàn mới—một hệ thống AI độc lập ngoài mô hình chính, chuyên phát hiện các khả năng lạm dụng tiềm ẩn. Khi bộ phân loại này cho rằng yêu cầu của bạn liên quan đến ba lĩnh vực nhạy cảm sau, câu trả lời sẽ không còn là Fable 5 nữa, mà tự động chuyển sang mô hình mạnh thứ hai là Claude Opus 4.8 (người dùng sẽ nhận được thông báo):
1. An ninh mạng: Mythos rất giỏi phát hiện và khai thác lỗ hổng phần mềm, còn có khả năng "tấn công hacker tự động"—quét, di chuyển ngang, toàn bộ chuỗi. Những khả năng này làm giảm đáng kể chi phí tấn công mạng, nên được đặc biệt chú ý phòng ngừa.
2. Sinh học và Hóa học: mô hình đã có thể hoàn thành các nhiệm vụ nghiên cứu thực tế (ví dụ dự đoán cấu trúc virus), khả năng này rất nguy hiểm nếu rơi vào tay kẻ xấu, nên hầu hết yêu cầu trong lĩnh vực sinh hóa đều sẽ bị chuyển sang Opus.
3. Tấn công phân tán: ngăn chặn việc "rút trộm" quy mô lớn khả năng của Fable 5 để huấn luyện các mô hình cạnh tranh.
Một số con số quan trọng: phần lớn các cuộc trò chuyện (trung bình dưới 5%) sẽ kích hoạt bộ phân loại, nghĩa là hơn 95% người dùng vẫn sử dụng gần như toàn bộ khả năng của Mythos 5. Anthropic thừa nhận rằng bộ phân loại còn khá bảo thủ, dễ gây nhầm lẫn với các yêu cầu vô hại, và sẽ cố gắng giảm thiểu các báo động sai. Về khả năng vượt tường, trong hơn 1000 giờ thử nghiệm bẫy lỗi từ bên ngoài, chưa phát hiện "lỗ hổng toàn diện".
Một điểm đáng chú ý khác: tất cả lưu lượng của mô hình Mythos cấp sẽ bị giữ lại trong 30 ngày (kể cả khách doanh nghiệp), để phòng chống các cuộc tấn công mới và vượt tường—Anthropic cam kết dữ liệu này không dùng để huấn luyện, đồng thời trang bị các biện pháp bảo vệ quyền riêng tư như kiểm tra truy cập.

Bốn, Mythos 5: phiên bản không có bảo vệ dành cho "cộng đồng tin cậy"
Mythos 5 chính là Fable 5 đã bỏ bớt phần bảo vệ, tự hào có khả năng an ninh mạng mạnh nhất toàn cầu. Hiện chỉ qua Project Glasswing, dành cho các tổ chức phòng thủ mạng, như một bản nâng cấp của Mythos Preview. Trong tương lai, Anthropic dự kiến mở rộng dần: đàm phán với chính phủ Mỹ để tăng số đối tác; ra mắt chương trình truy cập tin cậy hệ thống hơn, cho phép các tổ chức an ninh mạng đăng ký; và mở rộng cho các nhà nghiên cứu y sinh, với một chương trình tin cậy sinh học (bỏ phần bảo vệ sinh hóa, giữ phần bảo vệ an ninh mạng), nhằm thúc đẩy phát triển liệu pháp mới. Cách "cùng một mô hình, phân cấp theo danh tính mở khóa" này là lần đầu tiên trong lịch sử phát hành AI tiên tiến.

Năm, giá cả và cách bắt đầu: trước ngày 22 tháng 6 là "giai đoạn miễn phí"
Giá API trong thời gian này: nhập $10 / triệu token, xuất $50 / triệu token—ít hơn một nửa so với Mythos Preview. Định danh mô hình là claude-fable-5, API và các gói doanh nghiệp theo lượng sẽ chính thức hoạt động từ hôm nay. Người đăng ký cần chú ý lịch trình:
◆ Từ nay đến 22 tháng 6: các gói Pro, Max, Team và doanh nghiệp đều miễn phí bao gồm Fable 5;
◆ Từ 23 tháng 6: sẽ bị loại khỏi các gói, muốn tiếp tục dùng phải mua điểm sử dụng; nếu đủ khả năng, có thể gia hạn miễn phí;
◆ Sau đó: khi đủ năng lực tính toán, Anthropic dự định đưa Fable 5 trở lại các gói đăng ký tiêu chuẩn. Nói cách khác, hai tuần tới là thời gian trải nghiệm miễn phí mô hình mạnh nhất, độc giả quan tâm nên tranh thủ thử.

Sáu, kết luận: "Giải pháp mới" cho khả năng và an toàn
Trong vài năm qua, các phòng thí nghiệm tiên tiến chỉ có hai lựa chọn khi "mô hình quá mạnh": hoãn phát hành hoặc giảm khả năng. Anthropic lần này đưa ra một lựa chọn thứ ba—phát hành toàn bộ, nhưng trang bị "bảo vệ động" cho phiên bản công khai; đồng thời giữ lại bản đầy đủ cho các tổ chức tin cậy.
Phương án này không hoàn hảo: 5% các trường hợp nhầm lẫn có thể gây thất vọng cho một số người dùng chuyên nghiệp (đặc biệt là các nhà nghiên cứu an ninh và sinh học), và việc giữ dữ liệu trong 30 ngày có thể gây tranh cãi về quyền riêng tư. Nhưng nó thực sự giúp "mạnh nhất" lần đầu tiên không bị khóa trong các dự án hợp tác chính phủ, mà có thể vào đối thoại của mọi người theo cách kiểm soát được. Khi AI có thể hoàn thành công việc của nhóm hai tháng trong một ngày, và tự thiết kế các thuốc protein tiềm năng, thì "cách phát hành" đã trở thành một phần quan trọng không kém "làm ra sản phẩm". Từ "Fable" và "Mythos" cùng nguồn gốc có thể trở thành mẫu tham khảo cho tất cả các mô hình tiên tiến trong tương lai.
repost-content-media
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • 11
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
HighAmbition
· 2phút trước
Thông tin tốt 👍
Xem bản gốcTrả lời0
MrFlower_XingChen
· 2giờ trước
Đến Mặt Trăng 🌕
Xem bản gốcTrả lời0
MrFlower_XingChen
· 2giờ trước
Đến Mặt Trăng 🌕
Xem bản gốcTrả lời0
StablecoinWin
· 5giờ trước
Kiên định HODL💎
Xem bản gốcTrả lời0
StablecoinWin
· 5giờ trước
Mua vào đáy 😎
Xem bản gốcTrả lời0
StablecoinWin
· 5giờ trước
Nhanh lên, lên xe đi!🚗
Xem bản gốcTrả lời0
StablecoinWin
· 5giờ trước
Chỉ cần xông lên là xong 👊
Xem bản gốcTrả lời0
MasterChuTheOldDemonMasterChu
· 6giờ trước
Kiên định HODL💎
Xem bản gốcTrả lời0
discovery
· 7giờ trước
Đến Mặt Trăng 🌕
Xem bản gốcTrả lời0
discovery
· 7giờ trước
2026 GOGOGO 👊
Trả lời0
Xem thêm
  • Đã ghim