OpenAI đã phát hành mô hình suy luận mạnh nhất của o3 và o4-mini: có thể suy nghĩ về hình ảnh, tự động chọn công cụ và tạo đột phá trong toán học và hiệu suất mã hóa

2025-04-17 04:49:33

OpenAI hôm nay đã chính thức công bố các mô hình suy luận o3 và o4-mini, lần đầu tiên nhận ra suy luận hình ảnh và tích hợp đa công cụ, và cộng đồng lạc quan về tiềm năng của nó để thúc đẩy "tác nhân AI". (Tóm tắt: OpenAI bí mật xây dựng nền tảng xã hội của riêng mình, chỉ vào X của Musk) (Bổ sung nền: GPT-5 bị hoãn lại!) OpenAI lần đầu đẩy o3, o4-mini, Sam Altman tiết lộ: tích hợp khó hơn dự kiến) Gã khổng lồ trí tuệ nhân tạo OpenAI chính thức phát hành hai mô hình suy luận thế hệ mới - o3 và o4-mini vào sáng sớm (17), nhấn mạnh "suy luận hình ảnh" và khả năng sử dụng tất cả các công cụ ChatGPT một cách tự chủ, kích hoạt AI toàn cầu Cộng đồng các nhà phát triển đang xôn xao, tượng trưng cho một bước quan trọng khác hướng tới "AI thay thế" cho công ty. Toán học, mã hóa và các đột phá hiệu suất khác o3 được định vị là mô hình suy luận mạnh nhất của OpenAI cho đến nay, được thiết kế cho các tác vụ toán học, khoa học, viết mã và logic đồ họa phức tạp và đạt được hiệu suất hiện đại trong SWE-bench Verified (điểm chuẩn kỹ thuật phần mềm), với số điểm 69,1%, trước 62,3% của Claude 3,7 Sonnet. O4-mini vẫn giữ được sức mạnh lý luận cao trong khi tính đến chi phí và tốc độ, trở thành lựa chọn đầu tiên nhẹ cho các nhà phát triển. Theo dữ liệu thử nghiệm của OpenAI, hiệu suất của o4-mini trong AIME (Cuộc thi Toán học Mỹ) 2024 và 2025 lần lượt là 93,4% và 92,7%, vượt qua phiên bản đầy đủ của o3 và trở thành mô hình hiện tại có độ chính xác cao nhất; Ghi được 2700 điểm trong các cuộc thi Codeforces và xếp hạng trong số 200 kỹ sư hàng đầu trên thế giới. O3 và O4-mini tiếp tục phương pháp đào tạo định hướng suy luận được nhấn mạnh bởi dòng O, được thiết kế đặc biệt như một kiến trúc mô hình "suy nghĩ lâu hơn trước khi phản hồi", để AI không chỉ có thể phản ứng nhanh mà còn giải quyết các vấn đề phức tạp và nhiều bước. Thiết kế này cũng thể hiện rằng OpenAI tiếp tục đi bộ trong bối cảnh kỹ thuật "thời gian suy luận nhiều hơn = hiệu suất cao hơn" và kiểm tra giả thuyết này trong quá trình học tăng cường. Suy luận hình ảnh lần đầu tiên: AI có thể "hiểu sơ đồ, phác thảo và PDF" Bản cập nhật nổi bật nhất là cả hai mô hình đều có khả năng suy luận hình ảnh lần đầu tiên. O3 và O4-mini có thể hiểu và phân tích hình ảnh, ngay cả ở chất lượng thấp, chẳng hạn như bảng trắng viết tay, PDF mờ, phác thảo và biểu đồ thống kê và kết hợp các quy trình suy luận nhiều bước. Điều này có nghĩa là AI không chỉ có thể đọc và trả lời các hướng dẫn bằng văn bản mà còn có thể "suy nghĩ" logic và liên kết đằng sau hình ảnh, hướng tới một hệ thống đại lý đa phương thức thực sự. Ngoài việc cải thiện khả năng hiểu thị giác, các mô hình cũng có thể hoạt động trên hình ảnh, chẳng hạn như xoay, chia tỷ lệ hoặc xử lý biến dạng, biến hình ảnh thành một phần của chuỗi suy luận và mở ra các giải pháp mới cho các vấn đề đa phương thức. Tích hợp đa công cụ: từ "trò chuyện" đến "giải quyết công việc" Cả hai mô hình đều có thể tự động gọi các công cụ do ChatGPT cung cấp, bao gồm tìm kiếm, thực thi chương trình, DALL· E Tạo và phân tích hình ảnh để thực hiện quá trình tích hợp từ tiếp nhận hướng dẫn, nắm bắt thông tin đến lý luận trực quan. Khác với việc thực thi logic sử dụng công cụ thụ động trước đây, O3 và O4-mini có khả năng ra quyết định tự động và có thể tự động chọn bật các công cụ như tìm kiếm, thực thi chương trình hoặc tạo hình ảnh theo bản chất của vấn đề, hiển thị quy trình làm việc gần với quy trình làm việc của các chuyên gia con người. Cách áp dụng chính sách linh hoạt này cũng cho phép mô hình tự động điều chỉnh thứ tự và nội dung xử lý dựa trên đầu vào, đây là cột mốc quan trọng trong quá trình hướng tới "AI thay thế". OpenAI cũng ra mắt công cụ mã nguồn mở Codex CLI cho các nhà phát triển để tích hợp AI trong thiết bị đầu cuối cục bộ để hỗ trợ viết và gỡ lỗi mã. Codex CLI hiện là mã nguồn mở và một chương trình tài trợ phát triển trị giá hàng triệu đô la đang mở. Giá cả và tính khả dụng: o4-mini có lợi thế là "CP cao" Giá API mô hình o3 là 10 đô la cho mỗi triệu mã thông báo đầu vào và 40 đô la mã thông báo đầu ra; Trong khi đó, O4-MINI chỉ có giá 1,10 đô la và 4,40 đô la, kém hơn một chút về hiệu suất nhưng có lợi thế về chi phí áp đảo. Người dùng ChatGPT Plus ($ 20 / tháng), Pro ($ 200 / tháng) và Nhóm hiện có sẵn và các doanh nghiệp và tổ chức giáo dục sẽ có sẵn trong một tuần. OpenAI thể hiện rõ hướng tiến hóa của "AI suy luận" thông qua o3 và o4-mini, không chỉ cải thiện khả năng ngôn ngữ mà còn lần đầu tiên tích hợp khả năng hiểu hình ảnh và vận hành công cụ. Hai mô hình này không chỉ là một điểm cập nhật duy nhất mà còn là một sự chuyển đổi quan trọng từ ChatGPT sang proxy AI. Sự ra mắt trong tương lai của o3-pro (sẽ có sẵn cho người dùng Pro trong những tuần tới) và GPT-5, nếu vòng đột phá công nghệ này có thể được tích hợp, sẽ có cơ hội xác định thế hệ tiêu chuẩn sản phẩm AI tiếp theo. Báo cáo liên quan OpenAI tăng cường GPT-4o để lao lên vị trí thứ hai trong bảng xếp hạng! Sam Altman: Hiểu rõ hơn về con người và viết chương trình, tăng khả năng sáng tạo OpenAI thông báo: Open Agents SDK hỗ trợ MCP, kết nối mọi thứ theo chuỗi để thực hiện một bước quan trọng khác OpenAI ra mắt mô hình đồ thị mạnh nhất: đồ họa thông tin chính xác, đầu vào đa phương thức, thực tế và khó phân biệt, được tích hợp vào GPT-4o 〈OpenAI phát hành o3 và o4-mini Các mô hình suy luận mạnh nhất: có thể suy nghĩ về hình ảnh, tự động chọn công cụ, toán học, Bài viết này lần đầu tiên được xuất bản trong "Xu hướng năng động - Phương tiện truyền thông tin tức Blockchain có ảnh hưởng nhất" của BlockTempo.

O31.09%

GPT-1.64%

Xem bản gốc

Nội dung chỉ mang tính chất tham khảo, không phải là lời chào mời hay đề nghị. Không cung cấp tư vấn về đầu tư, thuế hoặc pháp lý. Xem Tuyên bố miễn trừ trách nhiệm để biết thêm thông tin về rủi ro.

Phần thưởng
Thích
Bình luận
Chia sẻ

Bình luận

0/400

Không có bình luận

Chủ đề
#BTC#
219k Trạng thái
#PI#
182k Trạng thái
#ETH#
139k Trạng thái
4#GateioInto11#
79k Trạng thái
5#ContentStar#
66k Trạng thái
6#GT#
61k Trạng thái
7#BOME#
60k Trạng thái
8#DOGE#
56k Trạng thái
9#MAGA#
52k Trạng thái
10#SLERF#
51k Trạng thái

Ghim

sơ đồ trang web