OpenAI giới thiệu o3-pro, phiên bản cải tiến của mô hình suy luận AI o3

OpenAI ra mắt o3-pro, mô hình AI tốt nhất với giá $20/triệu tokens đầu vào và $80/triệu tokens đầu ra, đánh bại Gemini 2.5 Pro và Claude 4 Opus.

: OpenAI đã công bố o3-pro, phiên bản nâng cấp của mô hình AI o3, được thiết kế để cải thiện khả năng suy luận và xử lý các vấn đề phức tạp trong các lĩnh vực như vật lý, toán học và lập trình. o3-pro hiện có sẵn cho người dùng ChatGPT Pro, Team và sẽ sớm dành cho người dùng Enterprise và Edu, với giá API là $20 cho một triệu tokens đầu vào và $80 cho một triệu tokens đầu ra. o3-pro vượt qua các mô hình hàng đầu của Google và Anthropic trong các bài kiểm tra AI như AIME 2024 và GPQA Diamond. Tuy nhiên, mô hình này vẫn có một số hạn chế như thời gian phản hồi lâu hơn và không hỗ trợ tạo hình ảnh hoặc không gian Canvas.

OpenAI đã chính thức giới thiệu phiên bản nâng cấp của mô hình giải quyết vấn đề AI o3, mang tên o3-pro. Phiên bản này được thiết kế để cải thiện khả năng suy luận của AI, đem lại hiệu suất đáng kể hơn trong các lĩnh vực phức tạp như vật lý và toán học. Điều đặc biệt về mô hình này là khả năng xử lý vấn đề một cách tuần tự và chính xác, điều mà các mô hình AI truyền thống không thể thực hiện được. o3-pro đã thay thế cựu mô hình o1-pro trong các gói ChatGPT Pro và Team, và sẽ được tiếp cận bởi người dùng Enterprise và Edu trong thời gian ngắn sắp tới. Giá của o3-pro qua API là $20 cho mỗi triệu tokens đầu vào và $80 cho mỗi triệu tokens đầu ra, với triệu tokens đầu vào tương đương khoảng 750,000 từ.

Một điểm đáng chú ý là o3-pro đã đánh bại các mô hình AI hàng đầu như Gemini 2.5 Pro của Google trong bài kiểm tra AIME 2024, mà kiểm tra khả năng toán học của AI. Mô hình này cũng vượt qua Claude 4 Opus của Anthropic trong GPQA Diamond, một bài kiểm tra về kiến thức khoa học ở cấp độ Tiến sĩ. Đáng tiếc rằng, so với o1-pro, phản hồi của o3-pro mất nhiều thời gian hoàn thành hơn, và OpenAI vẫn đang xử lý một số vấn đề kỹ thuật liên quan đến chat tạm thời cùng mô hình này.

Ngoài các điểm mạnh về khả năng suy luận, o3-pro còn bị hạn chế bởi việc không thể tạo hình ảnh và không hỗ trợ không gian làm việc Canvas. Tuy nhiên, trong các đánh giá nội bộ, các chuyên gia đã luôn ưu tiên o3-pro hơn o3 trong tất cả các hạng mục thử nghiệm, đặc biệt là trong các lĩnh vực như khoa học, giáo dục, lập trình, hoạt động kinh doanh, và hỗ trợ viết lách. Mô hình này thậm chí còn được đánh giá cao hơn về tính rõ ràng, toàn diện, khả năng tuân theo hướng dẫn và độ chính xác.

Đáng lưu ý, o3-pro được trang bị các công cụ cho phép tìm kiếm web, phân tích tập tin, suy luận dựa trên đầu vào hình ảnh, sử dụng Python và cá nhân hóa phản hồi bằng bộ nhớ. Những tính năng này giúp nó cung cấp các phản hồi chi tiết và có giá trị hơn cho nhiều nhu cầu khác nhau. Tuy nhiên, hiện tại ActiveAI tạm thời vô hiệu hóa các cuộc trò chuyện không lưu trữ khi họ đang sửa một số vấn đề kỹ thuật xảy ra với hệ thống. Bên cạnh đó, công nghệ AI này chỉ được phân phối lại thông qua API dành cho các nhà phát triển, cho thấy OpenAI đang tìm cách mở rộng khả năng tích hợp rộng rãi của AI vào nhiều ứng dụng hơn trong tương lai.

Nguồn: OpenAI, TechCrunch