Các mô hình AI mới GPT-4.1 của OpenAI tập trung vào viết mã

GPT-4.1 của OpenAI tập trung vào viết mã với khả năng tạo token vượt trội và chi phí hợp lý.

: OpenAI vừa ra mắt dòng mô hình GPT-4.1 với các phiên bản mini và nano, tối ưu cho viết mã và theo dõi hướng dẫn. Mô hình có thể xử lý 1 triệu token cùng lúc, điểm cao trên các tiêu chuẩn mã nguồn nhưng vẫn chưa bằng các đối thủ như Google Gemini 2.5 Pro. GPT-4.1 có độ chính xác giảm khi xử lý lượng lớn token nhưng đã cải tiến từ phản hồi thực tế. Mức giá linh hoạt với mỗi phiên bản, giúp dễ tiếp cận cho người dùng.

OpenAI vừa công bố mô hình mới nhất của họ, GPT-4.1, tập trung vào khả năng viết mã và theo dõi hướng dẫn. Dòng sản phẩm bao gồm ba phiên bản: GPT-4.1, GPT-4.1 mini và GPT-4.1 nano, tất cả đều sử dụng API của OpenAI nhưng không tích hợp với ChatGPT. Với khả năng xử lý 1 triệu token trong một lần sử dụng, chúng có thể tiếp nhận khoảng 750,000 từ một lần, dài hơn cả "Chiến tranh và Hòa bình."

So với các đối thủ cạnh tranh như Google và Anthropic, OpenAI vẫn tỏ rõ tham vọng của mình. Các mô hình của Google như Gemini 2.5 Pro có khả năng tương đương về dung lượng xử lý token và đạt điểm cao hơn trong các bài kiểm tra mã nguồn phổ biến. Dù điểm số của GPT-4.1 chỉ từ 52% đến 54.6% trên SWE-bench, thấp hơn Gemini 2.5 Pro của Google (63.8%) và Claude 3.7 Sonnet của Anthropic (62.3%), OpenAI vẫn khẳng định về tiềm năng của mình với mục tiêu lâu dài là phát triển kỹ sư phần mềm ảo.

Gia tăng sức mạnh của mô hình, OpenAI đã cải tiến GPT-4.1 thông qua phản hồi từ người dùng thực tế, chú trọng vào các khía cạnh như: viết mã frontend, giảm thiểu các sửa đổi không cần thiết, và tuân thủ định dạng. Theo OpenAI, "Những cải tiến này cho phép các nhà phát triển tạo ra các đại lý tốt hơn trong các nhiệm vụ kỹ thuật phần mềm thực tế."

Chi phí cho các phiên bản GPT-4.1 cũng rất linh hoạt, với giá từ $0.10 đến $2 cho mỗi triệu token, giúp người dùng dễ dàng tiếp cận và sử dụng. Theo các kết quả thử nghiệm nội bộ, độ chính xác của GPT-4.1 giảm từ 84% với 8,000 token xuống 50% với 1 triệu token khi thực hiện bài kiểm tra OpenAI-MRCR. Điều này cho thấy một số hạn chế về tính chính xác của mô hình khi xử lý một lượng lớn dữ liệu đầu vào.

Cùng với khả năng cao trong viết mã, GPT-4.1 còn đạt kết quả ấn tượng trong khả năng hiểu nội dung video khi thử nghiệm với Video-MME. Tỷ lệ chính xác lên đến 72% trong danh mục video dài, không có phụ đề. Mặc dù có những hạn chế trong việc thực hiện một số nhiệm vụ phức tạp, OpenAI vẫn tiếp tục phát triển các mô hình của mình để cải thiện hiệu suất và tính ứng dụng thực tế.

Nguồn: TechCrunch, OpenAI Blog