Mô hình ảnh AI của Google Gemini nhận được một nâng cấp 'độc đáo'

Google Gemini ra mắt Gemini 2.5 Flash Image, cạnh tranh ChatGPT với tính năng chỉnh sửa ảnh AI mạnh mẽ.

: Google đã cập nhật công cụ chỉnh sửa ảnh AI mới cho chatbot Gemini của họ, được gọi là Gemini 2.5 Flash Image. Công cụ này cho phép người dùng kiểm soát tốt hơn trong việc chỉnh sửa hình ảnh thông qua yêu cầu từ ngôn ngữ tự nhiên và giữ nguyên chi tiết khuôn mặt và các chi tiết khác mà các công cụ đối thủ thường không thực hiện tốt. Nicole Brichtova từ Google DeepMind nhấn mạnh rằng công cụ mới cải thiện chất lượng hình ảnh và khả năng tuân thủ các chỉ dẫn, làm cho các kết quả thích hợp hơn cho nhiều mục đích sử dụng khác nhau. Gemini hiện có khoảng 450 triệu người dùng hàng tháng, còn khá xa so với ChatGPT với hơn 700 triệu người dùng hàng tuần.

Google đã ra mắt phiên bản mới của mô hình hình ảnh AI tên là Gemini 2.5 Flash Image cùng với chatbot Gemini. Tính năng mới này cho phép người dùng chỉnh sửa hình ảnh với độ chính xác cao hơn bằng cách sử dụng các yêu cầu từ ngôn ngữ tự nhiên, đồng thời duy trì tính nhất quán của khuôn mặt và các chi tiết khác. Điều này khác biệt so với nhiều công cụ đối thủ thường gặp vấn đề với sự biến đổi không mong muốn của các đối tượng trong ảnh.

Gemini 2.5 Flash Image đã bắt đầu được phát hành cho người dùng từ thứ Ba và có sẵn thông qua ứng dụng Gemini cùng với API Gemini, Google AI Studio và các nền tảng Vertex AI. Điều này cho phép các nhà phát triển tích hợp công cụ mạnh mẽ này vào các ứng dụng của họ một cách dễ dàng hơn và mở rộng sự tiếp cận của Google trong ngành công nghệ AI hình ảnh.

Nicole Brichtova, trưởng nhóm sản phẩm tại Google DeepMind, phát biểu rằng bản cập nhật này đẩy mạnh chất lượng hình ảnh cũng như khả năng làm theo hướng dẫn của mô hình. Điều đặc biệt thú vị là khả năng thực hiện các thay đổi liền mạch hơn, chẳng hạn như tạo ra hình ảnh hợp nhất từ nhiều tham chiếu trong một lần yêu cầu.

@ai_for_success trên nền tảng x.com đã tỏ ra rất bất ngờ và hào hứng với mô hình AI mới của Google khi nó xuất hiện trên LMArena dưới tên "nano-banana." Điều này cho thấy tầm ảnh hưởng của Google khi mô hình này được đón nhận rộng rãi bởi cộng đồng.

Gemini đang nỗ lực để bắt kịp với OpenAI và Meta trong cuộc đua công nghệ AI hình ảnh. Trong khi đó, Meta cũng vừa mới hợp tác với Midjourney để cấp phép các mô hình AI ảnh và video, còn Black Forest Labs tiếp tục dẫn đầu các đánh giá với mô hình FLUX AI của họ.

Nguồn: TechCrunch