Mô hình ảnh AI của Google Gemini nhận được một nâng cấp 'độc đáo'
Google Gemini ra mắt Gemini 2.5 Flash Image, cạnh tranh ChatGPT với tính năng chỉnh sửa ảnh AI mạnh mẽ.

Google đã ra mắt phiên bản mới của mô hình hình ảnh AI tên là Gemini 2.5 Flash Image cùng với chatbot Gemini. Tính năng mới này cho phép người dùng chỉnh sửa hình ảnh với độ chính xác cao hơn bằng cách sử dụng các yêu cầu từ ngôn ngữ tự nhiên, đồng thời duy trì tính nhất quán của khuôn mặt và các chi tiết khác. Điều này khác biệt so với nhiều công cụ đối thủ thường gặp vấn đề với sự biến đổi không mong muốn của các đối tượng trong ảnh.
Gemini 2.5 Flash Image đã bắt đầu được phát hành cho người dùng từ thứ Ba và có sẵn thông qua ứng dụng Gemini cùng với API Gemini, Google AI Studio và các nền tảng Vertex AI. Điều này cho phép các nhà phát triển tích hợp công cụ mạnh mẽ này vào các ứng dụng của họ một cách dễ dàng hơn và mở rộng sự tiếp cận của Google trong ngành công nghệ AI hình ảnh.
Nicole Brichtova, trưởng nhóm sản phẩm tại Google DeepMind, phát biểu rằng bản cập nhật này đẩy mạnh chất lượng hình ảnh cũng như khả năng làm theo hướng dẫn của mô hình. Điều đặc biệt thú vị là khả năng thực hiện các thay đổi liền mạch hơn, chẳng hạn như tạo ra hình ảnh hợp nhất từ nhiều tham chiếu trong một lần yêu cầu.
@ai_for_success trên nền tảng x.com đã tỏ ra rất bất ngờ và hào hứng với mô hình AI mới của Google khi nó xuất hiện trên LMArena dưới tên "nano-banana." Điều này cho thấy tầm ảnh hưởng của Google khi mô hình này được đón nhận rộng rãi bởi cộng đồng.
Gemini đang nỗ lực để bắt kịp với OpenAI và Meta trong cuộc đua công nghệ AI hình ảnh. Trong khi đó, Meta cũng vừa mới hợp tác với Midjourney để cấp phép các mô hình AI ảnh và video, còn Black Forest Labs tiếp tục dẫn đầu các đánh giá với mô hình FLUX AI của họ.
Nguồn: TechCrunch