Thuật toán OmniHuman-1 của ByteDance có thể là thuật toán deepfake chân thực nhất từ trước đến nay
OmniHuman-1 của ByteDance tạo deepfake chân thực từ một ảnh và đoạn âm thanh.

ByteDance vừa công bố một hệ thống AI mới có tên OmniHuman-1 cho phép tạo ra video deepfake chân thực gần giống thực tế, chỉ yêu cầu một bức ảnh và một đoạn âm thanh ngắn. Mặc dù sản phẩm chưa hoàn toàn hoàn hảo, các video tạo ra có chất lượng cao, trình diễn trong các ví dụ như bài TED Talk không thực sự diễn ra.
OmniHuman-1 sử dụng phương pháp 'omni-conditions', được huấn luyện trên 18.700 giờ dữ liệu video, cho phép học từ nhiều nguồn đầu vào như âm thanh, văn bản, và cử chỉ cùng lúc. Điều này giúp thuật toán giảm thiểu lãng phí dữ liệu và vượt xa các kỹ thuật deepfake trước đây.
Công nghệ này mang lại nhiều mối lo ngại về việc sử dụng deepfake để phát tán thông tin sai lệch và lừa đảo, như trường hợp một kẻ lừa đảo đã dùng AI giả mạo thành Brad Pitt và chiếm đoạt 850.000 đô-la. Mặc dù một số bang ở Mỹ đã ban hành luật chống lại deepfake ác ý, vẫn còn thiếu thốn luật pháp liên bang để quản lý.