Công nghệ AI mới của Google DeepMind sẽ tạo nhạc nền cho các video

18/6/2024

DeepMind phát triển công nghệ AI tạo âm thanh cho video, kể cả đối thoại.

Công nghệ AI mới của Google DeepMind sẽ tạo nhạc nền cho các video

: Google DeepMind đang phát triển công nghệ AI mới có khả năng tạo nhạc nền và đối thoại cho video, hoạt động với cả video truyền thống và video do AI tạo ra. Công nghệ video-to-audio (V2A) này có thể hiểu các pixel thô và kết hợp với văn bản để tạo hiệu ứng âm thanh phù hợp với sự kiện diễn ra trên màn hình. DeepMind đang cải tiến công nghệ để khắc phục các hạn chế về chất lượng âm thanh và đồng bộ hóa môi miệng cho đối thoại trước khi phát hành.

DeepMind, một phòng thí nghiệm trí tuệ nhân tạo của Google, đã phát triển công nghệ mới có khả năng tự động tạo ra soundtrack và dialogues cho video. Công nghệ này, gọi là video-to-audio (V2A), có thể xử lý từ pixel thô và tạo ra âm thanh dựa trên những mô tả chi tiết về âm thanh và bản chép thoại.

Công nghệ này không chỉ dùng cho video AI mà còn có thể áp dụng cho footage truyền thống như phim câm. DeepMind hiện đang cải thiện khả năng đồng bộ môi cho các dialogues được tạo ra và đang kiểm định an toàn kỹ lưỡng trước khi phát hành rộng rãi.

DeepMind nhấn mạnh vào khả năng độc đáo của công nghệ khi hiểu các pixel thô và lựa chọn thêm lời nhắc là không bắt buộc nhưng có thể giúp tùy chỉnh âm thanh cuối cùng sao cho chính xác và sống động hơn. Việc tinh chỉnh này hỗ trợ áp dụng công nghệ vào nhiều loại hình video khác nhau, mở rộng khả năng tích hợp vào các công cụ sáng tạo video của Google và các bên khác.