DeepL ra mắt DeepL Voice, dịch văn bản thời gian thực từ giọng nói và video

DeepL Voice ra mắt dịch giọng nói và video thời gian thực, hỗ trợ nhiều ngôn ngữ, tập trung vào phụ đề văn bản.

: DeepL mới đây đã ra mắt sản phẩm DeepL Voice, cho phép dịch giọng nói và video thời gian thực qua phụ đề văn bản. Hiện tại, dịch vụ hỗ trợ 13 ngôn ngữ nghe và 33 ngôn ngữ phụ đề. DeepL Voice được nhắm vào cuộc họp trực tiếp và video conferencing, hiện chưa xuất được file âm thanh hay video kết quả. Ông Jarek Kutylowski, CEO DeepL, cho biết đây là yêu cầu hàng đầu từ khách hàng từ năm 2017.

DeepL chính thức ra mắt DeepL Voice, một dịch vụ dịch văn bản thời gian thực từ giọng nói và video, giúp người dùng dễ dàng nghe người khác nói và tự động chuyển đổi sang ngôn ngữ khác. Nhấn mạnh vào việc dịch từ văn bản, DeepL Voice hiện chỉ hỗ trợ phụ đề nội dung chứ chưa có kết quả đầu ra dưới dạng âm thanh hoặc video.

Ngôn ngữ mà dịch vụ này có thể "nghe" hiện bao gồm 13 ngôn ngữ như tiếng Anh, Đức, Nhật Bản và nhiều thứ tiếng khác, với phụ đề có sẵn cho 33 ngôn ngữ được DeepL Translator hỗ trợ. Dịch vụ đặc biệt hữu ích cho các cuộc họp trực tiếp và video conferencing, nơi mà nội dung dịch được hiện dưới dạng phụ đề.

Jarek Kutylowski, CEO của DeepL, cho biết sản phẩm DeepL Voice đã được xây dựng từ nền tảng ban đầu để đảm bảo tính chính xác và tốc độ xử lý thời gian thực. Dù chưa có API và chỉ hỗ trợ nền tảng Teams, công ty đang hợp tác chặt chẽ với các đối tác để mở rộng khả năng tích hợp trong tương lai.