AI tạo giọng nói của Microsoft đạt mức tương đương con người nhưng quá nguy hiểm cho công chúng
Microsoft phát triển AI Vall-E 2 đạt mức tương đương con người nhưng quá nguy hiểm để công bố rộng rãi.
Microsoft đã phát triển Vall-E 2, một mô hình ngôn ngữ nơ-ron mới vượt qua những nỗ lực trước đây về độ tự nhiên, độ bền và sự tương đồng của giọng nói. Vall-E 2 là công cụ đầu tiên đạt mức tương đương con người ở hai chỉ tiêu phổ biến và được đánh giá là sống động đến mức Microsoft không dự định cho phép công chúng tiếp cận.
Vall-E 2 được kiểm tra bằng cách sử dụng các bộ dữ liệu LibriSpeech và VCTK và đã vượt qua với kết quả xuất sắc. Công cụ này cho thấy khả năng tạo giọng nói tự nhiên gần như không thể phân biệt được với giọng nói con người, thậm chí còn nắm bắt được các chi tiết tinh tế như nhấn mạnh từ.
Microsoft cho biết Vall-E 2 chỉ là dự án nghiên cứu và không có kế hoạch tích hợp công nghệ này vào sản phẩm tiêu dùng hoặc phát hành công cụ ra công chúng. Công ty lo ngại về nguy cơ lạm dụng như giả mạo giọng nói và đánh lừa nhận diện giọng nói, mặc dù Vall-E 2 có tiềm năng ứng dụng trong giáo dục, dịch thuật, báo chí và chatbot.