Một năm sau, OpenAI vẫn chưa phát hành công cụ sao chép giọng nói của mình
OpenAI chưa ra mắt Voice Engine do lo ngại lạm dụng.

Từ cuối tháng 3 năm trước, OpenAI công bố một bản xem trước quy mô nhỏ của dịch vụ AI tên là Voice Engine, công cụ sao chép giọng nói, chỉ cần nghe 15 giây để nhân bản giọng nói của một người. Gần một năm sau, công cụ vẫn chỉ mới ra mắt bản xem trước và OpenAI chưa cho biết thời điểm sẽ phát hành chính thức hoặc liệu có phát hành không.
Sự thận trọng của công ty có thể phản ánh lo ngại bị lạm dụng hoặc tránh những cuộc điều tra gắt gao về quy định. OpenAI đã từng bị chỉ trích vì ưu tiên các sản phẩm mới mẻ hơn là an toàn, và tung ra sản phẩm vội vã để đi trước đối thủ.
OpenAI cho biết họ tiếp tục thử nghiệm Voice Engine với một số đối tác tin tưởng. Một phát ngôn viên của công ty chia sẻ rằng họ đang học từ cách các đối tác sử dụng công nghệ để cải thiện tính hữu dụng và an toàn của mô hình. Công nghệ được dùng trong nhiều lĩnh vực như trị liệu ngôn ngữ, học ngôn ngữ, hỗ trợ khách hàng, nhân vật trò chơi điện tử, và avatar AI.
Một số đối tác, trong đó có startup Livox, đã tiếp cận được Voice Engine. Livox làm việc nhằm giúp người khuyết tật giao tiếp tự nhiên hơn. CEO Carlos Pereira cho biết, mặc dù Livox không thể tích hợp Voice Engine vào sản phẩm vì yêu cầu phải có kết nối mạng, nhưng thấy công nghệ này ấn tượng.
OpenAI còn phát triển các biện pháp an toàn như watermarking và yêu cầu sự đồng ý rõ ràng từ người nói gốc trước khi sử dụng Voice Engine. Việc này nhằm giảm nguy cơ sao chép giọng nói mà không có sự đồng ý và đối phó với các scam liên quan đến công nghệ này, vốn là mối đe doạ lớn trong năm 2024.
Nguồn: TechCrunch, OpenAI blog