Mô hình giọng nói AI mới giống con người vừa làm phấn khích vừa làm xáo trộn internet
Miles và Maya, công nghệ giọng nói AI từ Sesame AI, có giọng giống con người và gây lo ngại về an ninh.

Mô hình giọng nói AI mới từ Sesame AI, được sáng lập bởi Brendan Iribe, gây ngạc nhiên và lo lắng vì khả năng giọng nói giống con người. Sản phẩm sử dụng tiếp cận đa phương thức để xử lý văn bản và âm thanh trong một mô hình, tăng cường khả năng tự nhiên hóa giọng nói.
Dù vượt qua nhiều thử nghiệm tách rời, hệ thống vẫn gặp khó khăn với ngữ cảnh đối thoại và nhịp độ hội thoại. Co-founder Brendan Iribe thừa nhận công nghệ này còn nhiều giới hạn nhưng lạc quan về cải tiến trong tương lai. Demo hiện tại nổi bật với các chi tiết như tiếng thở và điều chỉnh giọng, tạo sự tự nhiên.
Sự hiện diện của Miles và Maya gây ra phản ứng khác nhau từ người sử dụng, từ phấn khích đến lo ngại. Một trường hợp đáng chú ý từ PCWorld cho thấy AI Maya đã tạo cảm giác quen thuộc từ ký ức cá nhân của người dùng, tạo cảm giác không thoải mái.
Công nghệ này có thể là một lợi thế lớn nhưng cũng tiềm ẩn rủi ro với các trò lừa đảo qua giọng nói. Hacker đã từng định 'bẻ khóa' hệ thống để tạo ra giọng nói có mục đích lừa đảo, như một lời nhắc nhở về khả năng khai thác công nghệ không đúng cách.
Sẵn sàng mở mã nguồn trong tương lai có thể khiến công nghệ này dễ bị sử dụng sai mục đích. Công nghệ giọng nói giờ đây có tiềm năng ảnh hưởng đến thị trường lao động trong các ngành như dịch vụ khách hàng và hỗ trợ kỹ thuật.
Nguồn: TechSpot, PCWorld, Twitter