Công nghệ đột phá chuyển đổi từ não sang giọng nói mang lại khả năng nói tự nhiên cho bệnh nhân bị liệt

Công nghệ BCI mới giúp bệnh nhân liệt khôi phục khả năng nói tự nhiên.

: Các nhà nghiên cứu tại UC Berkeley và UCSF đã phát triển hệ thống giao diện não-máy tính (BCI) mới giúp bệnh nhân liệt phát âm lời nói tự nhiên. Hệ thống này, được mô tả trên tạp chí Nature Neuroscience, có khả năng dịch tín hiệu não sang lời nói nghe tự nhiên, giải quyết vấn đề độ trễ thông qua trí tuệ nhân tạo. Nghiên cứu thử nghiệm trên bệnh nhân Ann cho kết quả khả quan và cho thấy khả năng tổng hợp lời nói không ngắt quãng và độ chính xác cao. Dự án nhận tài trợ từ NIDCD, Nhật Bản và nhiều tổ chức tư nhân khác.

Công nghệ đột phá xoay quanh giao diện não-máy tính (BCI) mang đến khả năng nói tự nhiên cho bệnh nhân bị liệt. Nhóm nghiên cứu từ Đại học California, Berkeley và Đại học California, San Francisco đã phát triển hệ thống này nhằm khôi phục khả năng giao tiếp tức thì cho người mất khả năng nói. Công nghệ này đánh dấu một bước tiến đáng kể khi nó có thể biến tín hiệu thần kinh thành lời nói tự nhiên gần như ngay lập tức. Theo Gopala Anumanchipalli, điều này tương tự với cách các thiết bị như Alexa và Siri giải mã dữ liệu giọng nói, lần đầu tiên cho phép truyền giọng nói đồng bộ hóa nhanh chóng.

Phương pháp này đã được kiểm nghiệm trên một bệnh nhân đặc biệt có tên Ann, người đã bị mất khả năng nói sau một cơn đột quỵ cách đây 18 năm. Trong thử nghiệm, Ann được cấy điện cực trên bề mặt não để ghi nhận hoạt động thần kinh khi cô cố gắng phát âm thầm các câu văn hiện trên màn hình. Dữ liệu thần kinh này sau đó được giải mã thành lời nói nghe thấy được bằng một mô hình AI đã được huấn luyện với giọng nói trước khi bị tổn thương của cô. Việc này định hình cách thức khi ý định cần nói đã chuyển hóa thành hành động cụ thể trong cơ thể.

Một trong những đột phá then chốt của hệ thống này là khả năng tổng hợp lời nói gần như theo thời gian thực. Trước đó, các hệ thống BCI khác yêu cầu thời gian lên đến tám giây để giải mã một câu đơn lẻ, tuy nhiên, phương pháp mới này đã giảm đáng kể độ trễ. Anumanchipalli nhấn mạnh rằng, từ tín hiệu ý định của người nói, chỉ cần một giây đã có thể phát ra âm thanh đầu tiên.

Mặc dù công nghệ này vẫn đang trong giai đoạn thử nghiệm, nhưng đã cho thấy tiềm năng rộng lớn trong việc cải thiện giao tiếp cho những người mắc các bệnh như ALS hoặc liệt do đột quỵ. Dự án được tài trợ bởi các tổ chức lớn như Viện Quốc gia về Điếc và Rối loạn Giao tiếp khác, Chương trình Moonshot của Cơ quan Khoa học và Công nghệ Nhật Bản, cùng nhiều quỹ tư nhân. Những nguồn tài trợ này đóng vai trò quan trọng trong việc duy trì và phát triển những cải tiến tiếp theo của hệ thống.

Các nhà nghiên cứu cũng đang tìm cách kết hợp các đặc điểm biểu cảm như âm điệu, cao độ, và âm lượng vào lời nói tổng hợp để tạo nên một trạng thái tự nhiên hoàn toàn. Nhóm nghiên cứu hy vọng rằng các giao diện não-máy tính có khả năng phục hồi lời nói lưu loát có thể được phổ biến rộng rãi trong vòng thập kỷ tới nếu có sự đầu tư và phát triển bền vững.

Nguồn: Science, Nature Neuroscience