Google đã thêm mô hình giọng nói Chirp 3 vào nền tảng Vertex AI của mình

Google thêm mô hình giọng nói Chirp 3 vào nền tảng Vertex AI.

: Google đã công bố bổ sung mô hình giọng nói Chirp 3, bao gồm chuyển đổi giọng nói thành văn bản và ngược lại, vào nền tảng Vertex AI. Mô hình này hỗ trợ 31 ngôn ngữ và được sử dụng trong các lĩnh vực như trợ lý giọng nói, sách nói và video. Thomas Kurian, CEO của Google Cloud, thông báo về việc có hạn chế sử dụng để chống lạm dụng. Demis Hassabis của DeepMind lưu ý rằng công nghệ AI vẫn cần thời gian để phát triển và không phải là giải pháp hoàn hảo.

Google đã thông báo rằng họ sẽ thêm mô hình giọng nói Chirp 3 vào nền tảng phát triển Vertex AI bắt đầu từ tuần tới. Chirp 3 là mô hình chuyển đổi từ giọng nói sang văn bản và văn bản sang giọng nói chất lượng cao, được triển khai với 8 giọng nói mới trong 31 ngôn ngữ trên toàn cầu. Những ứng dụng của nền tảng bao gồm tạo ra trợ lý giọng nói, sách nghe, các bộ phận hỗ trợ và lời thoại cho video. Sự phát triển này được nhắc đến tại sự kiện ở văn phòng DeepMind của Google tại London.

Nền tảng mới này nhằm giúp các nhà phát triển dễ dàng tích hợp giọng nói vào các ứng dụng và dịch vụ của họ, điều mà các đối thủ như Sesame cũng đang theo đuổi. Sesame vừa công bố rằng họ phát hành mô hình giọng nói mới cho phép các nhà phát triển tạo ra các ứng dụng và dịch vụ tùy chỉnh trên nền tảng của họ. Một trong những doanh nghiệp nổi bật khác tham gia vào lĩnh vực này là ElevenLabs, công ty đã huy động hàng trăm triệu đô la để mở rộng dịch vụ giọng nói AI.

Tuy nhiên, vẫn có hạn chế về việc sử dụng Chirp 3 nhằm ngăn chặn việc lạm dụng không mong muốn, theo CEO của Google Cloud là Thomas Kurian. Ông cho biết công ty đang làm việc với đội ngũ an ninh để đảm bảo an toàn. Thực tế, khả năng tạo giọng nói "thực" nhất có thể của mô hình này vẫn cần thời gian để khẳng định, dù công nghệ AI đang phát triển mạnh mẽ trên mọi phương diện.

Demis Hassabis, CEO của DeepMind, nhấn mạnh rằng đây là một cuộc đua đường dài chứ không phải là nước đi ngắn hạn. Ông cho biết: "Trong thời gian gần, ý tưởng rằng AI sẽ giải quyết mọi thứ ngay lập tức có thể chưa khả thi. Chúng ta cần thêm vài năm trước khi có thể đạt tới trí thông minh nhân tạo tổng quát (AGI)." Ông cũng dự đoán tác động lớn của công nghệ này trong thập kỷ tới, thể hiện sự trung hạn và dài hạn trong phát triển AI.

Google đã giới thiệu nền tảng Vertex AI vào năm 2021 để giúp các nhà phát triển xây dựng dịch vụ máy học trên đám mây, trước cả sự bùng nổ quan tâm đến AI sinh dupe trên toàn thế giới nhờ vào sự ra đời của dịch vụ GPT của OpenAI. Vertex AI đã trở thành công cụ quan trọng trong việc theo kịp sự phát triển của các công ty khác như Microsoft và Amazon, khi họ cũng đang đầu tư mạnh vào công nghệ AI sinh dupe.

Nguồn: Google, DeepMind, Sesame, ElevenLabs