AI mang giọng nói trở lại cho người đã mất giọng

AI và sứ mệnh hồi sinh giọng nói: Khi công nghệ trở thành cầu nối cảm xúc.

Giọng nói không chỉ là phương tiện giao tiếp, mà còn là một phần quan trọng của bản sắc con người. Đối với những ai mất đi khả năng nói do bệnh tật, việc tìm lại giọng nói của chính mình là một giấc mơ tưởng chừng xa vời. Nhưng với sự phát triển của trí tuệ nhân tạo (AI), điều tưởng như không thể nay đã trở thành hiện thực.

Từ Sân Khấu Hài Kịch Đến Cuộc Chiến Với ALS

Jules Rodriguez, một diễn viên hài kịch 40 tuổi đến từ Miami, từng làm chủ sân khấu với những câu chuyện đầy hóm hỉnh và cuốn hút. Nhưng căn bệnh xơ cứng teo cơ một bên (ALS) đã dần tước đi giọng nói của anh kể từ năm 2020. Đến năm 2024, các bác sĩ buộc phải thực hiện phẫu thuật mở khí quản để giúp anh duy trì sự sống, đồng nghĩa với việc Rodriguez vĩnh viễn mất đi khả năng nói.

Xem thêm

Công ước Hà Nội: Việt Nam dẫn lối an ninh mạng toàn cầu

VTV9 phát động chiến dịch “Toàn dân chống lừa đảo”

ASUS Expert Series: Đột phá bền bỉ và thông minh cho doanh nghiệp Việt

Cùng vợ, Maria Fernandez, anh chấp nhận sự thật đau lòng rằng họ sẽ không bao giờ nghe thấy giọng nói quen thuộc của anh nữa. Nhưng rồi AI xuất hiện như một phép màu, mang đến cho Rodriguez cơ hội được “nói” trở lại.

“Nghe lại giọng của chính mình sau một thời gian dài im lặng khiến tôi như được tiếp thêm năng lượng”, Rodriguez chia sẻ. Giờ đây, anh sử dụng công nghệ theo dõi chuyển động mắt để nhập nội dung vào thiết bị, sau đó phần mềm AI sẽ chuyển đổi thành giọng nói của anh trước đây. Thậm chí, Rodriguez còn quay lại sân khấu, mang đến những tràng cười bằng chính giọng nói đã từng bị đánh mất.

Công Nghệ AI – Cuộc Cách Mạng Cho Người Mất Giọng

Rodriguez không phải trường hợp duy nhất. Hơn 1.000 người gặp vấn đề về giọng nói đã được hỗ trợ bởi ElevenLabs, một công ty công nghệ của Mỹ, nơi phát triển công cụ nhân bản giọng nói bằng AI. Công nghệ này đã mở ra một trang mới cho những bệnh nhân ALS và nhiều người mắc bệnh về thần kinh vận động khác.

Theo chuyên gia trị liệu giọng nói Richard Cave từ Hiệp hội Bệnh thần kinh vận động Anh, công nghệ giọng nói nhân tạo của ElevenLabs không chỉ giúp người bệnh giao tiếp tốt hơn, mà còn mang đến cho họ cảm giác được là chính mình. “Đây thực sự là một ứng dụng AI vì mục đích nhân văn”, Cave nhận định.

Trước đây, những người mắc ALS thường được khuyến khích ghi âm trước hàng trăm câu nói để lưu trữ giọng nói của mình. Nhưng giọng tổng hợp từ các bản ghi này nghe máy móc, thiếu tự nhiên. Công nghệ mới của ElevenLabs cho phép tái tạo giọng nói chỉ từ những đoạn ghi âm ngắn, chẳng hạn như tin nhắn thoại hoặc video cũ. Với khoảng 30 phút dữ liệu, AI có thể tái tạo giọng nói gần như nguyên bản sau một tuần xử lý.

Những Hạn Chế Còn Tồn Đọng

Dù đã tạo ra những bước tiến vượt bậc, công nghệ này vẫn chưa hoàn hảo. Joyce Esser, một trong những người đầu tiên sử dụng bản sao giọng nói AI, nhận xét rằng nó hoạt động tốt với những câu nói được chuẩn bị sẵn, nhưng chưa đủ linh hoạt cho các cuộc trò chuyện trực tiếp. Ngoài ra, tốc độ nói đôi khi quá nhanh, âm lượng nhỏ và biểu cảm chưa đủ chân thực.

Rodriguez cũng gặp tình trạng tương tự. “Khi nhập một đoạn văn dài, tôi có cảm giác như giọng AI dần mất đi sự sống động, giống như đang mệt mỏi”, anh chia sẻ.

Theo Cave, mục tiêu tiếp theo không chỉ là tạo ra giọng nói chân thực mà còn phải mô phỏng được cách con người truyền tải cảm xúc.

Tương Lai: Hình Đại Diện AI Đưa Giao Tiếp Lên Một Tầm Cao Mới

Một trong những dự án đầy hứa hẹn là kết hợp giọng nói AI với hình đại diện kỹ thuật số có biểu cảm phong phú. Scott-Morgan Foundation đang làm việc cùng ElevenLabs để tạo ra hình đại diện siêu chân thực giúp người bệnh giao tiếp hiệu quả hơn.

Erin Taylor, một bệnh nhân ALS được chẩn đoán khi mới 23 tuổi, đã dành nhiều giờ quay video để ghi lại từng biểu cảm trên gương mặt. Kết quả là một hình đại diện có thể nói chuyện với vẻ mặt sống động và ánh mắt đầy cảm xúc.

Esser, một trong những người thử nghiệm công nghệ này, chia sẻ: “Giao tiếp không chỉ là giọng nói, mà còn là biểu cảm khuôn mặt, ánh mắt. Hình đại diện AI sẽ giúp người khác nhìn thấy tâm hồn chúng tôi, chứ không chỉ nghe thấy giọng nói”.

Giấc Mơ Một Triệu Giọng Nói Được Hồi Sinh

Scott-Morgan Foundation và ElevenLabs không dừng lại ở đây. Họ tiếp tục hợp tác với nhiều tổ chức khác để mở rộng chương trình, với mục tiêu mang lại giọng nói cho một triệu người trên toàn thế giới.

Còn đối với Rodriguez, Maria Fernandez và cộng đồng những người mắc ALS, AI đã mang đến một thay đổi mang tính cách mạng. “Chúng tôi vẫn phải đối mặt với rất nhiều thử thách, nhưng ít nhất, nhờ công nghệ này, chúng tôi có thể tiếp tục kết nối với nhau như một gia đình”, Fernandez nói.

Từ một công nghệ được phát triển cho ngành công nghiệp giải trí, AI giờ đây đang trở thành công cụ đầy nhân văn, giúp những người mất giọng nói tìm lại một phần quan trọng của cuộc sống. Đó không chỉ là một bước tiến của khoa học, mà còn là chiến thắng của lòng nhân ái và khát khao giao tiếp của con người.