Trong một dự án hợp tác độc đáo giữa các nhà khoa học máy tính, chuyên gia AI và nhóm nghiên cứu cá heo, Google đã giới thiệu DolphinGemma – một mô hình ngôn ngữ lớn (LLM) được thiết kế để nhận diện, phân tích và cuối cùng là tạo ra các âm thanh mà cá heo sử dụng để giao tiếp.
Mục tiêu? Giải mã cách mà loài động vật thông minh này giao tiếp với nhau – và xa hơn, tìm cách để con người có thể “nói chuyện” với cá heo theo nghĩa đen.
Dự án là kết quả của hơn 40 năm nghiên cứu do tổ chức Wild Dolphin Project (WDP) dẫn dắt, phối hợp với Đại học Công nghệ Georgia (Georgia Tech) và Google DeepMind.
Từ năm 1985, WDP đã tiến hành nghiên cứu dưới nước lâu đời nhất thế giới về cá heo hoang dã tại Bahamas. Họ thu thập dữ liệu âm thanh và hình ảnh từ đàn cá heo đốm Đại Tây Dương, ghi nhận chi tiết về các hành vi xã hội, tương tác và lịch sử sống của từng cá thể.
Từ kho dữ liệu phong phú này – bao gồm âm thanh giao phối, tiếng kêu khi tranh chấp, và các “tiếng huýt đặc trưng” giống như tên riêng của từng con cá heo – Google đã huấn luyện DolphinGemma, một mô hình 400 triệu tham số, phát triển từ cùng nền tảng với Gemini AI của Google.
DolphinGemma có khả năng phân tích âm thanh đầu vào và dự đoán âm thanh kế tiếp, tức là đang dần học cấu trúc “ngữ pháp” của ngôn ngữ cá heo.
AI đang ngày càng được sử dụng để giải mã cách động vật giao tiếp. Từ tiếng sủa của chó đến tiếng hót của chim, các mô hình học máy có thể phân tích âm thanh, nhận diện cảm xúc, giới tính, thậm chí là danh tính cá thể.
Với cá voi và cá heo – những loài thông minh, sống theo bầy đàn và có hệ thống giao tiếp phức tạp – AI càng phát huy thế mạnh. Các âm thanh của chúng như tiếng click và huýt gió đều dễ ghi âm, từ đó dễ dàng đưa vào mô hình để phân tích cấu trúc và tìm ra “từ vựng” ngôn ngữ.
Năm ngoái, dự án phi lợi nhuận Project CETI đã sử dụng AI để phân tích hơn 8.000 “coda” của cá nhà táng, phát hiện ra mô hình nhịp điệu và âm điệu – nền móng cho một bảng chữ cái ngữ âm của cá voi.
DolphinGemma không chỉ dừng lại ở việc phân tích. Mô hình này còn có thể tạo ra các âm thanh giống cá heo, theo đúng tần số và kiểu huýt gió mà loài này sử dụng.
Điều đó mở ra khả năng thiết lập một cuộc hội thoại đơn giản giữa người và cá heo, thông qua hệ thống tên là CHAT – viết tắt của Cetacean Hearing Augmentation Telemetry. Đây là một thiết bị gắn trên điện thoại thông minh dưới nước, có thể tạo ra âm thanh gắn với các đồ vật quen thuộc như cỏ biển hay khăn tay của nhà nghiên cứu.
Ý tưởng là khi cá heo nghe thấy âm thanh đại diện cho một món đồ và lặp lại nó, con người sẽ phản hồi bằng cách trao cho chúng món đồ đó – giống như trò chơi “đoán ý” với cá heo, chỉ khác là có AI đóng vai phiên dịch.
Phiên bản tiếp theo của hệ thống này hứa hẹn tích hợp thêm trí tuệ nhân tạo mạnh mẽ hơn, phản hồi nhanh hơn và hiểu rõ hơn về cách cá heo muốn giao tiếp.
Google cho biết sẽ mở mã DolphinGemma vào mùa hè này, giúp các nhà nghiên cứu khác – kể cả những người làm việc với loài cá heo mũi chai hay cá heo quay vòng – có thể áp dụng rộng rãi hơn.
Dù vậy, vẫn còn nhiều câu hỏi chưa được giải đáp: Nếu giao tiếp hai chiều thực sự thành công, liệu con người có nên áp dụng công nghệ này với cá heo hoang dã không? Việc can thiệp vào ngôn ngữ tự nhiên của động vật liệu có ảnh hưởng gì tới đời sống bản năng của chúng?
Chúng ta chưa thể tổ chức một buổi TED Talk với cá heo – ít nhất là chưa. Nhưng với những gì Google và các nhà khoa học đang làm, khả năng đó đang đến gần hơn bao giờ hết.
Nếu máy móc có thể giúp con người lắng nghe thế giới tự nhiên một cách sâu sắc hơn – không chỉ nhìn, mà còn hiểu và giao tiếp thực sự – thì đây có thể là một trong những bước tiến đáng kể nhất của nhân loại trong hành trình hòa hợp với Trái Đất.