AI có thể bịa đặt ngay cả khi có dữ liệu thật
Các nhà nghiên cứu đã kiểm tra chatbot bằng cách cung cấp các đoạn trích từ bài báo thật và yêu cầu AI xác định tiêu đề bài viết, nhà xuất bản và đường link URL. Kết quả cho thấy:
- Perplexity trả về thông tin sai 37% số lần.
- Grok của xAI có tỷ lệ bịa đặt thông tin lên tới 97%.
- Một số chatbot tạo ra đường link giả, dẫn đến những trang web không tồn tại.
Tổng cộng, AI đã cung cấp thông tin sai trong 60% truy vấn thử nghiệm, cho thấy mức độ thiếu chính xác đáng báo động của công nghệ này.
AI tìm kiếm có thể xâm phạm quyền xuất bản
Nghiên cứu còn phát hiện công cụ Perplexity có thể vượt qua tường phí của các trang web như National Geographic, ngay cả khi trang web đã chặn công cụ tìm kiếm. Việc này gây tranh cãi khi Perplexity tuyên bố đây là sử dụng hợp lý (fair use), nhưng vẫn tiếp tục thực hiện dù có phản đối.
Vì sao AI thường xuyên cung cấp thông tin sai lệch?
Các công cụ tìm kiếm AI sử dụng phương pháp “retrieval-augmented generation” (RAG), tức là tìm kiếm dữ liệu thời gian thực từ Internet để tạo câu trả lời thay vì chỉ dựa vào tập dữ liệu cố định. Tuy nhiên, phương pháp này có nhiều rủi ro:
- AI luôn đưa ra câu trả lời, ngay cả khi không chắc chắn.
- AI có thể thu thập dữ liệu sai từ các nguồn không đáng tin cậy.
- AI đôi khi tự nhận sai sót trong quá trình “lập luận” – chẳng hạn, Claude của Anthropic từng bị phát hiện đưa vào dữ liệu giả trong các báo cáo nghiên cứu.
Nguy cơ ảnh hưởng đến các trang tin tức lớn
Theo Mark Howard, Giám đốc điều hành của Time Magazine, AI tổng hợp tin tức mà không kiểm soát có thể gây tổn hại đến danh tiếng của các tờ báo lớn.
- BBC đã chỉ trích Apple Intelligence vì hệ thống này viết lại tin tức sai lệch, làm ảnh hưởng đến uy tín của họ.
- Người dùng có thể nhầm tưởng rằng họ đang đọc tin từ The Guardian, nhưng thực chất đó lại là tin giả do AI tự tạo ra.
Dù vậy, Howard cho rằng người dùng cũng phải tự chịu trách nhiệm nếu tin hoàn toàn vào AI miễn phí mà không kiểm chứng thông tin.
Người dùng đang dần phụ thuộc vào AI tìm kiếm
Theo nghiên cứu từ CJR, 1/4 người Mỹ hiện sử dụng AI để tìm kiếm thông tin. Trước khi AI tổng hợp nội dung xuất hiện, hơn 50% số lượt tìm kiếm trên Google đã là “zero-click”, nghĩa là người dùng lấy thông tin ngay từ Google mà không truy cập vào trang web gốc.
Câu hỏi đặt ra là: Người dùng có thực sự quan tâm đến độ chính xác của thông tin, hay họ chỉ cần câu trả lời nhanh nhất?
AI hiện tại vẫn “nói bừa” nhiều hơn là hiểu biết
Các mô hình AI (trí tuệ nhân tạo) thực chất không hiểu những gì chúng nói, mà chỉ dự đoán từ phù hợp để tạo ra câu trả lời. Chúng giống như hệ thống tự động điền câu, chứ không có khả năng suy luận thực sự.
Mark Howard tin rằng các chatbot sẽ cải thiện theo thời gian, nhưng cũng thừa nhận rằng hiện tại, chúng đang ở giai đoạn tệ nhất từ trước đến nay.
Việc để AI chatbot lan truyền thông tin sai lệch vẫn là một vấn đề nghiêm trọng, đòi hỏi người dùng, các nhà xuất bản và công ty AI phải có trách nhiệm kiểm soát.