AI Trung Quốc OmniHuman-1 gây chấn động: Tạo video chân thực chỉ từ một bức ảnh.
ByteDance – công ty đứng sau TikTok – tiếp tục làm thế giới kinh ngạc khi ra mắt OmniHuman-1, một mô hình AI tiên tiến có thể tạo ra những video chân thực chỉ từ một bức ảnh tĩnh và một đoạn âm thanh. Với bước tiến này, Trung Quốc một lần nữa khẳng định vị thế dẫn đầu trong cuộc đua AI, cạnh tranh trực tiếp với các ông lớn công nghệ phương Tây.
Từ một bức ảnh tĩnh đến video sống động
OmniHuman-1 không chỉ tạo ra những khuôn mặt có thể nói hay hát, mà còn có thể mô phỏng toàn bộ chuyển động cơ thể, giúp nhân vật trong video trở nên tự nhiên và chân thực đến kinh ngạc. So với những công nghệ deepfake trước đây, vốn chỉ có thể hoạt họa phần gương mặt hoặc thân trên, thì OmniHuman-1 đã đạt bước tiến vượt bậc, mở ra tiềm năng ứng dụng rộng lớn từ giải trí đến truyền thông.
ByteDance tuy chưa công bố OmniHuman-1 rộng rãi nhưng các đoạn video thử nghiệm đã nhanh chóng thu hút sự quan tâm của giới công nghệ. Một trong những ví dụ ấn tượng nhất là đoạn video dài 23 giây tái hiện hình ảnh Albert Einstein phát biểu. TechCrunch đánh giá đây có thể là những video deepfake chân thực nhất từ trước đến nay.
Trung Quốc tăng tốc trong cuộc đua AI bất chấp sự kiểm soát từ Mỹ
Sự ra đời của OmniHuman-1 diễn ra ngay sau khi OpenAI công bố công cụ tạo video Sora vào cuối năm 2024, cho thấy cuộc cạnh tranh khốc liệt giữa các công ty AI hàng đầu. Dù phải đối mặt với những rào cản từ Mỹ trong việc tiếp cận công nghệ tiên tiến, các công ty Trung Quốc vẫn đang cho thấy khả năng phát triển mạnh mẽ trong lĩnh vực AI.
ByteDance không phải cái tên duy nhất tại Trung Quốc tham gia cuộc đua này. Kuaishou Technology với ứng dụng Kling, hay các startup AI như Zhipu AI, Shengshu Tech và MiniMax cũng đang chạy đua trong lĩnh vực deepfake.
Trong bối cảnh công nghệ trí tuệ nhân tạo ngày càng phát triển, OmniHuman-1 là minh chứng rõ ràng cho việc AI Trung Quốc không chỉ bắt kịp mà còn có khả năng dẫn đầu trong một số lĩnh vực. Sự xuất hiện của công nghệ này có thể thay đổi hoàn toàn cách con người tạo dựng nội dung số, mở ra một kỷ nguyên mới của truyền thông và giải trí.