Gemini Robotics: Robot thông minh hơn bao giờ hết
Gemini Robotics là một mô hình tầm nhìn-ngôn ngữ-hành động (VLA) tiên tiến, được phát triển từ Gemini 2.0. Điểm đặc biệt của mô hình này là khả năng thêm hành động vật lý làm một loại đầu ra mới, cho phép điều khiển robot một cách trực tiếp. Theo Google, Gemini Robotics có thể hiểu và xử lý các tình huống mà nó chưa từng được huấn luyện trước đó.
So với các mô hình VLA hàng đầu hiện nay, Gemini Robotics vượt trội gấp đôi trong bài kiểm tra khả năng tổng quát hóa toàn diện. Nhờ được xây dựng trên nền tảng Gemini 2.0, mô hình này không chỉ giỏi về ngôn ngữ tự nhiên mà còn hỗ trợ nhiều ngôn ngữ khác nhau. Điều này giúp robot dễ dàng hiểu các lệnh từ con người một cách chính xác hơn.
Về khả năng khéo léo, Gemini Robotics có thể thực hiện những nhiệm vụ phức tạp đòi hỏi sự thao tác tỉ mỉ, chẳng hạn như gấp giấy origami hoặc bỏ đồ ăn vào túi Ziploc. Đây là những công việc đòi hỏi sự phối hợp tinh tế mà trước đây robot khó thực hiện được.
Gemini Robotics-ER: Hỗ trợ tối đa cho các nhà phát triển robot
Bên cạnh Gemini Robotics, Google còn giới thiệu Gemini Robotics-ER, một mô hình tập trung vào lý luận không gian. Mô hình này được thiết kế để các nhà phát triển robot dễ dàng kết nối với các bộ điều khiển cấp thấp hiện có. Với Gemini Robotics-ER, người dùng sẽ có ngay một bộ công cụ đầy đủ để điều khiển robot, từ nhận thức, ước lượng trạng thái, hiểu biết không gian, lập kế hoạch cho đến tạo mã code.
Hợp tác và triển vọng tương lai
Google đang hợp tác với công ty Apptronik để phát triển các robot hình người dựa trên nền tảng Gemini 2.0. Ngoài ra, họ cũng làm việc với một số đối tác thử nghiệm đáng tin cậy như Agile Robots, Agility Robotics, Boston Dynamics và Enchanted Tools để phát triển thêm Gemini Robotics-ER.
Với những tiến bộ này, Google DeepMind đang mở đường cho một tương lai nơi robot có thể hòa nhập mượt mà vào cuộc sống hàng ngày. Từ việc thực hiện các tác vụ phức tạp với độ chính xác cao đến khả năng thích nghi linh hoạt, Gemini Robotics hứa hẹn sẽ thay đổi cách chúng ta tương tác với công nghệ robot.