CES 2024: NVIDIA mang AI tạo sinh đến với những robot thông minh hơn

Posted by phphuoc on January 10, 2024 in THEO DÒNG CÔNG NGHỆ Comments Off

AI tạo sinh (generative AI) đang làm thay đổi các ngành công nghiệp trị giá nghìn tỷ USD, và NVIDIA, một người tiên phong trong lĩnh vực robot thông minh, đang nắm bắt cơ hội này.

Ngày 8-1-2024 trong một bài phát biểu đặc biệt tại CES 2024, hội chợ – triển lãm công nghệ lớn nhất thế giới tổ chức ở Las Vegas (Mỹ), ông Deepu Talla, Phó Chủ tịch NVIDIA về Robot và Edge Computing, đã trình bày chi tiết cách NVIDIA và các đối tác của mình đang kết hợp AI tạo sinh và robot lại với nhau.

Đây là một sự kết hợp tự nhiên, với một danh sách đối tác ngày càng tăng – bao gồm Boston Dynamics, Collaborative Robotics, Covariant, Sanctuary AI, Unitree Robotics và các đối tác khác — đang đưa mô hình ngôn ngữ lớn (LLM) được tăng tốc bằng GPU để mang lại mức độ trí tuệ và khả năng thích ứng chưa từng có cho các loại máy móc.

Thời điểm này không thể tốt hơn.

Ông Talla nói rằng: “Robot tự động được hỗ trợ bởi trí tuệ nhân tạo đang ngày càng được sử dụng để cải thiện hiệu quả, giảm chi phí và giải quyết tình trạng thiếu hụt lao động. Nhu cầu về robot tự động hỗ trợ bởi trí tuệ nhân tạo đã rõ ràng trong vài năm qua để cải thiện hiệu quả, giảm chi phí và giải quyết tình trạng thiếu hụt lao động.”

Có mặt ngay từ khi bắt đầu

NVIDIA đã ở trung tâm của cuộc cách mạng AI tạo sinh ngay từ đầu.

Một thập kỷ trước, ông Jensen Huang, nhà sáng lập và CEO của NVIDIA, đã trao tận tay siêu máy tính AI NVIDIA DGX đầu tiên cho OpenAI, startup công nghệ là cha đẻ của ứng dụng AI ChatGPT. Bây giờ, nhờ ChatGPT của OpenAI, AI tạo sinh đã trở thành một trong những công nghệ phát triển nhanh nhất của thời đại chúng ta.

Và đây mới chỉ là bắt đầu.

Ảnh hưởng của AI tạo sinh sẽ vượt qua việc tạo ra văn bản và hình ảnh – và lan rộng vào các ngôi nhà và văn phòng, trang trại và nhà máy, bệnh viện và phòng thí nghiệm, ông Talla dự đoán.

Chìa khóa: LLM (large language model, mô hình ngôn ngữ lớn), tương tự như trung tâm ngôn ngữ của não, sẽ cho phép robot hiểu và phản hồi lệnh của con người một cách tự nhiên hơn.

Những máy móc như vậy sẽ có thể học hỏi liên tục từ con người, từ nhau và từ thế giới xung quanh chúng.

Ông Talla nhấn mạnh: “Với những đặc điểm này, AI tạo sinh rất phù hợp với robot.”

Cách robot sử dụng AI tạo sinh

Agility Robotics và các công ty khác đang kết hợp AI tạo sinh vào robot của họ để giúp chúng hiểu lệnh bằng văn bản hoặc giọng nói. Máy hút bụi robot của Dreame Technology đang được đào tạo trong không gian sống giả lập được tạo ra bởi mô hình AI tạo sinh. Và Electric Sheep đang phát triển một mô hình thế giới cho việc cắt cỏ tự động.

NVIDIA với các công nghệ như nền tảng NVIDIA Isaac và Jetson, hỗ trợ phát triển và triển khai robot được hỗ trợ bởi AI, đã được hơn 1,2 triệu nhà phát triển và 10.000 khách hàng và đối tác tin tưởng.

Nhiều khách hàng trong số họ đang có mặt tại CES 2024 Las Vegas, bao gồm Analog Devices, Aurora Labs, Canonical, Dreame Innovation Technology, DriveU, e-con Systems, Ecotron, Enchanted Tools, GlüxKind, Hesai Technology, Leopard Imaging, Segway-Ninebot (Willand (Beijing) Technology Co., Ltd.), Nodar, Orbbec, QT Group, Robosense, Spartan Radar, TDK Corporation, Telit, Unitree Robotics, Voyant Photonics và ZVISION Technologies Co., Ltd.

Hai bộ não tốt hơn một

Trong bài nói chuyện của mình tại CES 2024 Las Vegas, ông Talla đã trình bày mô hình máy tính kép (dual-computer model0 cần thiết để triển khai AI trong robot, thể hiện cách tiếp cận toàn diện của NVIDIA đối với việc phát triển và ứng dụng AI.

Máy tính đầu tiên, được gọi là “nhà máy AI” (AI factory) đóng vai trò trung tâm trong việc tạo ra và cải thiện liên tục các mô hình AI.

Nhà máy AI sử dụng cơ sở hạ tầng tính toán trung tâm dữ liệu của NVIDIA cùng với nền tảng AI và NVIDIA Omniverse của mình cho việc mô phỏng và đào tạo các mô hình AI.

Chiếc máy tính thứ hai đại diện cho môi trường thực thi của robot.

Điều này thay đổi tùy thuộc vào ứng dụng: Có thể là trên đám mây hoặc tại một trung tâm dữ liệu; trong máy chủ tại chỗ cho các nhiệm vụ như kiểm tra lỗi trong sản xuất bán dẫn; hoặc trong một máy tự động được trang bị nhiều cảm biến và camera.

Tạo ra tài sản và các cảnh chất lượng

Ông Talla cũng nhấn mạnh vai trò của mô hình Ngôn ngữ Lớn (LLM) trong việc phá vỡ các rào cản kỹ thuật, biến người dùng thông thường thành nhà nghệ sĩ kỹ thuật có khả năng tạo ra các trạm làm việc robot phức tạp hoặc toàn bộ mô phỏng kho hàng.

Với các công cụ AI tạo sinh như NVIDIA Picasso, người dùng có thể tạo ra tài sản 3D chân thực từ những lời nhắc văn bản (text prompts) đơn giản và thêm chúng vào cảnh số (digital scenes) để tạo môi trường đào tạo robot động và toàn diện.

Khả năng tương tự cũng mở rộng để tạo ra các kịch bản đa dạng và chính xác về mặt vật lý trong Omniverse, nâng cao việc kiểm tra và đào tạo robot để bảo đảm khả năng áp dụng thực tế.

Điều này kết hợp với tiềm năng biến đổi của AI tạo sinh trong việc tái cấu trúc việc triển khai robot.

Theo truyền thống, robot được xây dựng cụ thể cho các nhiệm vụ nhất định, và việc sửa đổi chúng cho các nhiệm vụ khác là quá trình tốn thời gian.

Nhưng những tiến bộ trong LLM và mô hình ngôn ngữ hình ảnh (vision language models) đang loại bỏ điểm nghẽn này, cho phép tương tác trực quan hơn với robot thông qua ngôn ngữ tự nhiên, ông Talla giải thích.

Những máy móc như vậy – có khả năng thích nghi và nhận thức về môi trường xung quanh chúng – sẽ sớm lan rộng khắp thế giới.