Thứ Năm ngày 21 tháng 11 năm 2024

Nhà sáng lập NVIDIA giới thiệu các nền tảng AI tạo sinh dùng cho mọi ngành công nghiệp

Trong bài diễn thuyết (keynote) trực tiếp đầu tiên kể từ đại dịch COVID-19, trên sân khấu của Triển lãm công nghệ máy tính thường niên lớn nhất thế giới COMPUTEX Taipei 2023 tại Taipei (Taiwan) ngày 29-5-2023, ông Jensen Huang người sáng lập và CEO của NVIDIA, đã giới thiệu các nền tảng mà các công ty có thể sử dụng để làm nên lịch sử của ngành trí tuệ nhân tạo AI tạo sinh (generative AI – gen AI) hiện đang biến đổi các ngành công nghiệp từ quảng cáo đến sản xuất và viễn thông.

Ông Jensen Huang diễn thuyết tại COMPUTEX Taipei 2023 sáng 29-5-2023.

Trình bày keynote mở đầu cho chuỗi keynote của các nhà lãnh đạo các tập đoàn lớn thế giới tại COMPUTEX 2023, trước khoảng 3.500 cử tọa đến từ khắp thế giới, ông Jensen Huang diễn thuyết suốt gần 2 tiếng đồng hồ vào giữa trưa nhưng đầy cuốn hút với sự uyên bác và tính dí dỏm, liên tục nhận được những phản ứng và tràng vỗ tay tán dương từ cử tọa toàn cầu. Nhà sáng lạp NVIDIA, công ty có giá trị vốn hóa thị trường lớn thứ 6 thế giới (sau Apple, Microsoft, Saudi Aramco, Alphabet-Google, Amazon – vào đầu tháng 6-2023 theo CompaniesMarketcap) đã mô tả các dịch vụ tính toán tăng tốc accelerated computing, phần mềm và hệ thống cho phép mô hình kinh doanh mới và làm cho các mô hình hiện tại hiệu quả hơn.

Hàng ngàn người dự COMPUTEX 2023 đến nghe keynote trực tiếp của nhà sáng lập NVIDIA sáng 29-5-2023.

Các thông tin hàng đầu từ bài diễn thuyết của ông Jensen Huang:

  • Grace Hopper cung cấp sức mạnh cho siêu máy tính có bộ nhớ lớn (big-memory supercomputer) dành cho gen AI.
  • Kiến trúc tham khảo dạng mô-đun (modular reference architecture) cho phép hơn 100 cấu hình máy chủ được tăng tốc.
  • WPP và NVIDIA tạo ra hệ thống công cụ quảng cáo số hóa (digital ad content engine) trong Omniverse.
  • SoftBank,các trung tâm dữ liệu gen AI 5G do NVIDIA xây dựng ở Nhật Bản.
  • Công nghệ mạng tăng tốc cho đám mây AI dựa trên Ethernet.
  • NVIDIA ACE for Games mang lại sự sống cho các nhân vật với gen AI.
  • Các nhà sản xuất điện tử trên toàn thế giới đều hưởng ứng với NVIDIA AI.
  • QCT và Supermicro là hai trong những đối tác đầu tiên sử dụng đặc điểm kỹ thuật máy chủ cho hơn 100 cấu hình hệ thống nhằm tăng tốc công việc AI, HPC và Omniverse.

Một động cơ mới cho AI Doanh nghiệp (Enterprise AI)

Ông Huang đã thông báo rằng siêu chíp Grace Hopper hiện đã hoàn chỉnh. Nó kết hợp CPU NVIDIA Grace tiết kiệm năng lượng với GPU Tensor Core NVIDIA H100 hiệu năng cao trong một mô-đun duy nhất.

Đối với các doanh nghiệp cần hiệu năng AI tối ưu, ông công bố DGX GH200, một siêu máy tính AI có bộ nhớ lớn. Nó sử dụng NVIDIA NVLink để kết hợp tới 256 superchip Grace Hopper NVIDIA GH200 thành một GPU có kích thước trung tâm dữ liệu duy nhất.

DGX GH200 có hiệu năng cấp độ exaflops và bộ nhớ chia sẻ 144 terabyte, nhiều hơn gần 500 lần so với hệ thống NVIDIA DGX A100 320GB đơn lẻ. Điều này cho phép các nhà phát triển xây dựng các mô hình ngôn ngữ lớn (large language model – LLM) cho chatbot generative AI, thuật toán phức tạp cho hệ thống gợi ý (recommender system) và các mạng lưới neural đồ thị được sử dụng cho việc phát hiện gian lận và phân tích dữ liệu. (Một exaflops bằng 1.000 petaflops, tương đương 1 tỷ tỷ phép tính một giây. FLOPS viết tắt từ FLoating-point Operations Per Second là thước đo hiệu năng của máy tính).

Google Cloud, Meta và Microsoft là những công ty đầu tiên dự kiến được tiếp cận với DGX GH200 để khám phá khả năng của superchip này cho các công việc làm việc gen AI.

Siêu máy tính NVIDIA DGX GH200 AI supercomputer có khả năng thực hiện 1 exaFLOP hiệu năng cho generative AI.

Ông Huang nói: “Siêu máy tính AI DGX GH200 tích hợp các công nghệ tính toán và mạng tăng tốc tiên tiến nhất của NVIDIA để mở rộng biên giới AI.”

NVIDIA đang xây dựng siêu máy tính AI khổng lồ riêng của mình, NVIDIA Helios, sẽ được triển khai vào năm nay. Nó sẽ sử dụng bốn hệ thống DGX GH200 liên kết với mạng lưới NVIDIA Quantum-2 InfiniBand với băng thông lên đến 400Gb/s để tăng tốc độ lưu lượng dữ liệu cho việc đào tạo các mô hình AI lớn.

DGX GH200 là thành quả của hàng trăm hệ thống được công bố tại sự kiện sử dụng GPU và CPU mới nhất của NVIDIA. Chúng đang mang lại generative AI và tính toán tăng tốc cho hàng triệu người dùng.

Để có cái nhìn tổng thể, ông Huang thông báo hơn 400 cấu hình hệ thống đang đến thị trường với các kiến trúc Hopper, Grace, Ada LovelaceBlueField mới nhất của NVIDIA. Chúng nhằm giải quyết những thách thức phức tạp nhất trong lĩnh vực AI, khoa học dữ liệu và tính toán hiệu năng cao.

Tăng tốc trong mọi quy mô

Để phù hợp với nhu cầu của các trung tâm dữ liệu với mọi quy mô, ông Huang đã thông báo về NVIDIA MGX, một kiến trúc tham khảo mô-đun cho việc tạo ra các máy chủ tăng tốc. Nhà sản xuất hệ thống sẽ sử dụng nó để nhanh chóng và hiệu quả về chi phí khi xây dựng hơn một trăm cấu hình máy chủ khác nhau phù hợp với một loạt các ứng dụng AI, HPC và NVIDIA Omniverse.

MGX cho phép các nhà sản xuất xây dựng máy chủ CPU và tăng tốc bằng cùng một kiến trúc và các thành phần mô-đun chung. Nó hỗ trợ toàn bộ dòng sản phẩm GPU, CPU, đơn vị xử lý dữ liệu (data processing unit – DPU) và bộ chuyển mạng (network adapter) của NVIDIA cũng như bộ xử lý x86 và Arm trên một loạt các khung chassis làm mát bằng không khí và làm mát bằng chất lỏng.

QCT và Supermicro sẽ là những thương hiệu đầu tiên đưa ra thị trường các thiết kế MGX vào tháng 8-2023. Hệ thống ARS-221GL-NR của Supermicro được công bố tại COMPUTEX 2023 sử dụng CPU Grace, trong khi hệ thống S74G-2U của QCT, cũng được công bố tại sự kiện, sử dụng Grace Hopper.

ASRock Rack, ASUS, GIGABYTE và Pegatron cũng sẽ sử dụng MGX để tạo ra máy tính tăng tốc thế hệ tiếp theo.

5G “cần” Grace Hopper

Bài diễn thuyết cũng cho thấy cách NVIDIA đang giúp tái tạo 5G với Grace Hopper. Ông Huang thông báo rằng NVIDIA đang làm việc với một tập đoàn viễn thông để xây dựng một mạng lưới phân tán của các trung tâm dữ liệu tại Nhật Bản. Nó sẽ cung cấp dịch vụ 5G và các ứng dụng generative AI trên một nền tảng đám mây chung.

Các trung tâm dữ liệu sẽ sử dụng Grace Hopper và BlueField-3 DPU của NVIDIA trong các hệ thống MGX mô-đun cũng như các bộ chuyển mạng Ethernet Spectrum của NVIDIA để cung cấp độ chính xác cao mà giao thức 5G yêu cầu. Nền tảng này sẽ giảm chi phí bằng cách tăng hiệu suất phổ (spectral efficiency) trong khi giảm tiêu thụ năng lượng.

Các hệ thống này sẽ giúp khám phá các ứng dụng trong lái xe tự động, các nhà máy AI, thực tế tăng cường (augmented reality) và thực tế ảo (virtual reality), thị giác máy tính và bản sao số (digital twin). Các ứng dụng tương lai có thể bao gồm hội nghị video 3D và giao tiếp hình ảnh 3D.

Tăng tốc mạng đám mây

Ngoài ra, ông Huang còn giới thiệu NVIDIA Spectrum-X, một nền tảng mạng được xây dựng để cải thiện hiệu năng và hiệu quả năng lượng của đám mây AI dựa trên Ethernet. Nó kết hợp các switch Ethernet Spectrum-4 với BlueField-3 DPU và phần mềm để cung cấp tăng tốc 1,7 lần về hiệu năng AI và hiệu quả năng lượng so với các mạng lưới Ethernet truyền thống.

NVIDIA Spectrum-X, các switch Spectrum-4 và BlueField-3 DPU hiện có sẵn từ các nhà sản xuất hệ thống bao gồm Dell Technologies, Lenovo và Supermicro.

Ông Huang thông báo rằng NVIDIA đang xây dựng Israel-1, một siêu máy tính gen AI tại trung tâm dữ liệu ở Israel. Với giá trị hàng trăm triệu USD, nó sẽ được xây dựng với các máy chủ Dell PowerEdge, nền tảng siêu tính toán NVIDIA HGX H100 và nền tảng Spectrum-X với BlueField-3 DPUs và switch Spectrum-4.

NVIDIA Spectrum-X tăng tốc các quy trình công việc AI bình thường có thể bị giảm hiệu suất trên các mạng Ethernet truyền thống.

Mang nhân vật game vào cuộc sống

AI tạo sinh ảnh hưởng đến cách mọi người chơi game. Ông Huang thông báo NVIDIA Avatar Cloud Engine (ACE) for Games, một dịch vụ nhà máy mà các nhà phát triển có thể sử dụng để xây dựng và triển khai các mô hình AI tùy chỉnh cho lời nói, cuộc trò chuyện và hoạt hình. Nó sẽ mang lại kỹ năng giao tiếp cho các nhân vật không thể điều khiển (non-playable) để chúng có thể phản ứng trả lời các câu hỏi với các tính cách sống động như thật đang phát triển.

NVIDIA ACE for Games bao gồm các mô hình nền tảng AI như NVIDIA Riva để phát hiện và ghi âm lời nói của người chơi. Văn bản sẽ kích hoạt NVIDIA NeMo để tạo ra các phản ứng tùy chỉnh được hoạt hình bằng NVIDIA Omniverse Audio2Face.

NVIDIA ACE for Games cung cấp một chuỗi công cụ để đưa các nhân vật vào cuộc sống với generative AI.

Tăng tốc generative AI trên Windows

Ông Huang mô tả cách NVIDIA và Microsoft đang cùng nhau đẩy mạnh sự đổi mới cho máy tính Windows trong thời đại generative AI.

Các công cụ, framework và trình điều khiển mới và cải tiến đang làm cho việc phát triển và triển khai AI trên máy tính cá nhân dễ dàng hơn. Ví dụ, công cụ Olive của Microsoft để tối ưu hóa và triển khai mô hình AI tăng tốc bằng GPU và các trình điều khiển đồ họa mới sẽ cải thiện hiệu năng DirectML trên máy tính Windows với GPU của NVIDIA.

Sự cộng tác này sẽ nâng cao và mở rộng cơ sở cài đặt của 100 triệu máy tính sử dụng GPU RTX với Tensor Cores của NVIDIA, nâng cao hiệu năng của hơn 400 ứng dụng và trò chơi Windows tăng tốc AI.

Số hóa các ngành công nghiệp lớn nhất thế giới

Generative AI cũng tạo ra cơ hội mới trong ngành quảng cáo số có giá trị 700 tỷ USD. Ví dụ, WPP, tổ chức dịch vụ marketing lớn nhất thế giới, đang cùng NVIDIA xây dựng một engine nội dung có khả năng generative AI đầu tiên trên nền tảng đám mây Omniverse.

Trong một phiên bản demo, ông Huang đã cho thấy các nhóm sáng tạo sẽ kết nối các công cụ thiết kế 3D của mình như Adobe Substance 3D để xây dựng các phiên bản số hóa của các sản phẩm khách hàng trong NVIDIA Omniverse. Sau đó, nội dung từ các công cụ generative AI được đào tạo trên dữ liệu được cung cấp một cách có trách nhiệm và được xây dựng với NVIDIA Picasso sẽ cho phép họ nhanh chóng sản xuất các bộ quảng cáo, video và trải nghiệm 3D cho các thị trường và người dùng toàn cầu trên bất kỳ thiết bị web nào.

Nhà máy tự động hóa tương lai

Với ước tính có 10 triệu nhà máy, ngành sản xuất trị giá 46.000 tỷ USD là một lĩnh vực phong phú cho số hóa công nghiệp.

Ông Huang nói: “Các ngành công nghiệp lớn nhất trên thế giới sản xuất các sản phẩm vật lý. Xây dựng chúng dưới dạng kỹ thuật số trước tiên có thể tiết kiệm hàng tỷ USD.”

Bài diễn thuyết đã cho thấy cách các nhà sản xuất điện tử bao gồm Foxconn Industrial Internet, Innodisk, Pegatron, Quanta và Wistron đang xây dựng quy trình làm việc số với các công nghệ của NVIDIA để hiện thực hóa tầm nhìn về một nhà máy thông minh hoàn toàn kỹ thuật số.

Họ sử dụng Omniverse và các API generative AI kết nối các công cụ thiết kế và sản xuất của mình để có thể xây dựng các phiên bản số hóa của các nhà máy. Ngoài ra, họ sử dụng NVIDIA Isaac Sim để mô phỏng và kiểm tra các robot và NVIDIA Metropolis, một khung nhìn AI thị giác, để kiểm tra tự động và kiểm tra quang học.

Thành phần mới nhất, NVIDIA Metropolis for Factories, có thể tạo ra các hệ thống kiểm soát chất lượng tùy chỉnh, mang lại lợi thế cạnh tranh cho các nhà sản xuất. Nó đang giúp các công ty phát triển các ứng dụng AI hiện đại.

AI tăng tốc quy trình lắp ráp

Ví dụ, Pegatron – công ty sản xuất 300 sản phẩm trên toàn cầu, bao gồm laptop và điện thoại thông minh – đang tạo ra các nhà máy ảo với Omniverse, Isaac Sim và Metropolis. Điều này cho phép họ thử các quy trình trong một môi trường mô phỏng, tiết kiệm thời gian và chi phí.

Pegatron cũng đã sử dụng bộ công cụ phát triển phần mềm NVIDIA DeepStream để phát triển ứng dụng video thông minh đã giúp cải thiện 10 lần hiệu năng.

Foxconn Industrial Internet, một chi nhánh dịch vụ của nhà sản xuất công nghệ lớn nhất thế giới, đang hợp tác với các đối tác của NVIDIA Metropolis để tự động hóa một phần quan trọng của các điểm kiểm tra chất lượng mạch điện tử.

Trong một video, ông Huang đã cho thấy cách Techman Robot, một công ty con của Quanta, đã sử dụng NVIDIA Isaac Sim để tối ưu hóa tác vụ kiểm tra trên các dây chuyền sản xuất của tập đoàn đó có trụ sở tại Đài Loan. Nó thực chất sử dụng các robot mô phỏng để đào tạo các robot khác cách tạo ra các robot tốt hơn.

Một hệ sinh thái đối tác lớn – bao gồm ADLINK, Aetina, Deloitte, Quantiphi và Siemens – đang giúp đưa tất cả các giải pháp sản xuất này đến thị trường.

Đó là một ví dụ khác về cách NVIDIA đang giúp các công ty cảm nhận được lợi ích của generative AI với tính toán tăng tốc.

I.L.C.

Nguồn do NVIDIA cung cấp.