Nvidia ra mắt Vera – CPU 88 nhân Arm cho kỷ nguyên AI

bởi Phát Lâm

Tại hội nghị GTC 2026 diễn ra ở San Jose, Nvidia đã chính thức vén màn dòng CPU trung tâm dữ liệu thế hệ mới mang tên Vera – một tuyên ngôn táo bạo rằng gã khổng lồ chip đồ họa không còn chỉ muốn thống trị thị trường GPU, mà đang nhắm thẳng vào trái tim của mọi hệ thống máy chủ: bộ xử lý trung tâm. Với 88 nhân Arm và khả năng gom 256 chip vào một rack tản nhiệt nước duy nhất, Vera là đòn khai chiến nghiêm túc nhất của Nvidia với Intel và AMD từ trước đến nay.

Vera và kiến trúc Arm: Khi Nvidia tự thiết kế lại CPU từ đầu

Điểm khác biệt căn bản đầu tiên cần hiểu: Vera không phải phiên bản “nâng cấp nhỏ” của Grace – người tiền nhiệm từng được định vị chủ yếu là chip đồng hành hỗ trợ GPU. Vera được thiết kế từ đầu như một CPU đa năng thực thụ cho trung tâm dữ liệu, với mục tiêu rõ ràng là các tác vụ AI-centric: chạy agent AI, phân tích dữ liệu lớn, biên dịch mã nguồn và xử lý các pipeline nặng về Python hay SQL – những tác vụ vốn “bóp cổ” CPU thông thường nhưng lại phải chạy song song liên tục với GPU.

Về kiến trúc, Vera xây dựng trên 88 nhân Arm v9.2-A “Olympus” do Nvidia tự thiết kế – tăng từ 72 nhân Neoverse của Grace, đồng thời cải thiện IPC (số lệnh thực thi mỗi chu kỳ) khoảng 1,5 lần, tương đương hiệu suất tổng tăng 50% so với CPU “chuẩn” trong các bài kiểm tra nội bộ. Nhưng điểm thú vị hơn cả con số là kỹ thuật “spatial multi-threading” – cách tiếp cận đa luồng hoàn toàn khác so với SMT thông thường trên chip Intel hay AMD. Thay vì để hai luồng xử lý chia sẻ tài nguyên và phải lần lượt chờ đợi nhau, Vera phân vùng vật lý các đơn vị thực thi, cache và thanh ghi riêng cho từng luồng. Kết quả là hai luồng chạy song song thực sự trên một nhân duy nhất – hiệu suất ổn định, dễ dự đoán và đặc biệt phù hợp với môi trường đa người dùng trên đám mây.

Nvidia ra mắt Vera - CPU 88 nhân Arm cho kỷ nguyên AI

Về nền tảng, Vera đáp ứng đầy đủ các chuẩn kết nối hiện đại gồm PCIe 6.0 và CXL 3.1, đồng thời trang bị giao tiếp NVLink-C2C thế hệ hai với băng thông chip-to-chip lên đến 1,8 TB/s – gấp đôi so với Grace và vượt xa giới hạn của PCIe 6.0. Điều này cho phép CPU và GPU phối hợp như hai phần của một hệ thống thống nhất, thay vì chỉ là hai chip riêng biệt kết nối qua bus thông thường.

Hiệu năng Nvidia Vera 88-core: Băng thông “khủng” và giá trị thực tế

Nếu bạn đang làm việc với khối lượng dữ liệu lớn, băng thông bộ nhớ mới chính là điểm đáng chú ý nhất của Vera. Grace đã cung cấp 546 GB/s – một con số ấn tượng vào thời điểm ra mắt. Vera nhân đôi con số đó lên 1,2 TB/s và tăng gấp ba dung lượng bộ nhớ lên tới 1,5 TB LPDDR5/LPDDR5X. Để dễ hình dung: đây là đủ RAM để tải toàn bộ một mô hình ngôn ngữ lớn (LLM) cỡ vừa trực tiếp vào bộ nhớ, xử lý liền mạch mà không cần swap liên tục – thứ thường khiến các hệ thống AI “ngắc ngứ” ở bước tiền xử lý và suy luận.

Nvidia ra mắt Vera - CPU 88 nhân Arm cho kỷ nguyên AI

Chưa dừng lại ở đó, phần “đầu não” của chip cũng được tối ưu hóa triệt để cho AI. Vera trang bị bộ giải mã lệnh 10 kênh song song – hiếm gặp ở CPU server phổ thông – kết hợp bộ dự đoán nhánh neural xử lý hai dự đoán mỗi chu kỳ và bộ đệm lệnh được tối ưu riêng cho PyTorch. Đây là tín hiệu rõ ràng: Nvidia coi các framework AI phổ biến là “công dân hạng nhất” trên Vera, không phải tác vụ cần thích nghi về sau.

Nvidia ra mắt Vera - CPU 88 nhân Arm cho kỷ nguyên AI

Thực tế cho thấy, khi tích hợp 256 chip Vera vào một rack tản nhiệt nước, hệ thống này cung cấp tổng cộng hơn 400 TB bộ nhớ và khoảng 300 TB/s băng thông – đủ sức chạy hơn 22.500 môi trường CPU song song. Nvidia công bố mức tăng hiệu suất từ 1,8× đến 2,2× so với Grace trên các tác vụ scripting, biên dịch, phân tích và HPC, và 1,5× so với CPU x86 cạnh tranh trong các bài test sandbox. Những con số này chưa được bên thứ ba kiểm chứng độc lập, nhưng hoàn toàn phù hợp với trọng tâm thiết kế của chip: băng thông cao, song song hóa mạnh và đa luồng thực sự.

Nvidia ra mắt Vera - CPU 88 nhân Arm cho kỷ nguyên AI

Nvidia Vera – Nước cờ chiến lược định hình tương lai AI

Vera sẽ bắt đầu xuất xưởng cho các đối tác trong nửa cuối năm 2026, tích hợp vào hệ thống từ các OEM và ODM lớn cũng như nền tảng Vera Rubin của chính Nvidia. Với các nhà vận hành trung tâm dữ liệu đang chuẩn hóa trên nền GPU Nvidia, Vera mang lại lợi thế chiến lược rõ ràng: thay vì phụ thuộc vào CPU x86 như một mắt xích ngoài, họ có thể xây dựng hệ thống CPU-GPU nhất quán, được tối ưu đầu-cuối cho AI và analytics. Nếu bạn là nhà đầu tư hạ tầng hay kỹ sư đang theo dõi cuộc đua AI, đây là thời điểm tìm hiểu sâu hơn về chiến lược của Nvidia – vì Vera rất có thể là bước ngoặt định hình lại cách thế giới xây dựng trung tâm dữ liệu trong thập kỷ tới.

Bài viết liên quan

Đăng bình luận