Nhà sản xuất chip hàng đầu thế giới muốn AI nguồn mở thành công, có lẽ vì các model đóng ngày càng chạy trên silicon của đối thủ. Nvidia đã kiếm bộn tiền nhờ cung cấp chip cho các công ty làm trí tuệ nhân tạo, nhưng hôm nay hãng đã tiến một bước hướng tới vai trò nhà phát triển model nghiêm túc hơn bằng cách phát hành một loạt model mã mở tối tân, cùng dữ liệu và công cụ giúp kỹ sư sử dụng chúng.
Động thái này xuất hiện đúng lúc các công ty AI như OpenAI, Google và Anthropic đang tự phát triển những con chip ngày càng mạnh, có thể là “phương án phòng thủ” nếu các hãng này dần rời xa công nghệ của Nvidia theo thời gian.
Các model mở đã là thành phần then chốt của hệ sinh thái AI khi nhiều nhà nghiên cứu và startup dùng chúng để thử nghiệm, dựng mẫu và xây dựng sản phẩm. Dù OpenAI và Google cung cấp các model mở cỡ nhỏ, họ không cập nhật thường xuyên như các đối thủ ở Trung Quốc. Vì lý do này và các lý do khác, model mở từ các công ty Trung Quốc hiện phổ biến hơn nhiều, theo dữ liệu từ Hugging Face, nền tảng lưu trữ dự án mã nguồn mở.
Các model Nemotron 3 mới của Nvidia nằm trong số những lựa chọn tốt nhất có thể tải về, chỉnh sửa và chạy trên phần cứng của chính mình, theo điểm benchmark do công ty chia sẻ trước khi phát hành.
“Đổi mới mở là nền tảng của tiến bộ AI,” CEO Jensen Huang nói trong một tuyên bố trước khi công bố tin tức. “Với Nemotron, chúng tôi đang biến AI tiên tiến thành một nền tảng mở, mang đến cho nhà phát triển sự minh bạch và hiệu quả họ cần để xây dựng hệ thống agent ở quy mô lớn.”
Nvidia theo đuổi cách tiếp cận minh bạch hơn nhiều so với nhiều đối thủ Mỹ bằng cách phát hành dữ liệu dùng để huấn luyện Nemotron, thực tế này sẽ giúp kỹ sư dễ dàng chỉnh sửa model hơn. Công ty cũng phát hành các công cụ hỗ trợ tùy biến và fine-tune. Bao gồm kiến trúc model lai “hỗn hợp chuyên gia” dạng tiềm ẩn (hybrid latent mixture-of-experts, MoE), mà Nvidia cho biết đặc biệt phù hợp để xây dựng AI agent có thể thực hiện hành động trên máy tính hoặc web. Công ty cũng ra mắt các thư viện cho phép người dùng huấn luyện agent làm việc bằng tăng cường học (reinforcement learning), liên quan đến việc cho model nhận “phần thưởng” và “hình phạt” mô phỏng.
Các model Nemotron 3 có ba kích cỡ: Nano với 30 tỷ tham số; Super với 100 tỷ; và Ultra với 500 tỷ. Số tham số của model tương quan lỏng lẻo với mức độ “khả năng” cũng như độ nặng khi vận hành. Những model lớn nhất cồng kềnh đến mức cần chạy trên các cụm phần cứng đắt đỏ.
Nền Tảng Cho Model
Kari Ann Briski, phó chủ tịch mảng phần mềm AI sinh tạo cho doanh nghiệp tại Nvidia, nói model mở quan trọng với người xây dựng AI vì ba lý do: Họ ngày càng cần tùy biến model cho nhiệm vụ cụ thể; việc chuyển tiếp truy vấn giữa các model thường hữu ích; và dễ “vắt” câu trả lời thông minh hơn sau huấn luyện bằng cách cho model thực hiện một dạng suy luận mô phỏng. “Chúng tôi tin nguồn mở là nền tảng cho đổi mới AI, tiếp tục thúc đẩy tăng trưởng kinh tế toàn cầu,” Briski nói.
Gã khổng lồ mạng xã hội Meta đã phát hành những model mở tiên tiến đầu tiên dưới tên Llama vào tháng 2/2023. Tuy nhiên, khi cạnh tranh tăng nhiệt, Meta ám chỉ rằng các bản phát hành tương lai có thể sẽ không còn mở nguồn.
Động thái này là một phần của xu hướng lớn hơn trong ngành AI. Trong năm qua, các công ty Mỹ dịch chuyển xa khỏi sự cởi mở, trở nên kín tiếng hơn về nghiên cứu và do dự hơn trong việc “hé lộ” các bí quyết kỹ thuật mới nhất cho đối thủ. Một báo cáo gần đây từ OpenRouter, công ty cho phép truy cập nhiều model qua một giao diện người dùng, cho thấy model mở chiếm khoảng một phần ba tổng số token đi qua hệ thống của họ trong năm 2025. Các công ty Trung Quốc như DeepSeek, Alibaba, Moonshot AI, Z.ai và MiniMax thường xuyên phát hành model mở mạnh mẽ và công bố chi tiết về tiến bộ nghiên cứu, khiến sản phẩm của họ hấp dẫn hơn để kỹ sư mang ra thử nghiệm.
Điều này có thể gây rắc rối cho Nvidia. Phần cứng của công ty trở nên quan trọng đến mức silicon của họ đã thành “quân bài” trong các thỏa thuận thương mại của Trump với Trung Quốc. Gần đây, chính phủ Mỹ cho biết sẽ cho phép Nvidia xuất khẩu chip H200, dòng tốt nhất của thế hệ trước, sang Trung Quốc, nhưng chính phủ Trung Quốc muốn đạt độc lập công nghệ cao hơn và đã có bước đi thúc đẩy doanh nghiệp trong nước dùng chip “nội địa”. Điều này có thể khiến các model AI Trung Quốc gắn kết hơn với silicon Trung Quốc, có nguy cơ làm suy yếu vị thế của Nvidia.







