Điều khiến thiết bị này gây tò mò nằm ở chỗ nó chỉ nhỏ ngang một chiếc ví, tiêu thụ khoảng 25W điện nhưng lại được Nvidia quảng bá như một ‘siêu máy tính Generative AI cục bộ’. Về cơ bản, đây là một bo mạch AI mini cho phép người dùng chạy trực tiếp các mô hình ngôn ngữ ngay trên máy thay vì phụ thuộc hoàn toàn vào cloud.
Tuy vậy, Jetson Orin Nano Super gần như bị chìm nghỉm sau thời điểm ra mắt cuối năm 2024, trước khi bất ngờ được cộng đồng local AI “đào lại” trong vài tuần gần đây.
Trong bài đăng viral trên X, tài khoản công nghệ Starmex mô tả Jetson Orin Nano Super như “chiếc hộp 249 USD thay thế gói OpenAI 200 USD/tháng chỉ bằng 2 USD tiền điện”. Người này cho biết bản thân từng phải trả khoảng 180 USD tiền OpenAI API mỗi tháng cho các hệ thống automation, pipeline nội dung và coding assistant hoạt động liên tục.
Starmex chia sẻ trải nghiệm dùng Jetson, kèm video CEO Nvidia giới thiệu chiếc máy
Theo chia sẻ của Starmex, thứ khiến anh thay đổi suy nghĩ lại đến từ một bức ảnh trong Discord: một chiếc hộp nhỏ bằng bộ bài đặt dưới gầm bàn, kèm dòng mô tả “Đã hủy gói OpenAI subscription. Cái này chạy Llama local. Tiền điện khoảng 2 USD/tháng”.
“Tôi đặt mua luôn ngay trong ngày hôm đó”, Starmex viết.
Đứng trước những tuyên bố đầy hấp dẫn này, không ít người dùng đã đặt dấu hỏi về tính thực tế của sản phẩm. Nhìn lại thời điểm tháng 12 năm 2024, CEO Jensen Huang từng trực tiếp giới thiệu thiết bị này và nhấn mạnh rằng người dùng có thể sở hữu một hệ thống AI cá nhân với mức giá chỉ 249 USD.
Bước sang năm 2026, thị trường AI đã thay đổi chóng mặt với tốc độ phát triển gần như theo từng tháng. Thế nhưng Jetson Orin Nano Super bất ngờ được nhắc lại và nhanh chóng trở thành chủ đề nóng trên mạng xã hội. Nguyên nhân lớn nhất nằm ở bài toán chi phí ngày càng khiến nhiều lập trình viên và người dùng AI cảm thấy áp lực.
Phiên bản này thực chất là biến thể nâng cấp của dòng Jetson Orin Nano trước đây, được tối ưu phần mềm để mở khóa hiệu năng cao hơn trong khi vẫn giữ mức giá 249 USD. Nhờ đó, đây cũng trở thành một trong những bộ Jetson có giá dễ tiếp cận nhất mà Nvidia từng bán ra.
Điểm đáng chú ý nhất nằm ở khả năng chạy các mô hình AI mã nguồn mở trực tiếp trên máy thông qua Ollama. Người dùng có thể triển khai hàng loạt mô hình như Llama, Qwen, Mistral, Gemma hay DeepSeek mà không cần phụ thuộc hoàn toàn vào cloud.
Toàn bộ quá trình xử lý diễn ra ngay trên thiết bị, giúp dữ liệu không phải gửi liên tục lên máy chủ bên thứ ba. Với nhiều người dùng, đây mới là thứ tạo nên sức hấp dẫn lớn nhất của local AI.
Vì sao nhiều người xem đây là “kẻ hủy diệt” hóa đơn AI?
Lý do đầu tiên và cũng dễ thấy nhất là chi phí.
Không ít người dùng AI hiện nay đang phải duy trì cùng lúc nhiều gói dịch vụ như ChatGPT, Claude, Gemini hay các nền tảng API khác để phục vụ công việc. Với lập trình viên hoặc người làm automation, tổng chi phí hàng tháng có thể lên tới hàng trăm USD cho những gói cao cấp.
Áp lực này càng lớn hơn khi giá các gói AI liên tục tăng trong thời gian qua, trong khi nhiều người dùng cũng bắt đầu phàn nàn rằng giới hạn usage và token trên các nền tảng cloud ngày càng “cạn” nhanh hơn trước. Không ít người có cảm giác mình đang trả tiền ngày càng nhiều nhưng lại phải liên tục để ý quota sử dụng.
Trong khi đó, Jetson Orin Nano Super chỉ yêu cầu khoản đầu tư ban đầu 249 USD – nhỉnh hơn tí so với gói Pro 200 USD của ChatGPT – cùng mức tiêu thụ điện khá thấp.
Theo Starmex, điểm hấp dẫn nhất nằm ở việc gần như toàn bộ hệ thống có thể hoạt động giống OpenAI API nhưng chạy hoàn toàn cục bộ. Người dùng chỉ cần cài Ollama và thay đổi một dòng địa chỉ API trong code, mọi workflow còn lại gần như giữ nguyên.
“Mỗi prompt đều tốn tiền. Mỗi request đều phải gửi lên server của họ. Mỗi cuộc trò chuyện đều rời khỏi chiếc máy của mình,” Starmex viết khi nói về cảm giác ngày càng phụ thuộc vào cloud AI.
Theo những người ủng hộ thiết bị này, các mô hình AI cỡ 7B – tức khoảng 7 tỷ tham số – hiện đã đủ đáp ứng phần lớn nhu cầu phổ thông như tóm tắt tài liệu, viết nháp, hỗ trợ lập trình, hỏi đáp tài liệu cá nhân hay automation cơ bản. Với những tác vụ này, tốc độ phản hồi của model local đã đủ nhanh để sử dụng thực tế.
Nvidia cho biết thiết bị đạt khoảng 67 TOPS AI performance, tức khoảng 67 nghìn tỷ phép tính AI mỗi giây, đủ để vận hành nhiều mô hình 7B trực tiếp trên máy
Starmex gọi đây là “sweet spot” của AI local hiện nay: “đủ nhanh để phản hồi gần như tức thì, đủ thông minh cho 90% tác vụ hàng ngày.”
Một số người dùng thậm chí còn xây dựng trợ lý AI cá nhân hoạt động hoàn toàn offline, từ gửi bản tin buổi sáng cho đến tạo bài tập cho con cái mà không cần dùng tới cloud AI.
Điều khiến nhiều người hứng thú với Jetson Orin Nano Super không chỉ nằm ở chuyện tiết kiệm tiền, mà còn là cảm giác được tự mình nắm quyền kiểm soát hệ thống AI. Khi mô hình chạy trực tiếp trên thiết bị cá nhân, người dùng không còn quá phụ thuộc vào API, không phải lo giới hạn lượt sử dụng hay những đợt tăng giá dịch vụ bất ngờ. Quan trọng hơn, dữ liệu cũng không cần phải liên tục gửi lên máy chủ của bên thứ ba để xử lý.
Tuy nhiên, đây cũng là lúc các tranh cãi bắt đầu xuất hiện.
Nhiều ý kiến cho rằng internet đang thổi phồng quá mức khả năng của các mô hình local 7B. Dù đã tiến bộ rất nhanh trong hai năm gần đây, chúng vẫn còn khoảng cách khá lớn so với các frontier model hiện đại như Claude Opus hay GPT thế hệ mới.
Khả năng suy luận phức tạp, coding nâng cao, xử lý ngữ cảnh dài hay độ ổn định tổng thể của các mô hình cloud hiện vẫn vượt trội hơn đáng kể.
Nhiều tranh luận diễn ra dưới bài đăng của Starmex
Chính Starmex cũng thừa nhận Jetson Orin Nano Super không phải thiết bị thay thế GPT-5 hay Claude Sonnet. Theo người này, hệ thống local AI như vậy phù hợp hơn với các tác vụ cấp độ GPT-3.5 nhưng có lợi thế gần như không phát sinh chi phí vận hành lâu dài.
Các mô hình này xử lý khá tốt những công việc như tóm tắt nội dung, viết nháp, chỉnh sửa văn bản, hỗ trợ code, hỏi đáp tài liệu hay automation pipeline cơ bản. Đây cũng là nhóm tác vụ chiếm phần lớn nhu cầu sử dụng AI hàng ngày của nhiều người dùng phổ thông.
“80% những gì mọi người dùng ChatGPT mỗi ngày thực ra đều nằm trong nhóm này”, Starmex nhận định. Với 20% tác vụ khó hơn như suy luận nhiều bước phức tạp, context cực dài hay các bài toán cần frontier model mạnh nhất, người dùng vẫn có thể tiếp tục duy trì gói ChatGPT Plus hoặc Claude trả phí khoảng 20 USD/tháng, rẻ hơn nhiều so với các gói cao cấp.
Theo cách tính của Starmex, mô hình sử dụng này có thể giúp tổng chi phí AI hàng tháng giảm từ khoảng 200 USD xuống còn 22 USD, bao gồm 2 USD tiền điện.
Starmex tính toán chi phí sử dụng local AI so với các dịch vụ cloud AI, chưa tính phí ChatGPT Plus nếu cần. Ảnh Việt hoá từ blog của Starmex.
Tuy nhiên, local AI hiện vẫn tồn tại không ít giới hạn. Các model 7B khó xử lý tốt những bài toán suy luận phức tạp, context dài cũng nhanh chóng chạm giới hạn do thiết bị chỉ có 8 GB RAM. Những tác vụ như tạo ảnh AI hay truy cập internet thời gian thực cũng không phải điểm mạnh của các hệ thống local dạng này.
Starmex cho rằng Nvidia bán Jetson Orin Nano Super với mức giá 249 USD không đơn thuần để kiếm lợi nhuận phần cứng, mà còn nhằm mở rộng hệ sinh thái Jetson cho developer AI. Theo người này, các công cụ như Ollama, Open WebUI hay llama.cpp hiện đều đang được tối ưu rất mạnh cho làn sóng local AI, và hệ sinh thái này sẽ còn tiếp tục phát triển trong vài năm tới.
Cơn sốt local AI đang trở lại
Dù vậy, việc một sản phẩm ra mắt từ cuối năm 2024 bất ngờ hot trở lại trong năm 2026 cũng phản ánh khá rõ xu hướng hiện tại của ngành AI.
Trong hơn một năm qua, người dùng bắt đầu cảm nhận rõ áp lực chi phí từ các dịch vụ AI. Ngay cả những người sẵn sàng bỏ tiền cho AI cũng bắt đầu có cảm giác tiêu cực về việc “thuê quyền truy cập” vào tài nguyên tính toán.
Ở chiều ngược lại, AI cục bộ lại đang trở nên dễ tiếp cận hơn bao giờ hết. Các công cụ như Ollama giúp việc triển khai model local đơn giản hơn rất nhiều so với vài năm trước, còn các mô hình mã nguồn mở như Qwen hay Llama cũng tiến bộ nhanh đến mức đủ đáp ứng phần lớn nhu cầu phổ thông.
Làn sóng này càng được củng cố khi các nhà sản xuất phần cứng cũng đang dồn lực cho cuộc đua chạy AI ngay trên thiết bị. Không chỉ có những bo mạch chuyên dụng của Nvidia, ngay cả những chiếc laptop cao cấp như MacBook Pro của Apple cũng liên tục nâng cấp dung lượng RAM thống nhất và sức mạnh NPU để biến thành những cỗ máy chạy local AI đáng nể.
Quan trọng hơn, local AI mang lại cảm giác kiểm soát mà cloud AI khó thay thế hoàn toàn. Dữ liệu nằm trên máy của người dùng, mô hình cũng nằm trong tay người dùng, còn chi phí vận hành thì dễ dự đoán hơn rất nhiều so với việc phụ thuộc vào API.
Jetson Orin Nano Super vì thế có lẽ không phải ‘kẻ hủy diệt’ ChatGPT như nhiều bài đăng trên mạng xã hội mô tả. Nhưng nó cho thấy một thay đổi thú vị: ngày càng nhiều người bắt đầu muốn AI chạy trên chiếc máy của riêng mình, thay vì phải phụ thuộc hoàn toàn vào server của các ông lớn công nghệ.
Nguồn:cafef.vn


