Inteligență artificială01 iun. 2026
NVIDIA lansează Agent Toolkit și modelul Nemotron 3 Ultra pentru agenți AI autonomi - promite inferență de până la 5 ori mai rapidă și costuri cu până la 30% mai mici
NVIDIA își extinde „trusa” pentru agenți AI autonomi, mizând pe reducerea costurilor și pe controlul de securitate în enterprise , într-o mișcare care poate accelera adoptarea acestor „colegi digitali” în inginerie, securitate cibernetică și operațiuni, potrivit NVIDIA News . Noutatea nu este doar apariția unor modele și componente software, ci faptul că NVIDIA încearcă să standardizeze „stratul” care transformă un model AI într-un agent capabil să ruleze pe termen lung, cu memorie, orchestrare, utilizare de instrumente și politici de confidențialitate. În practică, compania împinge o combinație de elemente open-source (cod deschis) și parteneriate cu furnizori mari de software, pentru a face agenții mai ușor de construit și mai siguri de rulat în organizații. Ce livrează NVIDIA: toolkit, runtime securizat și „abilități” din CUDA-X Pachetul anunțat este centrat pe NVIDIA Agent Toolkit și include: NVIDIA NemoClaw (blueprint-uri, adică șabloane/planuri de implementare pentru agenți) – disponibil acum; modele NVIDIA Nemotron (deschise) pentru agenți care rulează „always-on”; NVIDIA OpenShell , un runtime (mediu de execuție) securizat cu politici de confidențialitate și control – disponibil în „early preview”; acces la bibliotecile NVIDIA CUDA-X ca „skills” (abilități) pe care agenții le pot apela pentru sarcini specializate. NVIDIA susține că această combinație oferă „blocuri” deschise pentru dezvoltarea enterprise, cu accent pe agenți care pot rula mult timp și pot fi guvernați prin politici. Unde se vede impactul operațional: inginerie și simulare, din săptămâni în ore În zona de proiectare și simulare (semiconductori și inginerie industrială), NVIDIA indică un beneficiu operațional direct: companii precum Cadence, Dassault Systèmes, Siemens și Synopsys folosesc NemoClaw pentru a construi „ingineri AI” autonomi care execută fluxuri de lucru de simulare și verificare, cu promisiunea de a comprima săptămâni de muncă în ore . Câteva exemple punctuale din anunț: Cadence folosește OpenShell pentru a securiza „ChipStack AI Super Agent”, un agent complet autonom pentru proiectare și verificare de cipuri; NVIDIA spune că este primul client care îl folosește pentru verificarea autonomă a propriilor proiecte. Dassault Systèmes utilizează NemoClaw și OpenShell pentru a „productiza” (a transforma în produs) o platformă de agenți autonomi pentru design, simulare și operațiuni de producție. Siemens integrează NemoClaw și OpenShell în Fuse EDA AI Agent, pentru orchestrarea fluxurilor multi-instrument în proiectarea de semiconductori și plăci de circuit. Synopsys lucrează cu NVIDIA la „ingineri AI” autonomi „always-on”, cu obiectivul de autonomie completă a fluxurilor de lucru. Separat, NVIDIA menționează și un pilot la Foxconn , care ar urma să folosească NemoClaw pentru platforme din zona medicală (Nurabot și CoDoctor) și pentru un agent de operațiuni de fabrică (MoMClaw), cu controale de confidențialitate în OpenShell. Miza de cost și performanță: Nemotron 3 Ultra și agenții „long-running” Pentru partea de „inteligență” a agenților, NVIDIA anunță Nemotron 3 Ultra , descris ca un model „mixture-of-experts” cu 550 de miliarde de parametri , orientat către agenți care rulează pe termen lung. Compania afirmă că modelul oferă: inferență de până la 5 ori mai rapidă ; costuri cu până la 30% mai mici pentru sarcini agentice complexe, comparativ cu „modele frontieră deschise” din aceeași clasă (fără a detalia în comunicat care sunt reperele exacte). Disponibilitatea indicată: Nemotron 3 Ultra este așteptat pe 4 iunie , inclusiv prin Hugging Face, ModelScope, OpenRouter și build.nvidia.com, ca microservicii NVIDIA NIM. De ce insistă NVIDIA pe runtime și politici: parteneriate cu Microsoft, Canonical și Red Hat Pe măsură ce agenții devin capabili să scrie cod, să creeze sub-agenți și să păstreze context între sesiuni, crește și riscul operațional. NVIDIA poziționează OpenShell ca stratul critic de control (politici, confidențialitate, „guardrails”) pentru rularea agenților la scară. În acest context: NVIDIA și Microsoft colaborează pentru o experiență „nativă” pe Windows, bazată pe noi „primitives” de securitate (identitate, izolare/containment, politici, securitate end-to-end), peste care OpenShell adaugă politici suplimentare și rutare „inteligentă” a cererilor către modele locale, în funcție de setările de confidențialitate; totodată, OpenShell poate „masca” informații personale în cereri trimise către modele din cloud. Canonical ar urma să integreze OpenShell cu Ubuntu prin snaps și „rocks” (containere compatibile OCI). Red Hat integrează OpenShell în platforma Red Hat AI și contribuie la proiectul open-source „upstream” pentru standardizarea modului în care agenții sunt gestionați pe platforme enterprise. NVIDIA mai indică faptul că aceste anunțuri continuă integrări recente cu SAP (Joule Studio runtime) și ServiceNow (Project Arc), însă fără a oferi detalii suplimentare despre calendar sau amploarea implementărilor. „Skills” pentru agenți: ce biblioteci CUDA-X devin accesibile NVIDIA spune că bibliotecile CUDA-X pot fi apelate de agenți ca abilități specializate, cu exemple precum: cuDF pentru procesare și analiză de date structurate la scară mare; cuOpt pentru optimizare (rutare, programare, alocare de resurse, lanț de aprovizionare) în timp real; AI-Q pentru rutare, context persistent și evaluare în fluxuri de cercetare și cunoaștere; NeMo pentru optimizare, evaluare și guvernanță (inclusiv rutare de modele și personalizare); PhysicsNeMo pentru modele de fizică și simulări; CUDA-Q pentru instalare și testare de programe cuantice, simulare și orchestrare de aplicații cuantice. Separat, compania menționează și o colecție de biblioteci și framework-uri open-source pentru „physical AI” (de exemplu, robotică și sisteme industriale), fără a detalia în acest material conținutul exact. Ce urmează Pe termen scurt, reperele sunt disponibilitatea deja anunțată pentru NemoClaw și „early preview” pentru OpenShell, respectiv lansarea așteptată a Nemotron 3 Ultra pe 4 iunie. Din perspectivă operațională, semnalul important este că furnizori mari de software industrial și EDA (electronic design automation) își construiesc agenți autonomi pe aceste componente, cu obiectivul declarat de a scurta semnificativ ciclurile de simulare și verificare și de a muta efortul uman către activități cu valoare mai mare. [...]