Inteligență artificială01 iun. 2026
NVIDIA introduce CPU-ul Vera pentru agenți AI - promite execuție cu 1,8 ori mai rapidă decât procesoarele x86 și disponibilitate din toamnă
NVIDIA își extinde ofensiva în centrele de date cu Vera, un CPU „pentru agenți” care promite să crească veniturile din tokeni. Potrivit NVIDIA News , noul procesor Vera este deja în producție și este poziționat ca o piesă-cheie pentru „fabricile de AI” (infrastructuri care rulează antrenare, inferență și execuție de agenți), într-un moment în care economia acestor sisteme se mută de la „nuclee per dolar” la „tokeni per dolar” — adică la câți pași de calcul utili pot livra pentru fiecare unitate de cost. NVIDIA susține că Vera finalizează sarcini cu 1,8 ori mai repede decât procesoarele x86, pe o plajă de utilizări care include AI „agentic” (modele care nu doar răspund, ci execută acțiuni, rulează cod și folosesc instrumente), învățare prin recompensă (reinforcement learning) și procesare de date. Miza economică invocată de companie este directă: mai multă performanță CPU pe fluxurile critice din centrele de date ar însemna mai mult „token revenue” (venituri asociate volumului de tokeni procesați în servicii AI). De ce contează: CPU-ul devine din nou o constrângere în „fabricile de AI” În arhitecturile moderne pentru AI, acceleratoarele (GPU) fac partea grea de calcul, dar multe etape rămân limitate de CPU: rularea mediilor Python, compilări, execuție de cod în sandbox (medii izolate), logică de orchestrare și conducte de analiză. NVIDIA își construiește argumentul pe ideea că agenții AI cresc masiv cererea pentru astfel de sarcini, iar un CPU mai rapid și mai eficient energetic crește „debitul” (throughput) de agenți și interactivitatea. Jensen Huang , fondator și CEO al NVIDIA, afirmă: „Agenții AI vor fi cei mai mari utilizatori de calcul. Vera este primul CPU proiectat pentru acel viitor — construit pentru a rula AI agentic la scară hyperscale cu performanță, eficiență și programabilitate extraordinare.” Ce aduce Vera: arhitectură proprie și integrare strânsă cu platformele NVIDIA Vera este bazat pe „Olympus”, un nucleu CPU personalizat NVIDIA, și include 88 de nuclee Olympus , „Spatial Multithreading” (o tehnică de execuție paralelă pentru a crește utilizarea resurselor) și memorie LPDDR5X cu până la 1,2 TB/s lățime de bandă. Pe partea de integrare în platformele companiei, Vera este prezentat ca: CPU pentru servere Vera „standalone” (configurații dedicate CPU), CPU gazdă pentru platformele NVIDIA Vera Rubin , prin interconectarea NVLink-C2C de generația a doua, cu până la 1,8 TB/s lățime de bandă coerentă între CPU și GPU, componentă pentru platforme de stocare AI, prin NVIDIA Vera BlueField-4 STX , care combină CPU-ul cu rețelistică, accelerare de stocare și securitate „în siliciu”. NVIDIA mai spune că Vera extinde „Confidential Computing” (mecanisme hardware/software care protejează datele în utilizare) la nivel de rack, pentru a proteja sarcini agentice. Cine îl adoptă și cine îl produce: ecosistem de cloud și OEM Compania indică drept potențiali utilizatori sau evaluatori ai Vera atât laboratoare AI, cât și operatori mari de cloud și infrastructură. Sunt menționate, între altele, Anthropic, OpenAI și SpaceXAI, precum și ByteDance, CoreWeave și Oracle Cloud Infrastructure (OCI). În zona enterprise, NVIDIA indică și NYSE ca utilizator care explorează platforma. Pe partea de producție și integrare hardware, NVIDIA spune că sisteme Vera vor fi construite la scară de producători precum Dell Technologies, HPE, Lenovo și Supermicro, alături de ASUS, Compal, Foxconn, GIGABYTE, Pegatron, Quanta Cloud Technology (QCT), Wistron și Wiwynn, între alții. Publicația notează că marii OEM ar urma să ofere Vera în configurații de server CPU „standalone”, ca „prima opțiune standard de CPU dincolo de x86”. Performanță: benchmark-uri invocate și un exemplu de utilizare NVIDIA citează Phoronix (publicație de benchmark-uri open-source) spunând că Vera a livrat „cea mai rapidă performanță generală” pe sarcini agentice precum compilare de cod, Python, Java și procesare de baze de date — exact tipuri de încărcări care apar pe traseul critic al execuției agenților (utilizare de instrumente și execuție în sandbox). Într-un exemplu operațional, NYSE Group leagă adopția de obiective de latență și capacitate. Lynn Martin, președinte NYSE Group, spune: „NYSE procesează peste 1,1 trilioane de mesaje pe zi și, în colaborare cu Redpanda și HPE, folosind CPU-urile NVIDIA Vera, ne vom extinde capacitatea, optimizând în continuare latența pentru a susține o infrastructură de piață performantă, rezilientă și pregătită pentru AI.” Disponibilitate: când ajunge pe piață NVIDIA afirmă că sistemele Vera vor fi disponibile de la integratori și parteneri cloud din această toamnă . Compania nu oferă în material detalii despre prețuri sau despre configurații comerciale concrete pentru fiecare segment, astfel că impactul financiar imediat rămâne de evaluat în funcție de ritmul de adoptare în cloud și în centrele de date enterprise. [...]