Inteligență artificială21 mai 2026
Dell și NVIDIA extind „AI Factory” pentru companii, pe fondul creșterii accelerate a cererii de calcul - Dell estimează cheltuieli globale de 3-4 trilioane de dolari în infrastructură AI până în 2030
Dell și NVIDIA mută AI-ul enterprise din „pilot” în producție, cu promisiuni de cost pe token de până la 10 ori mai mic , pe fondul unei cereri pe care Jensen Huang o descrie drept „parabolică”, potrivit NVIDIA . Mesajul central al prezentărilor de la Dell Technologies World este că organizațiile accelerează implementările de „agentic AI” (agenți software care execută sarcini în lanț, cu pași dependenți unii de alții) și inferență (rularea efectivă a modelelor), iar infrastructura se repoziționează pentru a susține volume mult mai mari de calcul. Michael Dell a estimat, pe scena evenimentului, că cheltuielile globale pentru infrastructura AI ar putea ajunge la 3–4 trilioane de dolari până în 2030 (aprox. 13,8–18,4 trilioane lei), în timp ce consumul de „tokeni” (unități de text procesate de modele) ar urma să crească cu 3.400% în același interval. În această logică, Dell AI Factory cu NVIDIA este prezentată ca platforma pentru rularea de modele avansate și agenți autonomi „în spatele perimetrului” companiei, adică în infrastructură proprie, nu exclusiv în cloud public. „Am ajuns în era AI-ului util, motivul pentru care cererea crește parabolic, absolut parabolic.” (Jensen Huang, CEO NVIDIA) Ce se schimbă operațional: cost pe token și densitate de GPU în rack NVIDIA indică o actualizare de portofoliu care țintește direct costul de operare al inferenței și capacitatea de scalare în centrele de date: Dell PowerEdge XE9812 , construit pe NVIDIA Vera Rubin NVL72 , ar livra un cost per token de până la 10 ori mai mic față de NVIDIA Blackwell pentru inferență la scară mare în scenarii „agentic AI”. Serverele PowerEdge XE9880L, XE9885L și XE9882L sunt prezentate ca primele sisteme Dell bazate pe NVIDIA HGX Rubin NVL8 , cu suport de până la 144 GPU-uri per rack , noduri de calcul răcite cu lichid și până la 10 ori performanța HGX B200 (conform sursei). Pe zona de rețea, Dell introduce un portofoliu PowerSwitch cu NVIDIA Quantum-X800 InfiniBand și NVIDIA Spectrum-6 Ethernet , orientat către conectivitate pentru clustere AI. Dell a prezentat și Dell PowerRack , un sistem integrat (calcul, rețea, stocare) proiectat ca ansamblu, cu accent pe design termic, managementul energiei și optimizări software, pentru a reduce „costul” integrării componentelor. De ce contează: revenirea AI „on-premises” și presiunea pe guvernanță Un element cheie pentru companii este mutarea încărcărilor AI în infrastructuri controlate direct. Dell citează un sondaj intern de adopție AI potrivit căruia 67% dintre încărcările AI rulează acum în afara cloudului (on-premises, pe dispozitiv, la marginea rețelei sau în centre de colocare), iar 88% dintre respondenți rulează cel puțin un workload AI on-premises. În acest context, NVIDIA poziționează Confidential Computing (tehnologii care protejează datele și modelele „în utilizare”, nu doar la stocare sau în tranzit) drept fundație pentru rularea modelelor avansate în interiorul companiilor, fără expunerea proprietății intelectuale a modelului sau a datelor sensibile. În listă sunt menționați parteneri precum Fortanix, Google și Red Hat. Exemple de utilizare: de la industrie la tranzacționare algoritmică Pe scenă au fost menționați clienți care rulează deja workload-uri AI pe Dell AI Factory cu NVIDIA, inclusiv Lilly, Samsung și Honeywell. În servicii financiare, NVIDIA notează că firma de tranzacționare algoritmică Hudson River Trading își extinde implementarea Dell pentru cercetare bazată pe AI, folosind servere Dell PowerEdge XE9685L și NVIDIA Spectrum-X Ethernet . Separat, NVIDIA menționează disponibilitatea în „preview” a Google Distributed Cloud (GDC) cu Gemini 3.0 pe servere Dell PowerEdge XE9780, accelerat de NVIDIA Blackwell și securizat prin Confidential Computing. Ce urmează Din informațiile prezentate, direcția este o standardizare a „fabricilor” AI în infrastructura enterprise , cu accent pe inferență și agenți, cost per token și securitate pentru rulări on-premises. Sursa nu oferă un calendar de livrare sau prețuri pentru configurațiile anunțate, astfel că impactul comercial imediat (comenzi, venituri, termene) nu poate fi cuantificat din datele disponibile. [...]