Știri
Știri din categoria Inteligență artificială

NVIDIA pune la dispoziția cercetătorilor „skill-uri” pentru agenți AI, ca să reducă timpul și fragmentarea din fluxurile de lucru pentru vehicule autonome, roboți și sisteme de viziune. Potrivit NVIDIA, la CVPR compania a prezentat un set de „physical AI agent skills” (capabilități reutilizabile pentru agenți software care automatizează pași de cercetare) menite să lege într-un flux unitar etape care, în mod obișnuit, sunt împărțite între instrumente diferite: reconstrucția scenelor, generarea de scenarii rare, antrenarea politicilor, evaluarea comportamentului și iterarea rapidă.
Mesajul central este operațional: problema majoră în „physical AI” (AI care interacționează cu lumea fizică prin percepție și acțiune) nu este doar obținerea unor modele mai puternice, ci construirea unui flux complet în jurul lor. NVIDIA susține că noile skill-uri, împreună cu biblioteci și cadre de simulare, urmăresc să reducă munca de „cusut” instrumente și să accelereze experimentarea.
În acest context, compania amintește și anunțul din această săptămână privind NVIDIA Cosmos 3, descris ca un „foundation model” pentru physical AI, care unifică raționamentul vizual, generarea de lumi și generarea de acțiuni. Skill-urile sunt poziționate ca un strat care ajută la trecerea de la capabilități de model la fluxuri de lucru scalabile, end-to-end.
Pentru cercetarea în vehicule autonome, NVIDIA indică drept problemă „coada lungă” a condusului: interacțiuni rare, geometrii neobișnuite ale drumului, schimbări de lumină și comportamente-limită greu de colectat repetat, dar critice pentru antrenare și validare.
Abordarea propusă include automatizarea reconstrucției scenelor din date de flotă și generarea de scenarii sintetice. Un exemplu este skill-ul „Neural Reconstruction”, care ar transforma date capturate de flotă în scene 3D editabile pentru simulare și generare de date sintetice, împreună cu tehnologii precum NVIDIA Omniverse NuRec și InstantNuRec.
NVIDIA mai menționează:
În zona de vision AI, NVIDIA spune că blocajul este lipsa unui volum suficient de exemple controlate pentru a testa cum se comportă modelele când se schimbă condițiile vizuale, starea obiectelor sau evenimentele în timp. Sunt menționate explicit direcții precum detecția de anomalii „zero-shot”, generarea de anomalii sintetice și recunoașterea defectelor cu puține exemple (few-shot).
Noile „Metropolis skills” ar permite agenților AI să genereze scenarii vizuale sintetice (inclusiv anomalii), să extindă seturile de date și să sprijine pseudo-etichetarea. Pentru inspecția vizuală, publicația dă ca exemplu skill-ul „Defect Image Generation”, care creează exemple de defecte pe suprafețe diferite pornind de la imagini reale, într-un flux ce combină Isaac Sim (simulare), Cosmos 3 și NVIDIA OSMO (orchestrare).
Pentru agenți video, sunt menționate Metropolis Blueprint pentru căutare și sumarizare video (VSS), NVIDIA TAO și skill-uri de augmentare video, cu scopul de a automatiza bucla „build-and-evaluate” pentru modele care detectează evenimente, raționează pe scene complexe, sumarizează activitatea și trimit alerte.
În robotică, NVIDIA pune accent pe iterație: cercetătorii au nevoie de multe medii controlate și rulări de politici (policy rollouts) pentru a înțelege cum se schimbă comportamentul robotului între sarcini și configurații, iar asta implică, de regulă, integrare manuală între simulare, variații de sarcini, antrenare și evaluare.
Compania afirmă că „robotics skills” permit agenților să automatizeze pași frecvenți precum pregătirea scenei, simularea și învățarea robotului folosind biblioteci Omniverse, Isaac Sim și Isaac Lab. Sunt menționate și skill-uri specializate pentru mobilitate și manipulare, inclusiv fluxuri pentru sarcini „sim-to-sim” și „sim-to-real” (transfer din simulare către lumea reală), precum construcția mediilor, reglaje de fizică, depanare și profilare.
Pentru robotică medicală, NVIDIA indică „Cosmos-H-Surgical-Simulator”, care ar genera date realiste pentru antrenare și evaluare, învățând direct din date chirurgicale reale, cu obiectivul de a reduce diferența dintre simulare și realitate.
NVIDIA precizează că instrumentele și skill-urile pentru agenți physical AI sunt disponibile public prin GitHub, la NVIDIA physical AI skills. Totodată, skill-uri pentru generare de date sintetice (Neural Reconstruction, Video Augmentation, Defect Image Generation) pot fi rulate și ca „Physical AI Launchables” pe NVIDIA Brev, în medii preconfigurate care rulează pe GPU-uri NVIDIA H100 și includ credite de test pentru cercetători.
Separat, compania afirmă că setul său de date „NVIDIA Physical AI Dataset” a depășit 15 milioane de descărcări pe Hugging Face și anunță noi lansări de seturi de date, inclusiv GRAIL (aprox. 50 de ore de interacțiuni humanoid–obiect) și șase seturi video sintetice folosite la antrenarea Cosmos 3.
Recomandate

NVIDIA mizează pe „antrenarea la scară” pentru a reduce costurile și timpul de dezvoltare în robotică, conducere autonomă și agenți virtuali, prin modele care generalizează mai bine și rulează mai eficient pe hardware-ul din teren, potrivit NVIDIA , într-o prezentare a trei lucrări de cercetare la conferința CVPR 2026 . Ideea comună a celor trei lucrări este că volume foarte mari de date (în special din simulare) și arhitecturi optimizate pot elimina cicluri repetate de antrenare și pot face sistemele mai aplicabile „din cutie” în contexte variate — un punct cu impact operațional direct pentru companiile care dezvoltă roboți sau sisteme autonome. GraspGen-X: prindere „zero-shot” pentru grippere diferite, fără reantrenare pe fiecare configurație NVIDIA prezintă GraspGen-X , descris ca primul „model fundamental” (foundation model) pentru prindere robotică „zero-shot” — adică poate propune poziții de prindere pentru obiecte și grippere pe care nu le-a mai văzut, fără a fi reantrenat pentru fiecare tip de clește. În mod uzual, arată compania, sistemele de prindere sunt specializate: o politică de control (policy) antrenată pentru un gripper cu două degete nu se transferă automat la un gripper multi-degete, ceea ce obligă la colectare de date, ajustări (fine-tuning) și validare pentru fiecare „întrupare” (embodiment) nouă. GraspGen-X încearcă să elimine acest blocaj prin antrenare pe un set masiv de date: cercetătorii au generat 2 miliarde de prinderi simulate , acoperind mii de forme de obiecte și configurații sintetice de grippere. Modelul poate fi folosit împreună cu curoboV2 , o bibliotecă de planificare a mișcării accelerată cu CUDA, pentru a executa prinderile în medii necunoscute. NVIDIA indică și o continuare a lanțului tehnologic, prin lucrarea „Grasp-MPC”, prezentată la ICRA 2026 (link în sursă). LCDrive: raționament mai rapid pentru mașini autonome, cu mai puține „tokenuri” A doua lucrare, LCDrive, vizează o limitare practică a raționamentului de tip „chain-of-thought” (pași intermediari de gândire): în varianta bazată pe text, fiecare cuvânt generat înseamnă „tokenuri” care consumă timp de calcul, iar în mașină tokenurile devin o constrângere de latență. Soluția propusă este înlocuirea raționamentului în limbaj natural cu reprezentări latente compacte (un spațiu intern de stări care comprimă informația), astfel încât sistemul să „gândească” în stări care surprind informație spațială, nu în propoziții. Arhitectura alternează între propunerea de acțiuni candidate și predicția felului în care va arăta lumea dacă acele acțiuni sunt executate, într-o buclă de rafinare. NVIDIA susține că rezultatul este o calitate comparabilă a traiectoriei față de raționamentul bazat pe text, folosind aproximativ jumătate din tokenuri . Modelul este construit pe NVIDIA Alpamayo și antrenat cu supervizare derivată din date existente de vehicule. NitroGen: antrenarea agenților „întrupați” în jocuri, la volum mare de interacțiuni A treia lucrare, NitroGen, extinde principiul din NVIDIA Isaac GR00T (model fundamental deschis pentru roboți umanoizi) către medii virtuale, folosind jocurile video ca teren de antrenament: lumi structurate, variate, cu obiective și condiții de succes bine definite. NVIDIA afirmă că NitroGen a fost antrenat pe peste 1.000 de jocuri și 40.000 de ore de interacțiune , iar agenții rezultați au fost evaluați pe mai multe genuri (de la action RPG la platformere și jocuri open-world), demonstrând comportamente precum luptă, navigație și explorare. În condiții cu puține date (când agentul vede doar câteva exemple dintr-un mediu nou), pornirea de la NitroGen ar îmbunătăți performanța cu până la 52% față de metodele anterioare de vârf, potrivit companiei. Modelul este disponibil ca open-source pe GitHub și pe Hugging Face . De ce contează pentru industrie: mai puține cicluri de antrenare, latență mai mică, generalizare mai bună Mesajul operațional al pachetului de cercetări este reducerea „fricțiunii” de implementare: de la eliminarea reantrenării pentru fiecare gripper (GraspGen-X), la raționament mai rapid pe hardware-ul din vehicul (LCDrive), până la pre-antrenarea agenților în medii virtuale diverse înainte de contactul cu lumea reală (NitroGen). NVIDIA mai indică faptul că a prezentat la CVPR și „noi abilități” pentru agenți de „AI fizic” (physical AI) menite să accelereze dezvoltarea de vehicule autonome, roboți și sisteme de viziune, cu detalii suplimentare într-un material separat (link în sursă). [...]

NVIDIA împinge AI-ul dincolo de automatizări punctuale, cu un „creier” care coordonează fabrica în timp real : potrivit NVIDIA , noul NVIDIA Factory Operations Blueprint (FOX) este un design de referință pentru construirea unui „agent” de tip manager autonom, care conectează semnale live din utilaje, sisteme de calitate, instrucțiuni de lucru și alerte operaționale într-un singur strat de decizie, capabil să orchestreze alți agenți specializați și echipamente. FOX este gândit ca o fundație personalizabilă pentru dezvoltatori, astfel încât fabricile să poată rula operațiuni „inteligente” la scară: controlul calității, transportul materialelor și siguranța lucrătorilor. Blueprint-ul este construit pe NVIDIA NemoClaw , AI-Q Blueprint și modelele deschise NVIDIA Nemotron . De ce contează: promisiunea este reducerea costurilor și a timpilor morți, nu doar „mai multă automatizare” Mesajul central al inițiativei este trecerea de la automatizări izolate la „inteligență” la nivel de fabrică, adică un sistem care nu doar detectează probleme, ci le și corelează între surse diferite și propune pași de remediere. În practică, NVIDIA poziționează FOX ca un mecanism de coordonare: un agent principal (manager) care „dirijează” o flotă de agenți industriali specializați și interacționează cu operatorii prin limbaj natural, cu controale de confidențialitate și siguranță prin NVIDIA OpenShell . Blueprint-ul include, între altele, integrarea cu surse industriale de date și roboți prin interfețe standard (API-uri), automatizarea ciclului de antrenare a modelelor (inclusiv generare sintetică de date și redeploy în producție) și operarea fluxurilor de lucru, inclusiv cu NVIDIA Metropolis Blueprint pentru căutare și sumarizare video (VSS) . Pentru vizualizare, datele pot fi reprezentate într-un „geamăn operațional” (o replică digitală a operațiunilor) construit cu NVIDIA Omniverse . Unde se rulează: FOX este optimizat pentru DGX Station și modele mari, local NVIDIA spune că FOX este optimizat să ruleze pe NVIDIA DGX Station , descris ca un „supercomputer” de birou pentru managerii de fabrică. Compania menționează că sistemul este bazat pe GB300 Grace Blackwell Ultra Desktop Superchip, cu 20 petaflopi performanță FP4 și 748 GB memorie coerentă, și că poate rula modele AI de până la 1 trilion de parametri local (adică în infrastructura companiei, nu neapărat în cloud). Primele implementări: câștiguri estimate în productivitate, mentenanță și energie NVIDIA indică drept primii utilizatori producători din Taiwan: Advantech, Foxconn , Pegatron și Wistron. Câteva rezultate proiectate/estimate prezentate în material: Foxconn folosește FOX și NemoClaw pentru „MoMClaw”, un sistem multi-agent pentru operațiuni de producție. Compania proiectează: îmbunătățire cu 80% a timpului de analiză a cauzei rădăcină (root cause analysis), creștere cu 15% a productivității muncii, scădere cu 10% a ratelor de defectare a utilajelor. Pegatron estimează o reducere cu 15% a costurilor de redundanță a activelor (prin utilizare mai eficientă a roboților și eliminarea nevoii de echipamente „de rezervă”). Advantech spune că a implementat în propriile fabrici un „AI Factory Brain” și proiectează o scădere cu 10% a consumului de energie (prin management autonom al HVAC și iluminatului). Wistron adoptă FOX și folosește NVIDIA Cosmos , Nemotron și Metropolis VSS pentru agenți care analizează și orchestrează operațiuni pe linia de producție, inclusiv analiză în timp real a cauzelor și controlul calității. Separat, NVIDIA menționează și dezvoltatori de agenți specializați (DeepHow, Overview AI, Roboflow, Spingence) care construiesc soluții pe baza ecosistemului NVIDIA și a blueprint-ului VSS, cu exemple de rezultate precum creșterea randamentului „din prima” (first-pass yield), accelerarea dezvoltării modelelor de inspecție vizuală și îmbunătățirea detectării defectelor. Ce urmează NVIDIA precizează că utilizatorii se pot înscrie pentru notificare atunci când NVIDIA Factory Operations Blueprint va fi disponibil. În paralel, compania afirmă că Metropolis VSS blueprint 3 este disponibil „general” și include abilități (skills) care permit agenților externi să acceseze componentele VSS pentru a construi și opera rapid agenți de analiză video. [...]

Un start-up chinez a depășit Nvidia într-un clasament-cheie pentru „AI fizic”, semnalând o mutare a competiției SUA–China spre robotică , potrivit South China Morning Post . Spirit AI, din Hangzhou, a urcat pe primul loc în clasamentul global RoboArena cu modelul său Spirit v1.6, la doar două zile după ce Nvidia lansase Cosmos 3, un model gândit să ajute roboții să „gândească înainte să acționeze”. Spirit v1.6 a obținut 1.924 de puncte, peste Cosmos3-Nano-Policy al Nvidia (1.881). Pe locul trei s-a clasat DreamZero (1.763), un alt proiect Nvidia prezentat în februarie. RoboArena este un benchmark (test standardizat) care evaluează cât de bine se traduc „politicile” unui robot generalist în acțiuni în lumea reală și a fost co-dezvoltat de Nvidia împreună cu instituții precum Stanford University și University of California, Berkeley. De ce contează: robotica devine „următorul front” al AI Competiția din jurul RoboArena indică o schimbare de etapă: AI iese din zona strict digitală (text, cod) și intră în zona sistemelor care interacționează cu mediul fizic – umanoizi, brațe robotice, vehicule autonome. În acest context, „AI fizic” (modele pentru percepție, planificare și acțiune) devine o miză strategică, iar clasamentele de tip benchmark încep să funcționeze ca indicatori de putere tehnologică. Nvidia își consolidează poziționarea în această direcție și prin parteneriate, inclusiv cu compania chineză Unitree Robotics și cu Sharpa din Singapore, menționate în material. Ce este „AI fizic” și ce măsoară clasamentele Spre deosebire de modelele lingvistice mari (LLM), care procesează și generează text și cod, un model de „AI fizic” este construit pentru ca mașinile să perceapă, să înțeleagă și să acționeze în lumea reală. Materialul descrie două capabilități centrale: capabilități de tip „policy” : abilitatea modelului de a decide acțiuni pe baza observațiilor (acesta este indicatorul principal în RoboArena); capabilități de tip „world” : abilitatea de a simula și prezice ce se întâmplă după o acțiune. Industria se îndreaptă spre integrarea acestor funcții într-o arhitectură unificată; publicația notează că, în septembrie anul trecut, cercetători chinezi au prezentat un „Policy World Model” care combină modelarea lumii și planificarea traiectoriei. China urcă și pe alte piste: WorldArena, percepție și „data engine” Dominanța Chinei nu se limitează la RoboArena. În benchmark-ul WorldArena (pentru „world models”), primul loc este ocupat de WorldScape-0.2, dezvoltat de start-up-ul chinez Manifold AI, care a depășit Cosmos-Predict 2.5 (action) al Nvidia pe pista de evaluare a politicilor, conform articolului. Publicația mai enumeră lideri chinezi pe alte segmente: percepție : AgiBot, cu modelul GenieEnvisioner-Sim2.0-2B, un simulator video pentru manipulare robotică; „data engine” (optimizarea fluxului de date de antrenare): DexForce, cu DSCFuncWorld; WorldScore (generare de „lumi” din prompturi text): WorldScape-0.2, peste WonderJourney, un proiect comun Stanford–Google. Banii și blocajul: finanțare accelerată, dar „datele” rămân problema Miza economică crește rapid, alimentată de capital de risc. Spirit AI a anunțat o rundă de finanțare de 1,5 miliarde yuani (222 milioane dolari, aprox. 1,0 miliarde lei) , a patra în doar trei luni, descrisă drept cel mai agresiv ritm de strângere de fonduri din sector. Alte exemple din articol: XYZ Embodied AI (incubat de Beijing Academy of Artificial Intelligence) a închis o rundă pre-A și spune că a strâns 1 miliard yuani (aprox. 610 milioane lei) în 10 luni; Manifold AI a încheiat cinci runde în 10 luni, iar runda din aprilie a atras „sute de milioane de yuani”, potrivit companiei. În pofida finanțărilor, „datele” sunt prezentate drept blocajul major pentru sistemele robotice. Jensen Huang , CEO Nvidia, este citat spunând: „Pentru sistemele robotice și AI fizic, datele sunt cea mai grea problemă.” Articolul susține că China ar putea avea un avantaj structural: Alexandr Wang (Scale AI, ulterior Meta Platforms) a afirmat anul trecut că China este „fundamental foarte bine poziționată pe date” și că multe companii americane se bazează pe date din China pentru antrenarea acestor modele. În plus, în hub-uri precum Beijing și Shenzhen, autoritățile au creat „fabrici de date” susținute de stat pentru colectarea datelor de robotică. În ansamblu, tabloul descris de publicație sugerează că următoarea etapă a competiției tehnologice se mută din zona cipurilor și a modelelor de limbaj spre infrastructura de date și modelele care controlează roboți în lumea reală. [...]

Taiwan își consolidează rolul de „fabrică” pentru infrastructura globală de AI , pe măsură ce peste 1 milion de componente de rack NVIDIA MGX pentru platforma Vera Rubin sunt produse și integrate local, în 25 de situri industriale, potrivit NVIDIA . Miza economică și operațională este dublă: creșterea capacității de livrare pentru centre de date și „fabrici” de AI la nivel mondial, dar și transferul accelerat al tehnologiilor de calcul accelerat și automatizare în propriile procese de producție ale marilor companii taiwaneze. Ecosistemul descris de companie include peste 500 de parteneri din Taiwan și acoperă întreg lanțul de aprovizionare, de la producători de wafer și cipuri (TSMC, SPIL, Kinsus, KYEC, UMTC) până la integratori și producători de sisteme precum Foxconn, Pegatron, Quanta Cloud Technology (QCT), Wistron și Inventec. În contextul în care Vera Rubin „intră în producție la scară” pentru a alimenta „fabrici de AI agentică” (sisteme în care agenți software pot executa sarcini în mod autonom), NVIDIA indică Taiwanul ca punct de concentrare pentru volum și integrare. AI în fabrici: câștiguri de productivitate și costuri mai mici Dincolo de producția efectivă de infrastructură, companiile taiwaneze folosesc tehnologiile NVIDIA pentru a-și optimiza operațiunile, cu rezultate cuantificate în mai multe cazuri: TSMC aplică biblioteci și modele din NVIDIA CUDA-X în litografie computațională, simulări de proces și control avansat al proceselor. NVIDIA menționează că cuLitho poate îmbunătăți eficiența costurilor sau timpul de ciclu cu 20–50% față de litografia computațională pe CPU, la același cost total de deținere, iar biblioteca cuEST accelerează în medie simularea materialelor semiconductoare de 50 de ori . Foxconn folosește un „agent” pentru managementul operațiunilor de producție (MoMClaw), construit pe blueprint-uri NVIDIA și cu interfață în limbaj natural, cu controale de confidențialitate prin NVIDIA OpenShell . Compania estimează 80% reducere a timpului de analiză a cauzei rădăcină , +15% productivitate a muncii și -10% rate de defectare a echipamentelor . Tot Foxconn utilizează un sistem de viziune pentru verificarea procedurilor (SOP), bazat pe NVIDIA Cosmos și NVIDIA Metropolis Blueprint pentru căutare și sumarizare video (VSS) , raportând o creștere a „first pass yield” (procentul de produse care trec testele din prima) cu 3% . În paralel, compania aplică instrumente NVIDIA pentru roboți umanoizi pe roți în fabrici (inclusiv pentru sarcini de asamblare de precizie). Digital twins și simulare: proiectare mai rapidă, consum energetic redus O altă direcție majoră este folosirea „gemenilor digitali” (replici virtuale ale fabricilor și fluxurilor) și a simulărilor pentru a scurta timpii de proiectare și a reduce consumul: QCT folosește gemeni digitali bazați pe NVIDIA Omniverse pentru planificarea fabricilor, astfel încât echipele de inginerie, operațiuni și logistică să lucreze pe aceleași date de proiectare. QCT lucrează și cu subsidiara Techman Robot la un kit de dezvoltare pentru „AI fizic” (AI aplicată în roboți și sisteme din lumea reală), folosind sisteme QuantaGrid pentru generare de date și antrenare de modele. Wistron utilizează NVIDIA Omniverse DSX Blueprint , PhysicsNeMo și Cadence Reality DC Design pentru simularea mediilor de „burn-in” (testare de stres) și optimizarea producției de servere AI. Rulând pe infrastructura proprie cu GPU-uri NVIDIA RTX PRO 6000 Blackwell Server Edition , fluxurile de lucru ar accelera analiza de layout cu până la 70% și ar reduce cererea de energie a facilităților cu 20% prin optimizarea dinamică a rack-urilor. Pegatron adoptă același blueprint DSX pentru a conecta datele de proiectare, simulările termice, gemenii digitali și calificarea fizică, cu scopul de a accelera proiectarea și implementarea fabricilor de AI. Compania folosește și generarea de defecte sintetice pentru inspecție vizuală, reducând timpul de implementare cu 67% și efortul operațional cu 10% . Inventec raportează, în validare internă pentru inspecția cosmetică a notebook-urilor, peste 10.000 de imagini sintetice de defecte și un potențial de reducere a colectării de date reale și etichetării manuale cu circa 30% , scurtarea timpului de implementare cu circa 25% și îmbunătățirea detecției anomaliilor cu circa 10% . De ce contează pentru piață Tabloul descris de NVIDIA sugerează că Taiwanul nu este doar un furnizor de componente, ci un „hub” în care producția de infrastructură AI și modernizarea fabricilor se alimentează reciproc: aceiași jucători care asamblează servere și rack-uri pentru centre de date își cresc eficiența internă cu instrumente de simulare, agenți AI și automatizare. În același timp, NVIDIA indică o extindere a capacității locale pentru generația Vera Rubin, ceea ce poate influența ritmul de livrare al infrastructurii pentru centre de date la nivel global, pe măsură ce producția intră la scară. Pentru detalii suplimentare, compania trimite la keynote-ul GTC Taipei și la sesiunile dedicate „AI fizic”, disponibile prin linkurile din material. [...]

NVIDIA își extinde ecosistemul de „AI Cloud” pentru a crește rapid capacitatea de calcul necesară aplicațiilor cu agenți AI , pe fondul unei cereri în creștere pentru „tokeni” (unități de procesare a textului/ieșirilor modelelor) și pentru infrastructură regională, inclusiv în contexte suverane și reglementate, potrivit NVIDIA . Unghiul principal al mișcării este operațional: furnizorii de cloud și partenerii NVIDIA accelerează construcția de „AI factories” (centre de date optimizate pentru antrenare și inferență AI) mai aproape de date, dezvoltatori și utilizatori, pentru a reduce fricțiunea de acces la infrastructură și pentru a susține aplicații „agentice” (sisteme AI care execută sarcini în lanț, cu autonomie mai mare). De ce contează: capacitate regională și opțiuni „suverane” pentru industrii reglementate Publicația descrie NVIDIA AI Clouds ca un ecosistem de cloud-uri „proiectate special” și co-dezvoltate cu infrastructura completă NVIDIA (calcul accelerat, rețelistică și software AI), care acoperă antrenare, ajustare fină (fine-tuning), inferență, aplicații agentice, „physical AI” (AI pentru robotică și sisteme fizice) și implementări de tip „sovereign AI” (control local asupra datelor și infrastructurii). În acest context, extinderea are o componentă de conformitate și control: pentru guverne și industrii reglementate, cloud-urile regionale pot susține cerințe de conformitate locală și „controale suverane”, iar pentru companii și dezvoltatori pot facilita rularea serviciilor AI „aproape de utilizatori și date” (de exemplu, copiloți enterprise, „digital workers” și alți agenți AI). Extindere geografică: șase continente, cu noi intrări în Africa și America de Sud NVIDIA afirmă că ecosistemul ajunge acum pe șase continente, după adăugarea Cassava în Africa și Claro în America de Sud. Creșterea regională este indicată ca accelerând în Asia de Sud-Est, Australia și Americi. În paralel, sunt menționați parteneri care își extind infrastructura pentru dezvoltarea de modele de vârf, aplicații agentice și inferență la volum mare, între care CoreWeave , Firmus, IREN, Nebius și Nscale. Ce se construiește concret: „AI factories” și platforme pentru inferență și „physical AI” Textul oferă câteva exemple de implementare: Firmus Technologies își extinde „amprenta” de AI factory în Australia de Sud și Asia de Sud-Est, inclusiv prin Project Southgate (Tasmania, Melbourne, Australia de Sud și New South Wales), cu accent pe energie regenerabilă, răcire avansată și infrastructură modulară pentru a aduce capacitate online mai repede. Compania folosește arhitectura de referință NVIDIA și platforma NVIDIA DSX pentru proiectare, implementare și operare. CoreWeave își extinde platforma NVIDIA AI Cloud pentru „agentic AI”, „physical AI” și sarcini de tip „frontier model”. Este menționată adoptarea timpurie a NVIDIA Vera Rubin și NVIDIA Vera CPU , precum și a NVIDIA Spectrum-X Ethernet Photonics pentru rețelistică destinată unor AI factories la scară foarte mare. Pentru robotică și „physical AI”, CoreWeave folosește NVIDIA Cosmos 3 (detalii: NVIDIA Cosmos 3 ) pentru generare de date sintetice și ajustarea modelelor. Nebius își extinde NVIDIA AI Cloud cu o platformă „full-stack” (de la hardware la software), incluzând un strat de inferență numit Token Factory și un Physical AI Workbench , care integrează tehnologii precum NVIDIA Cosmos 3, NVIDIA Isaac Sim și Isaac GR00T în fluxuri de lucru „compozabile”. Separat, NVIDIA notează că șase parteneri au obținut statutul de Exemplar Cloud : CoreWeave, Crusoe, Lambda, Nebius, Vultr și YTL. Miza eficienței: „cost per token” și DSX pentru punerea mai rapidă în funcțiune NVIDIA pune accent pe economie și eficiență operațională, argumentând că, pe măsură ce AI se mută de la dezvoltarea modelelor la „reasoning” și inferență la volum mare, criteriul nu mai este doar capacitatea instalată, ci și „economia” producției de tokeni. Compania descrie „cost per token” ca indicator de cost total de deținere (TCO), care include performanța hardware, optimizările software, suportul de ecosistem și utilizarea în condiții reale, și susține că livrează „cel mai mic cost per token” din industrie (fără a oferi cifre în materialul citat). Pentru accelerarea implementărilor, NVIDIA arată că partenerii adoptă platforma NVIDIA DSX (detalii: NVIDIA DSX platform ), care include componente pentru simulare înainte de implementare, adaptarea sarcinilor la condițiile rețelei electrice și automatizarea operațiunilor. Potrivit descrierii din text, una dintre componentele DSX (DSX MaxLPS) ar permite, în condiții de limitare de putere, „până la 40% mai multe GPU-uri” în același buget energetic, prin maximizarea calculului în limitele de consum. Ce urmează Din informațiile prezentate, direcția imediată este creșterea capacității regionale și standardizarea operării „AI factories” prin platforme precum DSX, în paralel cu extinderea cazurilor de utilizare către aplicații agentice și „physical AI”. Materialul nu include un calendar de livrare sau ținte cantitative agregate pentru capacități, astfel că ritmul exact al extinderii rămâne neprecizat. [...]

Instituțiile financiare își mută arhitectura de AI către „modele fundamentale” antrenate pe tranzacții , pentru a reduce fragmentarea generată de zeci de modele specializate și pentru a obține o înțelegere unificată a comportamentului clienților, potrivit NVIDIA . Miza operațională este simplă: pe măsură ce AI se extinde în tot mai multe procese, costul și complexitatea întreținerii unor sisteme „în silozuri” devin factorul limitativ. În analiza companiei, instituțiile au construit în timp modele separate pentru fraudă, credit, recomandări și risc, eficiente punctual, dar greu de conectat între ele. Pe fondul creșterii volumelor de date, apare un decalaj între „cât știu” organizațiile din datele lor și „cât poate raționa” AI-ul peste aceste date, tocmai din cauza arhitecturilor fragmentate. De ce contează: un singur model, mai multe utilizări NVIDIA descrie „modelele fundamentale de tranzacții” ca sisteme de AI de mare amploare, antrenate pe miliarde de evenimente financiare (plăți, transferuri, interacțiuni cu produse și semnale comportamentale), care transformă datele brute în „inteligență” reutilizabilă în mai multe sarcini. Diferența față de un model clasic (de exemplu, unul de fraudă) este interpretarea în context: momentul, dispozitivul, locația și istoricul anterior schimbă semnificația unei tranzacții. Publicația leagă această schimbare de maturizarea arhitecturilor de tip „transformer” (familie de modele folosită pe scară largă în AI generativ), aplicate aici pe date tabelare (tranzacții), pentru a extrage semnale care ar rămâne invizibile în algoritmi tradiționali. Semnal din piață: investițiile în AI cresc, dar crește și complexitatea Conform raportului 2026 State of AI in Financial Services , citat de companie, 65% dintre instituții folosesc deja AI, aproape 90% o implementează sau o evaluează, iar „aproape toate” își mențin sau își cresc bugetele. În acest context, NVIDIA susține că nu lipsa de cazuri de utilizare este problema, ci traiectoria: fiecare caz nou adaugă încă un model, fiecare piață nouă cere reantrenare, iar lipsa contextului comun „lasă valoare pe masă”. Exemple de implementare: Revolut, Mastercard, Adyen, Stripe NVIDIA oferă câteva repere despre cum arată această tranziție în practică: Revolut a construit, împreună cu NVIDIA, PRAGMA , o familie de modele de tip transformer antrenate pe 24 de miliarde de evenimente din 26 de milioane de înregistrări de utilizatori, în peste 100 de țări, conform lucrării PRAGMA . Compania susține că un singur model a depășit modele specializate pe domenii precum scorare de credit, detecție de fraudă și recomandări de produse și a redus dependența de „caracteristici” construite manual (feature engineering). „Trecem de la săptămâni, sau chiar în unele cazuri luni, de inginerie de caracteristici la un timp zero necesar pentru asta”, a declarat Tadas Kriščiūnas, head of group credit data science la Revolut. Mastercard dezvoltă un model fundamental tabelar proprietar pentru plăți, antrenat pe miliarde de tranzacții anonimizate și proiectat să scaleze la sute de miliarde, extinzând seturile de date (fraudă, autorizare, chargeback, locația comerciantului, loialitate). NVIDIA notează că modelul este construit cu capabilități de la NVIDIA, AWS și Databricks, inclusiv NVIDIA NeMo AutoModel din cadrul NVIDIA NeMo , și că testele timpurii arată performanțe peste tehnici standard de machine learning. Adyen ar fi implementat astfel de modele „la scară”, procesând 1 trilion de dolari (aprox. 4,6 trilioane lei) în plăți. Compania folosește învățare prin recompensă (reinforcement learning) pentru a maximiza conversia și a minimiza riscul, iar NVIDIA citează impactul potențial al unor îmbunătățiri marginale: „Chiar și îmbunătățiri fracționare, precum un plus de 0,1% la autorizare, se pot traduce în creșteri masive ale valorii brute a mărfurilor și reduceri substanțiale de costuri”, a declarat Dhruv Ghulati, principal AI product manager la Adyen. Stripe folosește platforma NVIDIA și AWS pentru modele care „înțeleg contextul complet” al comportamentului tranzacțional; compania ar fi blocat anul trecut aproape 112 miliarde de dolari (aprox. 515 miliarde lei) în fraudă și ar fi obținut o reducere medie de 38% a ratelor de fraudă, potrivit materialului. Ce urmează: „modelul de referință” NVIDIA și ecosistemul de implementare Pentru a accelera adopția, NVIDIA indică un exemplu de dezvoltare numit Build Your Own Transaction Foundation Model , care ar permite echipelor să înceapă construirea de „embedding-uri” (reprezentări numerice învățate de model) pe date tranzacționale tabelare și să integreze rezultatul în fluxuri existente, fără reconstrucție completă. Rularea este prezentată ca posibilă pe AWS (cu SageMaker HyperPod) și pe Nebius AI Cloud, iar NVIDIA enumeră și parteneri de servicii (EXL, Thoughtworks, GFT IT Consulting) care ar integra sau operaționaliza astfel de modele în medii bancare, inclusiv pentru guvernanță și modele de operare AI. [...]