Știri
Știri din categoria Inteligență artificială

Nvidia își securizează lanțul de aprovizionare pentru HBM4, după ce a certificat trei dintre cei mai mari producători de cipuri de memorie, un pas care poate influența direct ritmul de livrare și costurile noii generații de acceleratoare pentru inteligență artificială, potrivit IT Home.
Jensen Huang, directorul general al Nvidia, a confirmat pentru prima dată că Samsung Electronics, SK Hynix și Micron Technology au trecut procesul de certificare și sunt eligibile să furnizeze HBM4 (High Bandwidth Memory – memorie cu lățime mare de bandă), componentă descrisă ca „indispensabilă” pentru platforma de generație următoare Vera Rubin, folosită în sarcini de inteligență artificială. Informația este atribuită de publicație unui material Bloomberg.
HBM este una dintre piesele critice în construcția acceleratoarelor AI, iar accesul la volume mari, cu specificații conforme, poate limita sau accelera livrările de sisteme. Prin certificarea simultană a trei furnizori, Nvidia își reduce dependența de un singur producător și își crește șansele de a acoperi cererea pentru noua platformă.
Huang a spus că toți cei trei furnizori „au trecut cu succes certificarea, au intrat pe linie în producția de masă” și lucrează la capacitate ridicată pentru a susține necesarul de livrări al platformei Vera Rubin.
Cele trei companii „domină împreună” piața globală a semiconductorilor de memorie pentru stocare și concurează pentru a câștiga cotă într-un segment descris ca foarte profitabil, pe fondul cererii explozive din zona infrastructurii AI.
Separat, publicația amintește că Nvidia a indicat anterior, la Computex 2026 din Taipei, că Vera Rubin a intrat în etapa de producție de masă, iar produsele complete ar urma să fie livrate în această toamnă. Platforma este prezentată ca un sistem AI construit dintr-un Vera CPU și un cluster de GPU-uri Rubin.
Recomandate

Taiwan își consolidează rolul de „fabrică” pentru infrastructura globală de AI , pe măsură ce peste 1 milion de componente de rack NVIDIA MGX pentru platforma Vera Rubin sunt produse și integrate local, în 25 de situri industriale, potrivit NVIDIA . Miza economică și operațională este dublă: creșterea capacității de livrare pentru centre de date și „fabrici” de AI la nivel mondial, dar și transferul accelerat al tehnologiilor de calcul accelerat și automatizare în propriile procese de producție ale marilor companii taiwaneze. Ecosistemul descris de companie include peste 500 de parteneri din Taiwan și acoperă întreg lanțul de aprovizionare, de la producători de wafer și cipuri (TSMC, SPIL, Kinsus, KYEC, UMTC) până la integratori și producători de sisteme precum Foxconn, Pegatron, Quanta Cloud Technology (QCT), Wistron și Inventec. În contextul în care Vera Rubin „intră în producție la scară” pentru a alimenta „fabrici de AI agentică” (sisteme în care agenți software pot executa sarcini în mod autonom), NVIDIA indică Taiwanul ca punct de concentrare pentru volum și integrare. AI în fabrici: câștiguri de productivitate și costuri mai mici Dincolo de producția efectivă de infrastructură, companiile taiwaneze folosesc tehnologiile NVIDIA pentru a-și optimiza operațiunile, cu rezultate cuantificate în mai multe cazuri: TSMC aplică biblioteci și modele din NVIDIA CUDA-X în litografie computațională, simulări de proces și control avansat al proceselor. NVIDIA menționează că cuLitho poate îmbunătăți eficiența costurilor sau timpul de ciclu cu 20–50% față de litografia computațională pe CPU, la același cost total de deținere, iar biblioteca cuEST accelerează în medie simularea materialelor semiconductoare de 50 de ori . Foxconn folosește un „agent” pentru managementul operațiunilor de producție (MoMClaw), construit pe blueprint-uri NVIDIA și cu interfață în limbaj natural, cu controale de confidențialitate prin NVIDIA OpenShell . Compania estimează 80% reducere a timpului de analiză a cauzei rădăcină , +15% productivitate a muncii și -10% rate de defectare a echipamentelor . Tot Foxconn utilizează un sistem de viziune pentru verificarea procedurilor (SOP), bazat pe NVIDIA Cosmos și NVIDIA Metropolis Blueprint pentru căutare și sumarizare video (VSS) , raportând o creștere a „first pass yield” (procentul de produse care trec testele din prima) cu 3% . În paralel, compania aplică instrumente NVIDIA pentru roboți umanoizi pe roți în fabrici (inclusiv pentru sarcini de asamblare de precizie). Digital twins și simulare: proiectare mai rapidă, consum energetic redus O altă direcție majoră este folosirea „gemenilor digitali” (replici virtuale ale fabricilor și fluxurilor) și a simulărilor pentru a scurta timpii de proiectare și a reduce consumul: QCT folosește gemeni digitali bazați pe NVIDIA Omniverse pentru planificarea fabricilor, astfel încât echipele de inginerie, operațiuni și logistică să lucreze pe aceleași date de proiectare. QCT lucrează și cu subsidiara Techman Robot la un kit de dezvoltare pentru „AI fizic” (AI aplicată în roboți și sisteme din lumea reală), folosind sisteme QuantaGrid pentru generare de date și antrenare de modele. Wistron utilizează NVIDIA Omniverse DSX Blueprint , PhysicsNeMo și Cadence Reality DC Design pentru simularea mediilor de „burn-in” (testare de stres) și optimizarea producției de servere AI. Rulând pe infrastructura proprie cu GPU-uri NVIDIA RTX PRO 6000 Blackwell Server Edition , fluxurile de lucru ar accelera analiza de layout cu până la 70% și ar reduce cererea de energie a facilităților cu 20% prin optimizarea dinamică a rack-urilor. Pegatron adoptă același blueprint DSX pentru a conecta datele de proiectare, simulările termice, gemenii digitali și calificarea fizică, cu scopul de a accelera proiectarea și implementarea fabricilor de AI. Compania folosește și generarea de defecte sintetice pentru inspecție vizuală, reducând timpul de implementare cu 67% și efortul operațional cu 10% . Inventec raportează, în validare internă pentru inspecția cosmetică a notebook-urilor, peste 10.000 de imagini sintetice de defecte și un potențial de reducere a colectării de date reale și etichetării manuale cu circa 30% , scurtarea timpului de implementare cu circa 25% și îmbunătățirea detecției anomaliilor cu circa 10% . De ce contează pentru piață Tabloul descris de NVIDIA sugerează că Taiwanul nu este doar un furnizor de componente, ci un „hub” în care producția de infrastructură AI și modernizarea fabricilor se alimentează reciproc: aceiași jucători care asamblează servere și rack-uri pentru centre de date își cresc eficiența internă cu instrumente de simulare, agenți AI și automatizare. În același timp, NVIDIA indică o extindere a capacității locale pentru generația Vera Rubin, ceea ce poate influența ritmul de livrare al infrastructurii pentru centre de date la nivel global, pe măsură ce producția intră la scară. Pentru detalii suplimentare, compania trimite la keynote-ul GTC Taipei și la sesiunile dedicate „AI fizic”, disponibile prin linkurile din material. [...]

NVIDIA mizează pe „antrenarea la scară” pentru a reduce costurile și timpul de dezvoltare în robotică, conducere autonomă și agenți virtuali, prin modele care generalizează mai bine și rulează mai eficient pe hardware-ul din teren, potrivit NVIDIA , într-o prezentare a trei lucrări de cercetare la conferința CVPR 2026 . Ideea comună a celor trei lucrări este că volume foarte mari de date (în special din simulare) și arhitecturi optimizate pot elimina cicluri repetate de antrenare și pot face sistemele mai aplicabile „din cutie” în contexte variate — un punct cu impact operațional direct pentru companiile care dezvoltă roboți sau sisteme autonome. GraspGen-X: prindere „zero-shot” pentru grippere diferite, fără reantrenare pe fiecare configurație NVIDIA prezintă GraspGen-X , descris ca primul „model fundamental” (foundation model) pentru prindere robotică „zero-shot” — adică poate propune poziții de prindere pentru obiecte și grippere pe care nu le-a mai văzut, fără a fi reantrenat pentru fiecare tip de clește. În mod uzual, arată compania, sistemele de prindere sunt specializate: o politică de control (policy) antrenată pentru un gripper cu două degete nu se transferă automat la un gripper multi-degete, ceea ce obligă la colectare de date, ajustări (fine-tuning) și validare pentru fiecare „întrupare” (embodiment) nouă. GraspGen-X încearcă să elimine acest blocaj prin antrenare pe un set masiv de date: cercetătorii au generat 2 miliarde de prinderi simulate , acoperind mii de forme de obiecte și configurații sintetice de grippere. Modelul poate fi folosit împreună cu curoboV2 , o bibliotecă de planificare a mișcării accelerată cu CUDA, pentru a executa prinderile în medii necunoscute. NVIDIA indică și o continuare a lanțului tehnologic, prin lucrarea „Grasp-MPC”, prezentată la ICRA 2026 (link în sursă). LCDrive: raționament mai rapid pentru mașini autonome, cu mai puține „tokenuri” A doua lucrare, LCDrive, vizează o limitare practică a raționamentului de tip „chain-of-thought” (pași intermediari de gândire): în varianta bazată pe text, fiecare cuvânt generat înseamnă „tokenuri” care consumă timp de calcul, iar în mașină tokenurile devin o constrângere de latență. Soluția propusă este înlocuirea raționamentului în limbaj natural cu reprezentări latente compacte (un spațiu intern de stări care comprimă informația), astfel încât sistemul să „gândească” în stări care surprind informație spațială, nu în propoziții. Arhitectura alternează între propunerea de acțiuni candidate și predicția felului în care va arăta lumea dacă acele acțiuni sunt executate, într-o buclă de rafinare. NVIDIA susține că rezultatul este o calitate comparabilă a traiectoriei față de raționamentul bazat pe text, folosind aproximativ jumătate din tokenuri . Modelul este construit pe NVIDIA Alpamayo și antrenat cu supervizare derivată din date existente de vehicule. NitroGen: antrenarea agenților „întrupați” în jocuri, la volum mare de interacțiuni A treia lucrare, NitroGen, extinde principiul din NVIDIA Isaac GR00T (model fundamental deschis pentru roboți umanoizi) către medii virtuale, folosind jocurile video ca teren de antrenament: lumi structurate, variate, cu obiective și condiții de succes bine definite. NVIDIA afirmă că NitroGen a fost antrenat pe peste 1.000 de jocuri și 40.000 de ore de interacțiune , iar agenții rezultați au fost evaluați pe mai multe genuri (de la action RPG la platformere și jocuri open-world), demonstrând comportamente precum luptă, navigație și explorare. În condiții cu puține date (când agentul vede doar câteva exemple dintr-un mediu nou), pornirea de la NitroGen ar îmbunătăți performanța cu până la 52% față de metodele anterioare de vârf, potrivit companiei. Modelul este disponibil ca open-source pe GitHub și pe Hugging Face . De ce contează pentru industrie: mai puține cicluri de antrenare, latență mai mică, generalizare mai bună Mesajul operațional al pachetului de cercetări este reducerea „fricțiunii” de implementare: de la eliminarea reantrenării pentru fiecare gripper (GraspGen-X), la raționament mai rapid pe hardware-ul din vehicul (LCDrive), până la pre-antrenarea agenților în medii virtuale diverse înainte de contactul cu lumea reală (NitroGen). NVIDIA mai indică faptul că a prezentat la CVPR și „noi abilități” pentru agenți de „AI fizic” (physical AI) menite să accelereze dezvoltarea de vehicule autonome, roboți și sisteme de viziune, cu detalii suplimentare într-un material separat (link în sursă). [...]

NVIDIA pune la dispoziția cercetătorilor „skill-uri” pentru agenți AI, ca să reducă timpul și fragmentarea din fluxurile de lucru pentru vehicule autonome, roboți și sisteme de viziune. Potrivit NVIDIA , la CVPR compania a prezentat un set de „physical AI agent skills” (capabilități reutilizabile pentru agenți software care automatizează pași de cercetare) menite să lege într-un flux unitar etape care, în mod obișnuit, sunt împărțite între instrumente diferite: reconstrucția scenelor, generarea de scenarii rare, antrenarea politicilor, evaluarea comportamentului și iterarea rapidă. De ce contează: cercetarea „physical AI” e încetinită de integrare, nu doar de modele Mesajul central este operațional: problema majoră în „physical AI” (AI care interacționează cu lumea fizică prin percepție și acțiune) nu este doar obținerea unor modele mai puternice, ci construirea unui flux complet în jurul lor. NVIDIA susține că noile skill-uri, împreună cu biblioteci și cadre de simulare, urmăresc să reducă munca de „cusut” instrumente și să accelereze experimentarea. În acest context, compania amintește și anunțul din această săptămână privind NVIDIA Cosmos 3 , descris ca un „foundation model” pentru physical AI, care unifică raționamentul vizual, generarea de lumi și generarea de acțiuni. Skill-urile sunt poziționate ca un strat care ajută la trecerea de la capabilități de model la fluxuri de lucru scalabile, end-to-end. Vehicule autonome: simulare repetabilă pentru „coada lungă” a condusului Pentru cercetarea în vehicule autonome, NVIDIA indică drept problemă „coada lungă” a condusului: interacțiuni rare, geometrii neobișnuite ale drumului, schimbări de lumină și comportamente-limită greu de colectat repetat, dar critice pentru antrenare și validare. Abordarea propusă include automatizarea reconstrucției scenelor din date de flotă și generarea de scenarii sintetice. Un exemplu este skill-ul „Neural Reconstruction”, care ar transforma date capturate de flotă în scene 3D editabile pentru simulare și generare de date sintetice, împreună cu tehnologii precum NVIDIA Omniverse NuRec și InstantNuRec. NVIDIA mai menționează: NVIDIA AlpaGym , un cadru open-source de învățare prin recompensă (reinforcement learning) în buclă închisă, conectat la simulare de fidelitate ridicată și scalare pe mii de GPU-uri; NVIDIA OmniDreams , un model generativ de lume condiționat de acțiuni, care adaugă randare fotorealistă în bucla de simulare; NVIDIA Alpamayo 2 Super , descris ca cel mai puternic model open de condus al companiei până acum: un model VLA (vision-language-action) cu 32 de miliarde de parametri, pentru raționare, planificare și acțiune „pe întregul stack” de condus, cu țintă de dezvoltare și implementare level 4. Viziune AI: generarea de exemple controlate și „anomalii” sintetice În zona de vision AI, NVIDIA spune că blocajul este lipsa unui volum suficient de exemple controlate pentru a testa cum se comportă modelele când se schimbă condițiile vizuale, starea obiectelor sau evenimentele în timp. Sunt menționate explicit direcții precum detecția de anomalii „zero-shot”, generarea de anomalii sintetice și recunoașterea defectelor cu puține exemple (few-shot). Noile „Metropolis skills” ar permite agenților AI să genereze scenarii vizuale sintetice (inclusiv anomalii), să extindă seturile de date și să sprijine pseudo-etichetarea. Pentru inspecția vizuală, publicația dă ca exemplu skill-ul „Defect Image Generation”, care creează exemple de defecte pe suprafețe diferite pornind de la imagini reale, într-un flux ce combină Isaac Sim (simulare), Cosmos 3 și NVIDIA OSMO (orchestrare). Pentru agenți video, sunt menționate Metropolis Blueprint pentru căutare și sumarizare video (VSS), NVIDIA TAO și skill-uri de augmentare video, cu scopul de a automatiza bucla „build-and-evaluate” pentru modele care detectează evenimente, raționează pe scene complexe, sumarizează activitatea și trimit alerte. Roboți: automatizarea pașilor de simulare și antrenare, inclusiv „sim-to-real” În robotică, NVIDIA pune accent pe iterație: cercetătorii au nevoie de multe medii controlate și rulări de politici (policy rollouts) pentru a înțelege cum se schimbă comportamentul robotului între sarcini și configurații, iar asta implică, de regulă, integrare manuală între simulare, variații de sarcini, antrenare și evaluare. Compania afirmă că „robotics skills” permit agenților să automatizeze pași frecvenți precum pregătirea scenei, simularea și învățarea robotului folosind biblioteci Omniverse, Isaac Sim și Isaac Lab. Sunt menționate și skill-uri specializate pentru mobilitate și manipulare, inclusiv fluxuri pentru sarcini „sim-to-sim” și „sim-to-real” (transfer din simulare către lumea reală), precum construcția mediilor, reglaje de fizică, depanare și profilare. Pentru robotică medicală, NVIDIA indică „Cosmos-H-Surgical-Simulator”, care ar genera date realiste pentru antrenare și evaluare, învățând direct din date chirurgicale reale, cu obiectivul de a reduce diferența dintre simulare și realitate. Disponibilitate și acces: instrumente pe GitHub și medii preconfigurate pe Brev NVIDIA precizează că instrumentele și skill-urile pentru agenți physical AI sunt disponibile public prin GitHub, la NVIDIA physical AI skills . Totodată, skill-uri pentru generare de date sintetice (Neural Reconstruction, Video Augmentation, Defect Image Generation) pot fi rulate și ca „Physical AI Launchables” pe NVIDIA Brev, în medii preconfigurate care rulează pe GPU-uri NVIDIA H100 și includ credite de test pentru cercetători. Separat, compania afirmă că setul său de date „NVIDIA Physical AI Dataset” a depășit 15 milioane de descărcări pe Hugging Face și anunță noi lansări de seturi de date, inclusiv GRAIL (aprox. 50 de ore de interacțiuni humanoid–obiect) și șase seturi video sintetice folosite la antrenarea Cosmos 3. [...]

NVIDIA împinge AI-ul dincolo de automatizări punctuale, cu un „creier” care coordonează fabrica în timp real : potrivit NVIDIA , noul NVIDIA Factory Operations Blueprint (FOX) este un design de referință pentru construirea unui „agent” de tip manager autonom, care conectează semnale live din utilaje, sisteme de calitate, instrucțiuni de lucru și alerte operaționale într-un singur strat de decizie, capabil să orchestreze alți agenți specializați și echipamente. FOX este gândit ca o fundație personalizabilă pentru dezvoltatori, astfel încât fabricile să poată rula operațiuni „inteligente” la scară: controlul calității, transportul materialelor și siguranța lucrătorilor. Blueprint-ul este construit pe NVIDIA NemoClaw , AI-Q Blueprint și modelele deschise NVIDIA Nemotron . De ce contează: promisiunea este reducerea costurilor și a timpilor morți, nu doar „mai multă automatizare” Mesajul central al inițiativei este trecerea de la automatizări izolate la „inteligență” la nivel de fabrică, adică un sistem care nu doar detectează probleme, ci le și corelează între surse diferite și propune pași de remediere. În practică, NVIDIA poziționează FOX ca un mecanism de coordonare: un agent principal (manager) care „dirijează” o flotă de agenți industriali specializați și interacționează cu operatorii prin limbaj natural, cu controale de confidențialitate și siguranță prin NVIDIA OpenShell . Blueprint-ul include, între altele, integrarea cu surse industriale de date și roboți prin interfețe standard (API-uri), automatizarea ciclului de antrenare a modelelor (inclusiv generare sintetică de date și redeploy în producție) și operarea fluxurilor de lucru, inclusiv cu NVIDIA Metropolis Blueprint pentru căutare și sumarizare video (VSS) . Pentru vizualizare, datele pot fi reprezentate într-un „geamăn operațional” (o replică digitală a operațiunilor) construit cu NVIDIA Omniverse . Unde se rulează: FOX este optimizat pentru DGX Station și modele mari, local NVIDIA spune că FOX este optimizat să ruleze pe NVIDIA DGX Station , descris ca un „supercomputer” de birou pentru managerii de fabrică. Compania menționează că sistemul este bazat pe GB300 Grace Blackwell Ultra Desktop Superchip, cu 20 petaflopi performanță FP4 și 748 GB memorie coerentă, și că poate rula modele AI de până la 1 trilion de parametri local (adică în infrastructura companiei, nu neapărat în cloud). Primele implementări: câștiguri estimate în productivitate, mentenanță și energie NVIDIA indică drept primii utilizatori producători din Taiwan: Advantech, Foxconn , Pegatron și Wistron. Câteva rezultate proiectate/estimate prezentate în material: Foxconn folosește FOX și NemoClaw pentru „MoMClaw”, un sistem multi-agent pentru operațiuni de producție. Compania proiectează: îmbunătățire cu 80% a timpului de analiză a cauzei rădăcină (root cause analysis), creștere cu 15% a productivității muncii, scădere cu 10% a ratelor de defectare a utilajelor. Pegatron estimează o reducere cu 15% a costurilor de redundanță a activelor (prin utilizare mai eficientă a roboților și eliminarea nevoii de echipamente „de rezervă”). Advantech spune că a implementat în propriile fabrici un „AI Factory Brain” și proiectează o scădere cu 10% a consumului de energie (prin management autonom al HVAC și iluminatului). Wistron adoptă FOX și folosește NVIDIA Cosmos , Nemotron și Metropolis VSS pentru agenți care analizează și orchestrează operațiuni pe linia de producție, inclusiv analiză în timp real a cauzelor și controlul calității. Separat, NVIDIA menționează și dezvoltatori de agenți specializați (DeepHow, Overview AI, Roboflow, Spingence) care construiesc soluții pe baza ecosistemului NVIDIA și a blueprint-ului VSS, cu exemple de rezultate precum creșterea randamentului „din prima” (first-pass yield), accelerarea dezvoltării modelelor de inspecție vizuală și îmbunătățirea detectării defectelor. Ce urmează NVIDIA precizează că utilizatorii se pot înscrie pentru notificare atunci când NVIDIA Factory Operations Blueprint va fi disponibil. În paralel, compania afirmă că Metropolis VSS blueprint 3 este disponibil „general” și include abilități (skills) care permit agenților externi să acceseze componentele VSS pentru a construi și opera rapid agenți de analiză video. [...]

Un start-up chinez a depășit Nvidia într-un clasament-cheie pentru „AI fizic”, semnalând o mutare a competiției SUA–China spre robotică , potrivit South China Morning Post . Spirit AI, din Hangzhou, a urcat pe primul loc în clasamentul global RoboArena cu modelul său Spirit v1.6, la doar două zile după ce Nvidia lansase Cosmos 3, un model gândit să ajute roboții să „gândească înainte să acționeze”. Spirit v1.6 a obținut 1.924 de puncte, peste Cosmos3-Nano-Policy al Nvidia (1.881). Pe locul trei s-a clasat DreamZero (1.763), un alt proiect Nvidia prezentat în februarie. RoboArena este un benchmark (test standardizat) care evaluează cât de bine se traduc „politicile” unui robot generalist în acțiuni în lumea reală și a fost co-dezvoltat de Nvidia împreună cu instituții precum Stanford University și University of California, Berkeley. De ce contează: robotica devine „următorul front” al AI Competiția din jurul RoboArena indică o schimbare de etapă: AI iese din zona strict digitală (text, cod) și intră în zona sistemelor care interacționează cu mediul fizic – umanoizi, brațe robotice, vehicule autonome. În acest context, „AI fizic” (modele pentru percepție, planificare și acțiune) devine o miză strategică, iar clasamentele de tip benchmark încep să funcționeze ca indicatori de putere tehnologică. Nvidia își consolidează poziționarea în această direcție și prin parteneriate, inclusiv cu compania chineză Unitree Robotics și cu Sharpa din Singapore, menționate în material. Ce este „AI fizic” și ce măsoară clasamentele Spre deosebire de modelele lingvistice mari (LLM), care procesează și generează text și cod, un model de „AI fizic” este construit pentru ca mașinile să perceapă, să înțeleagă și să acționeze în lumea reală. Materialul descrie două capabilități centrale: capabilități de tip „policy” : abilitatea modelului de a decide acțiuni pe baza observațiilor (acesta este indicatorul principal în RoboArena); capabilități de tip „world” : abilitatea de a simula și prezice ce se întâmplă după o acțiune. Industria se îndreaptă spre integrarea acestor funcții într-o arhitectură unificată; publicația notează că, în septembrie anul trecut, cercetători chinezi au prezentat un „Policy World Model” care combină modelarea lumii și planificarea traiectoriei. China urcă și pe alte piste: WorldArena, percepție și „data engine” Dominanța Chinei nu se limitează la RoboArena. În benchmark-ul WorldArena (pentru „world models”), primul loc este ocupat de WorldScape-0.2, dezvoltat de start-up-ul chinez Manifold AI, care a depășit Cosmos-Predict 2.5 (action) al Nvidia pe pista de evaluare a politicilor, conform articolului. Publicația mai enumeră lideri chinezi pe alte segmente: percepție : AgiBot, cu modelul GenieEnvisioner-Sim2.0-2B, un simulator video pentru manipulare robotică; „data engine” (optimizarea fluxului de date de antrenare): DexForce, cu DSCFuncWorld; WorldScore (generare de „lumi” din prompturi text): WorldScape-0.2, peste WonderJourney, un proiect comun Stanford–Google. Banii și blocajul: finanțare accelerată, dar „datele” rămân problema Miza economică crește rapid, alimentată de capital de risc. Spirit AI a anunțat o rundă de finanțare de 1,5 miliarde yuani (222 milioane dolari, aprox. 1,0 miliarde lei) , a patra în doar trei luni, descrisă drept cel mai agresiv ritm de strângere de fonduri din sector. Alte exemple din articol: XYZ Embodied AI (incubat de Beijing Academy of Artificial Intelligence) a închis o rundă pre-A și spune că a strâns 1 miliard yuani (aprox. 610 milioane lei) în 10 luni; Manifold AI a încheiat cinci runde în 10 luni, iar runda din aprilie a atras „sute de milioane de yuani”, potrivit companiei. În pofida finanțărilor, „datele” sunt prezentate drept blocajul major pentru sistemele robotice. Jensen Huang , CEO Nvidia, este citat spunând: „Pentru sistemele robotice și AI fizic, datele sunt cea mai grea problemă.” Articolul susține că China ar putea avea un avantaj structural: Alexandr Wang (Scale AI, ulterior Meta Platforms) a afirmat anul trecut că China este „fundamental foarte bine poziționată pe date” și că multe companii americane se bazează pe date din China pentru antrenarea acestor modele. În plus, în hub-uri precum Beijing și Shenzhen, autoritățile au creat „fabrici de date” susținute de stat pentru colectarea datelor de robotică. În ansamblu, tabloul descris de publicație sugerează că următoarea etapă a competiției tehnologice se mută din zona cipurilor și a modelelor de limbaj spre infrastructura de date și modelele care controlează roboți în lumea reală. [...]

NVIDIA își extinde ecosistemul de „AI Cloud” pentru a crește rapid capacitatea de calcul necesară aplicațiilor cu agenți AI , pe fondul unei cereri în creștere pentru „tokeni” (unități de procesare a textului/ieșirilor modelelor) și pentru infrastructură regională, inclusiv în contexte suverane și reglementate, potrivit NVIDIA . Unghiul principal al mișcării este operațional: furnizorii de cloud și partenerii NVIDIA accelerează construcția de „AI factories” (centre de date optimizate pentru antrenare și inferență AI) mai aproape de date, dezvoltatori și utilizatori, pentru a reduce fricțiunea de acces la infrastructură și pentru a susține aplicații „agentice” (sisteme AI care execută sarcini în lanț, cu autonomie mai mare). De ce contează: capacitate regională și opțiuni „suverane” pentru industrii reglementate Publicația descrie NVIDIA AI Clouds ca un ecosistem de cloud-uri „proiectate special” și co-dezvoltate cu infrastructura completă NVIDIA (calcul accelerat, rețelistică și software AI), care acoperă antrenare, ajustare fină (fine-tuning), inferență, aplicații agentice, „physical AI” (AI pentru robotică și sisteme fizice) și implementări de tip „sovereign AI” (control local asupra datelor și infrastructurii). În acest context, extinderea are o componentă de conformitate și control: pentru guverne și industrii reglementate, cloud-urile regionale pot susține cerințe de conformitate locală și „controale suverane”, iar pentru companii și dezvoltatori pot facilita rularea serviciilor AI „aproape de utilizatori și date” (de exemplu, copiloți enterprise, „digital workers” și alți agenți AI). Extindere geografică: șase continente, cu noi intrări în Africa și America de Sud NVIDIA afirmă că ecosistemul ajunge acum pe șase continente, după adăugarea Cassava în Africa și Claro în America de Sud. Creșterea regională este indicată ca accelerând în Asia de Sud-Est, Australia și Americi. În paralel, sunt menționați parteneri care își extind infrastructura pentru dezvoltarea de modele de vârf, aplicații agentice și inferență la volum mare, între care CoreWeave , Firmus, IREN, Nebius și Nscale. Ce se construiește concret: „AI factories” și platforme pentru inferență și „physical AI” Textul oferă câteva exemple de implementare: Firmus Technologies își extinde „amprenta” de AI factory în Australia de Sud și Asia de Sud-Est, inclusiv prin Project Southgate (Tasmania, Melbourne, Australia de Sud și New South Wales), cu accent pe energie regenerabilă, răcire avansată și infrastructură modulară pentru a aduce capacitate online mai repede. Compania folosește arhitectura de referință NVIDIA și platforma NVIDIA DSX pentru proiectare, implementare și operare. CoreWeave își extinde platforma NVIDIA AI Cloud pentru „agentic AI”, „physical AI” și sarcini de tip „frontier model”. Este menționată adoptarea timpurie a NVIDIA Vera Rubin și NVIDIA Vera CPU , precum și a NVIDIA Spectrum-X Ethernet Photonics pentru rețelistică destinată unor AI factories la scară foarte mare. Pentru robotică și „physical AI”, CoreWeave folosește NVIDIA Cosmos 3 (detalii: NVIDIA Cosmos 3 ) pentru generare de date sintetice și ajustarea modelelor. Nebius își extinde NVIDIA AI Cloud cu o platformă „full-stack” (de la hardware la software), incluzând un strat de inferență numit Token Factory și un Physical AI Workbench , care integrează tehnologii precum NVIDIA Cosmos 3, NVIDIA Isaac Sim și Isaac GR00T în fluxuri de lucru „compozabile”. Separat, NVIDIA notează că șase parteneri au obținut statutul de Exemplar Cloud : CoreWeave, Crusoe, Lambda, Nebius, Vultr și YTL. Miza eficienței: „cost per token” și DSX pentru punerea mai rapidă în funcțiune NVIDIA pune accent pe economie și eficiență operațională, argumentând că, pe măsură ce AI se mută de la dezvoltarea modelelor la „reasoning” și inferență la volum mare, criteriul nu mai este doar capacitatea instalată, ci și „economia” producției de tokeni. Compania descrie „cost per token” ca indicator de cost total de deținere (TCO), care include performanța hardware, optimizările software, suportul de ecosistem și utilizarea în condiții reale, și susține că livrează „cel mai mic cost per token” din industrie (fără a oferi cifre în materialul citat). Pentru accelerarea implementărilor, NVIDIA arată că partenerii adoptă platforma NVIDIA DSX (detalii: NVIDIA DSX platform ), care include componente pentru simulare înainte de implementare, adaptarea sarcinilor la condițiile rețelei electrice și automatizarea operațiunilor. Potrivit descrierii din text, una dintre componentele DSX (DSX MaxLPS) ar permite, în condiții de limitare de putere, „până la 40% mai multe GPU-uri” în același buget energetic, prin maximizarea calculului în limitele de consum. Ce urmează Din informațiile prezentate, direcția imediată este creșterea capacității regionale și standardizarea operării „AI factories” prin platforme precum DSX, în paralel cu extinderea cazurilor de utilizare către aplicații agentice și „physical AI”. Materialul nu include un calendar de livrare sau ținte cantitative agregate pentru capacități, astfel că ritmul exact al extinderii rămâne neprecizat. [...]