Știri
Știri din categoria Inteligență artificială

China a pus în funcțiune un cluster AI de 60.000 de cipuri, mizând pe autonomie tehnologică, o mișcare care reduce dependența de furnizori externi și atenuează efectele restricțiilor americane la export, potrivit Interesting Engineering. Platforma a fost activată la Zhengzhou, în provincia Henan, și este destinată cercetării științifice, nu aplicațiilor de tip „chat”.
Clusterul și-a dublat capacitatea în doar două luni, de la 30.000 la 60.000 de cipuri de accelerare AI. Conform publicației, întregul „stivă” tehnologică (cipuri, interconectări de mare viteză și software) este produsă în China, pentru a evita „controlul extern”. Dezvoltarea este atribuită companiei Sugon, afiliată Academiei Chineze de Științe.
Sistemul este construit pentru direcția numită AI for Science (AI4S) – folosirea inteligenței artificiale în activități de descoperire științifică (simulări, căutare de materiale, modelare), nu pentru asistenți conversaționali. Publicația notează că această independență ar permite derularea unor proiecte sensibile fără riscul unor blocaje tehnologice sau interferențe externe.
În material sunt menționate câteva utilizări raportate de South China Morning Post (SCMP), inclusiv accelerarea simulărilor de „împăturire” a proteinelor (protein folding) pentru dezvoltarea de medicamente, precum și screening-ul de materiale noi într-un interval de zile, nu ani. Sunt invocate și simulări complexe în inginerie aerospațială.
Interesting Engineering plasează proiectul în contextul competiției SUA–China și al restricțiilor americane privind exporturile de tehnologie avansată. Articolul susține că upgrade-ul oferă Beijingului un avantaj strategic, deoarece cercetătorii pot ocoli constrângerile generate de penuria globală de procesoare grafice (GPU) și de interdicțiile de export ale SUA.
În paralel, sunt amintite două reacții din SUA:
Sugon a lansat și OneScience, descrisă ca prima platformă integrată de dezvoltare din China, care ar include modele și seturi de date preîncărcate pentru experimente AI complexe, fără a necesita cunoștințe de programare, potrivit SCMP citat de Interesting Engineering. Dacă implementarea se confirmă la scară, efectul ar putea fi extinderea bazei de utilizatori din cercetare care pot folosi resurse de calcul avansate.
Recomandate

Google împinge cumpărăturile second-hand spre „căutare asistată de AI” , prin funcții din Search și Shopping care ajută utilizatorii să găsească produse similare, să compare prețuri și chiar să estimeze valoarea de revânzare, potrivit Google Blog . Miza practică este reducerea fricțiunii din piața de resale (revânzare) – de la descoperire și verificare, până la decizia de cumpărare sau vânzare. În contextul în care interesul de căutare pentru „vintage” și „how to thrift” a atins maxime istorice în 2026, Google își poziționează instrumentele ca „strat” de orientare pentru cumpărăturile de obiecte second-hand și vintage, inclusiv pentru căutări aflate în trend precum „vintage jersey” și „thrifted heels”. Ce se schimbă operațional pentru utilizatori: 5 funcții, un singur flux Google descrie cinci moduri prin care Search poate „ridica nivelul” cumpărăturilor de tip thrift/vintage, cu accent pe căutare vizuală și întrebări în limbaj natural: AI Mode în Search : utilizatorii pot formula întrebări detaliate pentru a-și planifica „ieșirea la thrift”, iar răspunsurile includ opțiuni și detalii relevante, plus linkuri pentru documentare. Exemplul din articol combină căutarea de „tricouri vintage” cu o condiție logistică (brunch fără gluten în apropiere). Google Lens pentru identificare și context : prin fotografierea unui obiect în magazin, Lens poate afișa potriviri vizuale și permite întrebări despre designer sau perioadă („din ce eră este?”). Tot aici apare componenta cu impact direct în tranzacție: utilizatorul poate vedea la ce preț se vinde online și câte oferte similare există, pentru a evalua dacă e „piesă rară” sau produs comun. Circle to Search (Android) : utilizatorul încercuiește un obiect văzut pe ecran, iar funcția caută rapid produse similare, prețuri și locuri de cumpărare; apoi pot urma întrebări de rafinare (de exemplu, stiluri cu „vibe” de anii ’90). Virtual Try-On : un „cabina de probă” digitală. Utilizatorul găsește un produs similar cu Lens, apasă „try it on” și încarcă o fotografie full-body pentru a vedea cum ar arăta purtat. Lens pentru vânzare din propria garderobă : Google sugerează folosirea Lens pentru a estima cât ar valora un obiect la revânzare și ce tip de magazine ar cumpăra astfel de produse („Could I resell this?”). De ce contează: mai multă transparență de preț și mai puține „achiziții la ghici” Din perspectiva pieței, setul de funcții descris de Google mută o parte din „munca” specifică second-hand (identificare, autentificare informală prin comparații, orientare de preț) în interfața de căutare. În practică, asta poate crește transparența pentru cumpărători și poate accelera decizia de achiziție sau revânzare, mai ales când utilizatorul compară rapid cu ofertele online. Google nu oferă în material date despre lansări pe piețe, disponibilitate în România sau rezultate măsurabile (de tip conversii ori economii), astfel că impactul concret depinde de accesul efectiv la aceste funcții și de cât de bine acoperă ofertele locale. [...]

Apple își mută o parte din Siri în cloud-ul Google, pe cipuri Nvidia, pentru a accelera upgrade-ul AI potrivit GSMArena , care citează un raport The Information. Schimbarea contează operațional: Apple ar urma să se bazeze pe infrastructură externă ( Google Cloud și hardware Nvidia) pentru unele interogări Siri, în loc să ruleze totul pe dispozitivele proprii sau pe servere Apple. Ce presupune parteneriatul Apple–Google–Nvidia Conform informațiilor citate, Apple va folosi: cipurile Nvidia Blackwell, în special Blackwell B200, pentru partea de procesare în centrele de date; modelul de inteligență artificială Gemini al Google, într-o versiune licențiată, pentru a alimenta „Siri de nouă generație”. Raportul menționează că unele întrebări adresate lui Siri ar urma să fie procesate pe Google Cloud, nu local pe iPhone/iPad și nici pe infrastructura Apple. Miza: viteză de implementare, cu un pariu pe „confidential compute” GSMArena notează că este o schimbare de strategie pentru Apple, companie cunoscută pentru dezvoltare internă sau pentru diversificarea furnizorilor. În acest caz, dependența ar fi mai pronunțată: Apple „se va baza puternic” pe cipurile Blackwell și pe Gemini. Pentru a răspunde preocupărilor de confidențialitate, raportul indică faptul că centrele de date Google vor utiliza cipuri Nvidia Blackwell B200 cu o funcție integrată de „confidential compute” (procesare confidențială), care criptează datele în timp ce sunt procesate direct pe cip. Ideea este să reducă riscurile, chiar dacă o parte din solicitări ajung pe un cloud terț. Când ar putea apărea noul Siri Prima versiune a Siri „mai inteligent” ar putea fi văzută în septembrie, potrivit aceleiași surse. Detaliile despre ce tipuri de interogări vor fi mutate în cloud și în ce proporție nu sunt precizate în materialul citat. [...]

NVIDIA mizează pe „antrenarea la scară” pentru a reduce costurile și timpul de dezvoltare în robotică, conducere autonomă și agenți virtuali, prin modele care generalizează mai bine și rulează mai eficient pe hardware-ul din teren, potrivit NVIDIA , într-o prezentare a trei lucrări de cercetare la conferința CVPR 2026 . Ideea comună a celor trei lucrări este că volume foarte mari de date (în special din simulare) și arhitecturi optimizate pot elimina cicluri repetate de antrenare și pot face sistemele mai aplicabile „din cutie” în contexte variate — un punct cu impact operațional direct pentru companiile care dezvoltă roboți sau sisteme autonome. GraspGen-X: prindere „zero-shot” pentru grippere diferite, fără reantrenare pe fiecare configurație NVIDIA prezintă GraspGen-X , descris ca primul „model fundamental” (foundation model) pentru prindere robotică „zero-shot” — adică poate propune poziții de prindere pentru obiecte și grippere pe care nu le-a mai văzut, fără a fi reantrenat pentru fiecare tip de clește. În mod uzual, arată compania, sistemele de prindere sunt specializate: o politică de control (policy) antrenată pentru un gripper cu două degete nu se transferă automat la un gripper multi-degete, ceea ce obligă la colectare de date, ajustări (fine-tuning) și validare pentru fiecare „întrupare” (embodiment) nouă. GraspGen-X încearcă să elimine acest blocaj prin antrenare pe un set masiv de date: cercetătorii au generat 2 miliarde de prinderi simulate , acoperind mii de forme de obiecte și configurații sintetice de grippere. Modelul poate fi folosit împreună cu curoboV2 , o bibliotecă de planificare a mișcării accelerată cu CUDA, pentru a executa prinderile în medii necunoscute. NVIDIA indică și o continuare a lanțului tehnologic, prin lucrarea „Grasp-MPC”, prezentată la ICRA 2026 (link în sursă). LCDrive: raționament mai rapid pentru mașini autonome, cu mai puține „tokenuri” A doua lucrare, LCDrive, vizează o limitare practică a raționamentului de tip „chain-of-thought” (pași intermediari de gândire): în varianta bazată pe text, fiecare cuvânt generat înseamnă „tokenuri” care consumă timp de calcul, iar în mașină tokenurile devin o constrângere de latență. Soluția propusă este înlocuirea raționamentului în limbaj natural cu reprezentări latente compacte (un spațiu intern de stări care comprimă informația), astfel încât sistemul să „gândească” în stări care surprind informație spațială, nu în propoziții. Arhitectura alternează între propunerea de acțiuni candidate și predicția felului în care va arăta lumea dacă acele acțiuni sunt executate, într-o buclă de rafinare. NVIDIA susține că rezultatul este o calitate comparabilă a traiectoriei față de raționamentul bazat pe text, folosind aproximativ jumătate din tokenuri . Modelul este construit pe NVIDIA Alpamayo și antrenat cu supervizare derivată din date existente de vehicule. NitroGen: antrenarea agenților „întrupați” în jocuri, la volum mare de interacțiuni A treia lucrare, NitroGen, extinde principiul din NVIDIA Isaac GR00T (model fundamental deschis pentru roboți umanoizi) către medii virtuale, folosind jocurile video ca teren de antrenament: lumi structurate, variate, cu obiective și condiții de succes bine definite. NVIDIA afirmă că NitroGen a fost antrenat pe peste 1.000 de jocuri și 40.000 de ore de interacțiune , iar agenții rezultați au fost evaluați pe mai multe genuri (de la action RPG la platformere și jocuri open-world), demonstrând comportamente precum luptă, navigație și explorare. În condiții cu puține date (când agentul vede doar câteva exemple dintr-un mediu nou), pornirea de la NitroGen ar îmbunătăți performanța cu până la 52% față de metodele anterioare de vârf, potrivit companiei. Modelul este disponibil ca open-source pe GitHub și pe Hugging Face . De ce contează pentru industrie: mai puține cicluri de antrenare, latență mai mică, generalizare mai bună Mesajul operațional al pachetului de cercetări este reducerea „fricțiunii” de implementare: de la eliminarea reantrenării pentru fiecare gripper (GraspGen-X), la raționament mai rapid pe hardware-ul din vehicul (LCDrive), până la pre-antrenarea agenților în medii virtuale diverse înainte de contactul cu lumea reală (NitroGen). NVIDIA mai indică faptul că a prezentat la CVPR și „noi abilități” pentru agenți de „AI fizic” (physical AI) menite să accelereze dezvoltarea de vehicule autonome, roboți și sisteme de viziune, cu detalii suplimentare într-un material separat (link în sursă). [...]

NVIDIA pune la dispoziția cercetătorilor „skill-uri” pentru agenți AI, ca să reducă timpul și fragmentarea din fluxurile de lucru pentru vehicule autonome, roboți și sisteme de viziune. Potrivit NVIDIA , la CVPR compania a prezentat un set de „physical AI agent skills” (capabilități reutilizabile pentru agenți software care automatizează pași de cercetare) menite să lege într-un flux unitar etape care, în mod obișnuit, sunt împărțite între instrumente diferite: reconstrucția scenelor, generarea de scenarii rare, antrenarea politicilor, evaluarea comportamentului și iterarea rapidă. De ce contează: cercetarea „physical AI” e încetinită de integrare, nu doar de modele Mesajul central este operațional: problema majoră în „physical AI” (AI care interacționează cu lumea fizică prin percepție și acțiune) nu este doar obținerea unor modele mai puternice, ci construirea unui flux complet în jurul lor. NVIDIA susține că noile skill-uri, împreună cu biblioteci și cadre de simulare, urmăresc să reducă munca de „cusut” instrumente și să accelereze experimentarea. În acest context, compania amintește și anunțul din această săptămână privind NVIDIA Cosmos 3 , descris ca un „foundation model” pentru physical AI, care unifică raționamentul vizual, generarea de lumi și generarea de acțiuni. Skill-urile sunt poziționate ca un strat care ajută la trecerea de la capabilități de model la fluxuri de lucru scalabile, end-to-end. Vehicule autonome: simulare repetabilă pentru „coada lungă” a condusului Pentru cercetarea în vehicule autonome, NVIDIA indică drept problemă „coada lungă” a condusului: interacțiuni rare, geometrii neobișnuite ale drumului, schimbări de lumină și comportamente-limită greu de colectat repetat, dar critice pentru antrenare și validare. Abordarea propusă include automatizarea reconstrucției scenelor din date de flotă și generarea de scenarii sintetice. Un exemplu este skill-ul „Neural Reconstruction”, care ar transforma date capturate de flotă în scene 3D editabile pentru simulare și generare de date sintetice, împreună cu tehnologii precum NVIDIA Omniverse NuRec și InstantNuRec. NVIDIA mai menționează: NVIDIA AlpaGym , un cadru open-source de învățare prin recompensă (reinforcement learning) în buclă închisă, conectat la simulare de fidelitate ridicată și scalare pe mii de GPU-uri; NVIDIA OmniDreams , un model generativ de lume condiționat de acțiuni, care adaugă randare fotorealistă în bucla de simulare; NVIDIA Alpamayo 2 Super , descris ca cel mai puternic model open de condus al companiei până acum: un model VLA (vision-language-action) cu 32 de miliarde de parametri, pentru raționare, planificare și acțiune „pe întregul stack” de condus, cu țintă de dezvoltare și implementare level 4. Viziune AI: generarea de exemple controlate și „anomalii” sintetice În zona de vision AI, NVIDIA spune că blocajul este lipsa unui volum suficient de exemple controlate pentru a testa cum se comportă modelele când se schimbă condițiile vizuale, starea obiectelor sau evenimentele în timp. Sunt menționate explicit direcții precum detecția de anomalii „zero-shot”, generarea de anomalii sintetice și recunoașterea defectelor cu puține exemple (few-shot). Noile „Metropolis skills” ar permite agenților AI să genereze scenarii vizuale sintetice (inclusiv anomalii), să extindă seturile de date și să sprijine pseudo-etichetarea. Pentru inspecția vizuală, publicația dă ca exemplu skill-ul „Defect Image Generation”, care creează exemple de defecte pe suprafețe diferite pornind de la imagini reale, într-un flux ce combină Isaac Sim (simulare), Cosmos 3 și NVIDIA OSMO (orchestrare). Pentru agenți video, sunt menționate Metropolis Blueprint pentru căutare și sumarizare video (VSS), NVIDIA TAO și skill-uri de augmentare video, cu scopul de a automatiza bucla „build-and-evaluate” pentru modele care detectează evenimente, raționează pe scene complexe, sumarizează activitatea și trimit alerte. Roboți: automatizarea pașilor de simulare și antrenare, inclusiv „sim-to-real” În robotică, NVIDIA pune accent pe iterație: cercetătorii au nevoie de multe medii controlate și rulări de politici (policy rollouts) pentru a înțelege cum se schimbă comportamentul robotului între sarcini și configurații, iar asta implică, de regulă, integrare manuală între simulare, variații de sarcini, antrenare și evaluare. Compania afirmă că „robotics skills” permit agenților să automatizeze pași frecvenți precum pregătirea scenei, simularea și învățarea robotului folosind biblioteci Omniverse, Isaac Sim și Isaac Lab. Sunt menționate și skill-uri specializate pentru mobilitate și manipulare, inclusiv fluxuri pentru sarcini „sim-to-sim” și „sim-to-real” (transfer din simulare către lumea reală), precum construcția mediilor, reglaje de fizică, depanare și profilare. Pentru robotică medicală, NVIDIA indică „Cosmos-H-Surgical-Simulator”, care ar genera date realiste pentru antrenare și evaluare, învățând direct din date chirurgicale reale, cu obiectivul de a reduce diferența dintre simulare și realitate. Disponibilitate și acces: instrumente pe GitHub și medii preconfigurate pe Brev NVIDIA precizează că instrumentele și skill-urile pentru agenți physical AI sunt disponibile public prin GitHub, la NVIDIA physical AI skills . Totodată, skill-uri pentru generare de date sintetice (Neural Reconstruction, Video Augmentation, Defect Image Generation) pot fi rulate și ca „Physical AI Launchables” pe NVIDIA Brev, în medii preconfigurate care rulează pe GPU-uri NVIDIA H100 și includ credite de test pentru cercetători. Separat, compania afirmă că setul său de date „NVIDIA Physical AI Dataset” a depășit 15 milioane de descărcări pe Hugging Face și anunță noi lansări de seturi de date, inclusiv GRAIL (aprox. 50 de ore de interacțiuni humanoid–obiect) și șase seturi video sintetice folosite la antrenarea Cosmos 3. [...]

NVIDIA împinge AI-ul dincolo de automatizări punctuale, cu un „creier” care coordonează fabrica în timp real : potrivit NVIDIA , noul NVIDIA Factory Operations Blueprint (FOX) este un design de referință pentru construirea unui „agent” de tip manager autonom, care conectează semnale live din utilaje, sisteme de calitate, instrucțiuni de lucru și alerte operaționale într-un singur strat de decizie, capabil să orchestreze alți agenți specializați și echipamente. FOX este gândit ca o fundație personalizabilă pentru dezvoltatori, astfel încât fabricile să poată rula operațiuni „inteligente” la scară: controlul calității, transportul materialelor și siguranța lucrătorilor. Blueprint-ul este construit pe NVIDIA NemoClaw , AI-Q Blueprint și modelele deschise NVIDIA Nemotron . De ce contează: promisiunea este reducerea costurilor și a timpilor morți, nu doar „mai multă automatizare” Mesajul central al inițiativei este trecerea de la automatizări izolate la „inteligență” la nivel de fabrică, adică un sistem care nu doar detectează probleme, ci le și corelează între surse diferite și propune pași de remediere. În practică, NVIDIA poziționează FOX ca un mecanism de coordonare: un agent principal (manager) care „dirijează” o flotă de agenți industriali specializați și interacționează cu operatorii prin limbaj natural, cu controale de confidențialitate și siguranță prin NVIDIA OpenShell . Blueprint-ul include, între altele, integrarea cu surse industriale de date și roboți prin interfețe standard (API-uri), automatizarea ciclului de antrenare a modelelor (inclusiv generare sintetică de date și redeploy în producție) și operarea fluxurilor de lucru, inclusiv cu NVIDIA Metropolis Blueprint pentru căutare și sumarizare video (VSS) . Pentru vizualizare, datele pot fi reprezentate într-un „geamăn operațional” (o replică digitală a operațiunilor) construit cu NVIDIA Omniverse . Unde se rulează: FOX este optimizat pentru DGX Station și modele mari, local NVIDIA spune că FOX este optimizat să ruleze pe NVIDIA DGX Station , descris ca un „supercomputer” de birou pentru managerii de fabrică. Compania menționează că sistemul este bazat pe GB300 Grace Blackwell Ultra Desktop Superchip, cu 20 petaflopi performanță FP4 și 748 GB memorie coerentă, și că poate rula modele AI de până la 1 trilion de parametri local (adică în infrastructura companiei, nu neapărat în cloud). Primele implementări: câștiguri estimate în productivitate, mentenanță și energie NVIDIA indică drept primii utilizatori producători din Taiwan: Advantech, Foxconn , Pegatron și Wistron. Câteva rezultate proiectate/estimate prezentate în material: Foxconn folosește FOX și NemoClaw pentru „MoMClaw”, un sistem multi-agent pentru operațiuni de producție. Compania proiectează: îmbunătățire cu 80% a timpului de analiză a cauzei rădăcină (root cause analysis), creștere cu 15% a productivității muncii, scădere cu 10% a ratelor de defectare a utilajelor. Pegatron estimează o reducere cu 15% a costurilor de redundanță a activelor (prin utilizare mai eficientă a roboților și eliminarea nevoii de echipamente „de rezervă”). Advantech spune că a implementat în propriile fabrici un „AI Factory Brain” și proiectează o scădere cu 10% a consumului de energie (prin management autonom al HVAC și iluminatului). Wistron adoptă FOX și folosește NVIDIA Cosmos , Nemotron și Metropolis VSS pentru agenți care analizează și orchestrează operațiuni pe linia de producție, inclusiv analiză în timp real a cauzelor și controlul calității. Separat, NVIDIA menționează și dezvoltatori de agenți specializați (DeepHow, Overview AI, Roboflow, Spingence) care construiesc soluții pe baza ecosistemului NVIDIA și a blueprint-ului VSS, cu exemple de rezultate precum creșterea randamentului „din prima” (first-pass yield), accelerarea dezvoltării modelelor de inspecție vizuală și îmbunătățirea detectării defectelor. Ce urmează NVIDIA precizează că utilizatorii se pot înscrie pentru notificare atunci când NVIDIA Factory Operations Blueprint va fi disponibil. În paralel, compania afirmă că Metropolis VSS blueprint 3 este disponibil „general” și include abilități (skills) care permit agenților externi să acceseze componentele VSS pentru a construi și opera rapid agenți de analiză video. [...]

Un start-up chinez a depășit Nvidia într-un clasament-cheie pentru „AI fizic”, semnalând o mutare a competiției SUA–China spre robotică , potrivit South China Morning Post . Spirit AI, din Hangzhou, a urcat pe primul loc în clasamentul global RoboArena cu modelul său Spirit v1.6, la doar două zile după ce Nvidia lansase Cosmos 3, un model gândit să ajute roboții să „gândească înainte să acționeze”. Spirit v1.6 a obținut 1.924 de puncte, peste Cosmos3-Nano-Policy al Nvidia (1.881). Pe locul trei s-a clasat DreamZero (1.763), un alt proiect Nvidia prezentat în februarie. RoboArena este un benchmark (test standardizat) care evaluează cât de bine se traduc „politicile” unui robot generalist în acțiuni în lumea reală și a fost co-dezvoltat de Nvidia împreună cu instituții precum Stanford University și University of California, Berkeley. De ce contează: robotica devine „următorul front” al AI Competiția din jurul RoboArena indică o schimbare de etapă: AI iese din zona strict digitală (text, cod) și intră în zona sistemelor care interacționează cu mediul fizic – umanoizi, brațe robotice, vehicule autonome. În acest context, „AI fizic” (modele pentru percepție, planificare și acțiune) devine o miză strategică, iar clasamentele de tip benchmark încep să funcționeze ca indicatori de putere tehnologică. Nvidia își consolidează poziționarea în această direcție și prin parteneriate, inclusiv cu compania chineză Unitree Robotics și cu Sharpa din Singapore, menționate în material. Ce este „AI fizic” și ce măsoară clasamentele Spre deosebire de modelele lingvistice mari (LLM), care procesează și generează text și cod, un model de „AI fizic” este construit pentru ca mașinile să perceapă, să înțeleagă și să acționeze în lumea reală. Materialul descrie două capabilități centrale: capabilități de tip „policy” : abilitatea modelului de a decide acțiuni pe baza observațiilor (acesta este indicatorul principal în RoboArena); capabilități de tip „world” : abilitatea de a simula și prezice ce se întâmplă după o acțiune. Industria se îndreaptă spre integrarea acestor funcții într-o arhitectură unificată; publicația notează că, în septembrie anul trecut, cercetători chinezi au prezentat un „Policy World Model” care combină modelarea lumii și planificarea traiectoriei. China urcă și pe alte piste: WorldArena, percepție și „data engine” Dominanța Chinei nu se limitează la RoboArena. În benchmark-ul WorldArena (pentru „world models”), primul loc este ocupat de WorldScape-0.2, dezvoltat de start-up-ul chinez Manifold AI, care a depășit Cosmos-Predict 2.5 (action) al Nvidia pe pista de evaluare a politicilor, conform articolului. Publicația mai enumeră lideri chinezi pe alte segmente: percepție : AgiBot, cu modelul GenieEnvisioner-Sim2.0-2B, un simulator video pentru manipulare robotică; „data engine” (optimizarea fluxului de date de antrenare): DexForce, cu DSCFuncWorld; WorldScore (generare de „lumi” din prompturi text): WorldScape-0.2, peste WonderJourney, un proiect comun Stanford–Google. Banii și blocajul: finanțare accelerată, dar „datele” rămân problema Miza economică crește rapid, alimentată de capital de risc. Spirit AI a anunțat o rundă de finanțare de 1,5 miliarde yuani (222 milioane dolari, aprox. 1,0 miliarde lei) , a patra în doar trei luni, descrisă drept cel mai agresiv ritm de strângere de fonduri din sector. Alte exemple din articol: XYZ Embodied AI (incubat de Beijing Academy of Artificial Intelligence) a închis o rundă pre-A și spune că a strâns 1 miliard yuani (aprox. 610 milioane lei) în 10 luni; Manifold AI a încheiat cinci runde în 10 luni, iar runda din aprilie a atras „sute de milioane de yuani”, potrivit companiei. În pofida finanțărilor, „datele” sunt prezentate drept blocajul major pentru sistemele robotice. Jensen Huang , CEO Nvidia, este citat spunând: „Pentru sistemele robotice și AI fizic, datele sunt cea mai grea problemă.” Articolul susține că China ar putea avea un avantaj structural: Alexandr Wang (Scale AI, ulterior Meta Platforms) a afirmat anul trecut că China este „fundamental foarte bine poziționată pe date” și că multe companii americane se bazează pe date din China pentru antrenarea acestor modele. În plus, în hub-uri precum Beijing și Shenzhen, autoritățile au creat „fabrici de date” susținute de stat pentru colectarea datelor de robotică. În ansamblu, tabloul descris de publicație sugerează că următoarea etapă a competiției tehnologice se mută din zona cipurilor și a modelelor de limbaj spre infrastructura de date și modelele care controlează roboți în lumea reală. [...]