Știri
Știri din categoria Inteligență artificială

Huawei și Cambricon ar urma să preia până la 80% din piața chineză de servere pentru AI, reducând puternic spațiul Nvidia, potrivit unei analize citate de Huawei Central. Miza este una operațională și economică: reconfigurarea lanțului de aprovizionare pentru infrastructura de inteligență artificială din China, pe fondul presiunilor geopolitice asupra furnizorilor americani.
Raportul, atribuit South China Morning Post (SCMP), susține că Huawei și Cambricon – descriși drept principalii furnizori locali de cipuri pentru segmentul AI – sunt poziționați să „domine” piața de servere AI, în linie cu strategia de „autosuficiență” („self-reliant”) promovată în industrie.
Conform datelor citate, tensiunile geopolitice ar continua să apese asupra Nvidia, AMD și altor furnizori străini, prin pierderea cotei de piață în China. TrendForce este menționată ca sursă pentru estimarea că ponderea combinată a companiilor americane ar putea coborî la 21% în 2026, de la 34% anul trecut.
În oglindă, Huawei și Cambricon ar putea urca la 56% „în lunile următoare”, de la 46% în 2025, iar până la finalul acestui an ar putea ajunge la circa 80%, potrivit aceleiași analize.
Separat, companiile chineze de internet care dezvoltă cipuri specializate de tip ASIC (circuite integrate proiectate pentru o aplicație specifică) ar putea ajunge la 23% din piață, cu 3 puncte procentuale peste nivelul din 2025.
Analiza îl citează pe Frank Kung, care afirmă că marile companii chineze de internet stimulează creșterea segmentului de cipuri AI și, implicit, extinderea pieței de servere AI. Alibaba și ByteDance sunt indicate drept actori centrali în construirea infrastructurii tehnologice pentru AI, iar Alibaba și Baidu sunt menționate ca accelerând dezvoltarea de ASIC-uri prin diviziile lor de semiconductori, într-o mișcare comparată cu tendințele globale asociate unor jucători precum Google și Amazon.
„Acești giganți tehnologici chinezi nu sunt doar cei mai mari cumpărători de servere și infrastructură AI, dar ne așteptăm să devină și cei mai promițători jucători în dezvoltarea de cipuri interne, pe viitor. Tensiunile geopolitice și incertitudinile legate de tarife vor rămâne cele mai mari riscuri anul viitor.”
În lipsa unor detalii suplimentare în material despre metodologie sau calendar exact, estimările trebuie citite ca proiecții ale surselor citate, nu ca rezultate deja confirmate în piață.
Recomandate

Huawei vizează reducerea consumului de energie și a timpului de rulare pentru asistenții AI pe dispozitive , printr-o metodă de „potrivire” automată a modelelor în funcție de capabilitățile hardware, potrivit Huawei Central , care scrie că firma a primit aprobarea pentru un nou brevet pe această direcție. Brevetul, intitulat „An Artificial Intelligence (AI) Communication Method and Device”, descrie o soluție de comunicare între un asistent AI și dispozitive, cu obiectivul de a îmbunătăți eficiența și acuratețea rulării modelelor de tip LLM (modele lingvistice mari) direct pe device. Miza practică este ca utilizatorul să beneficieze de funcții AI mai „potrivite” contextului, fără testări repetate și consumatoare de resurse. Cum ar funcționa mecanismul descris în brevet Conform descrierii, sistemul implică două dispozitive într-un „sistem de comunicare”: un al doilea dispozitiv trimite către primul dispozitiv detalii despre modelele AI, inclusiv date complexe care înregistrează timpul de rulare și consumul de energie pentru diferite modele; după ce primește aceste informații, primul dispozitiv poate testa modelul în funcție de propriile capabilități hardware și poate transmite feedback către al doilea dispozitiv. Publicația notează că soluția introduce un mecanism de auto-verificare și potrivire a funcțiilor AI, astfel încât dispozitivele să nu mai fie nevoite să evalueze modelele „unul câte unul”. În schimb, ar putea determina mai rapid ce model este mai potrivit pentru mediul curent. De ce contează operațional: evaluare mai rapidă, rezultate mai precise În logica brevetului, metoda ar permite evaluarea capabilităților AI „mai ușor și mai eficient”, optimizând în același timp acuratețea rezultatelor evaluării. Sursa nu oferă un calendar de implementare și nici nu confirmă că soluția va ajunge într-un produs comercial; este vorba despre o aprobare de brevet și despre o descriere tehnică a unei posibile abordări. [...]

Europa își accelerează capacitatea de calcul pentru AI, cu 35 de noi supercomputere în dezvoltare , într-o extindere care ar urma să deservească peste 3 milioane de cercetători și să consolideze infrastructura de „fabrici AI” (centre dedicate antrenării și rulării modelelor) la nivel continental, potrivit NVIDIA News . Cele 35 de sisteme sunt descrise ca cea mai mare extindere într-un singur an a supercomputerelor din Europa, acoperind centre naționale de supercalcul, fabrici AI și instituții academice din 23 de țări. Miza operațională este creșterea rapidă a accesului la putere de calcul pentru antrenarea și utilizarea modelelor de inteligență artificială în cercetare și industrie, de la modelare climatică și sănătate până la energie și științe fundamentale. Un element central al anunțului este că infrastructura NVIDIA ar alimenta „peste 90%” din construcția de fabrici AI din Europa, cu „800 AI exaflops” (o măsură a performanței de calcul pentru AI) „deja implementați sau anunțați” de anul trecut. Compania indică utilizarea platformelor sale Blackwell și Hopper, împreună cu rețelistică InfiniBand și un pachet software care acoperă antrenarea, simularea și inferența (rularea modelelor). Proiecte și capacități anunțate: de la mii de GPU-uri la zeci de exaflopși În lista de proiecte evidențiate, NVIDIA menționează câteva implementări cu parametri tehnici și ținte de performanță: Barcelona Supercomputing Center (BSC) – extinderea MareNostrum 5 : integrare de sisteme NVIDIA GB300 NVL72 și GB200 NVL4, conectate prin NVIDIA Quantum-X800 InfiniBand, cu până la aprox. 20 exaflopși pentru antrenare AI și 33 exaflopși pentru inferență AI. Utilizări vizate: AI generativ, climă, sănătate/biotehnologie, agricultură sustenabilă, energie și servicii publice bazate pe AI. BavariaAI – „Blue Swan” : 1.000 de GPU-uri prin sisteme NVIDIA GB200 NVL4 și rețelistică NVIDIA Quantum-2 InfiniBand, la FAU Erlangen și LRZ, cu până la 11 exaflopși pentru antrenare și 22 exaflopși pentru inferență. IT4LIA (Italia) : fabrică AI cu peste 8.000 de GPU-uri (NVIDIA GB200 NVL4), rețelistică NVIDIA Quantum-X800 InfiniBand și software NVIDIA AI Enterprise, cu 82 exaflopși pentru antrenare și 164 exaflopși pentru inferență. HLRS (Stuttgart) – HammerHAI : „prima fabrică AI” a Germaniei, cu peste 850 de GPU-uri (NVIDIA GB200 NVL4) și NVIDIA Quantum-X800 InfiniBand, cu până la aprox. 8 exaflopși pentru antrenare și 15 exaflopși pentru inferență. NAISS (Suedia) – Mimer AI Factory (EuroHPC Joint Undertaking) : găzduit la Linköping University, cu 100 de sisteme NVIDIA GB200 NVL4 (în total 400 GPU-uri ) și rețelistică NVIDIA ConnectX-8, cu până la 4 exaflopși pentru antrenare și aprox. 7 exaflopși pentru inferență. De ce contează: infrastructura devine un factor de competitivitate în cercetare și industrie Din perspectiva impactului operațional, extinderea anunțată indică o accelerare a capacității europene de a rula proiecte AI la scară mare, într-un moment în care accesul la GPU-uri și la rețelistică de mare viteză a devenit un „gât de sticlă” pentru multe organizații. NVIDIA leagă explicit aceste investiții de domenii cu impact economic și strategic: climă, sănătate, decarbonizare și aplicații industriale. În zona de energie, compania oferă un exemplu concret: Siemens Energy folosește portofoliul Siemens Xcelerator, accelerat de tehnologii NVIDIA (inclusiv Omniverse, CUDA-X și infrastructură AI), pentru proiectarea și simularea turbinelor pe gaz capabile să funcționeze cu până la 100% hidrogen, iar fluxul de lucru ar reduce timpii de simulare cu până la 77%, potrivit anunțului. Extindere și spre „quantum-GPU”: integrarea CUDA-Q în centre europene NVIDIA mai afirmă că mai multe institute europene folosesc platforma CUDA-Q (pentru aplicații hibride cuantice-clasice), inclusiv CINECA, Fraunhofer și Jülich Supercomputing Centre. În acest context, compania menționează integrarea unui procesor cuantic (QPU) la CINECA și un record de simulare completă a unui computer cuantic universal de 50 de qubiți, rulat pe JUPITER, bazat pe NVIDIA GH200 Grace Hopper Superchips. Per ansamblu, mesajul dominant este că Europa își extinde rapid infrastructura de calcul pentru AI, iar NVIDIA își consolidează poziția de furnizor „full-stack” (hardware, rețea și software) pentru această etapă de investiții. [...]

Un studiu care folosește inteligența artificială sugerează că apa ar putea exista, la nivel molecular, ca un amestec din două „lichide” cu densități diferite , o ipoteză care, dacă va fi confirmată, ar putea schimba modul în care sunt modelate procesele din biologie și industrie care au loc în soluții apoase, potrivit Mediafax . Cercetarea, citată de publicație din Live Science, oferă un argument pentru „ ipoteza celor două stări ” ale apei: ideea că, la scară moleculară, apa ar fi formată din două structuri lichide, una mai densă și una mai puțin densă, care își schimbă constant locurile. Ce a făcut diferit echipa: „învățare profundă nesupravegheată” În locul unei abordări clasice, cercetătorii au folosit „învățarea profundă nesupravegheată” – adică un sistem de inteligență artificială antrenat să găsească tipare în date fără să i se spună explicit ce anume să caute. Conform articolului, IA a generat „zeci de milioane de informații” care, în mod obișnuit, ar fi rezultat din cercetări desfășurate pe parcursul a zeci de ani. Echipa ar fi observat și că traseul de conversie dintre cele două structuri se modifică în funcție de condiții. De ce contează: anomaliile apei și aplicațiile în biologie și farmacie Descoperirile au fost publicate în iunie în revista Nature Physics și, potrivit materialului, ar putea ajuta la explicarea unor comportamente neobișnuite ale apei, inclusiv: faptul că apa devine mai densă până la aproximativ 4°C, după care începe să se extindă (motiv pentru care gheața plutește); rezistența mai mare la schimbări de temperatură față de lichide similare; o vâscozitate care scade sub anumite presiuni. Miza practică este ridicată, deoarece multe procese biologice și farmaceutice au loc în apă. O înțelegere mai bună a structurii moleculare ar putea lămuri, de exemplu, cum interacționează în soluție sărurile dizolvate, proteinele și moleculele de medicamente. Ce urmează: confirmarea printr-un model mai riguros Cercetătorii lucrează acum la un model de învățare automată mai riguros pentru a confirma rezultatele. Ținta este ca noul sistem să ofere explicații mai solide pentru proprietăți precum densitatea, vâscozitatea și temperatura, menționează articolul. [...]

Google integrează „computer use” direct în Gemini 3.5 Flash, ceea ce mută automatizarea de tip agent din zona de demo în fluxuri de lucru enterprise. Potrivit Google Blog , funcția care permite unui model să „vadă, raționeze și acționeze” în interfețe (browser, mobil, desktop) devine un instrument încorporat în Gemini 3.5 Flash, după ce fusese disponibilă separat ca model dedicat „Gemini 2.5 computer use”. Integrarea contează operațional pentru companii și dezvoltatori deoarece reduce fragmentarea: în loc să combine modele și instrumente diferite, pot folosi același model „Flash” pentru apeluri de funcții (function calling) și pentru utilizarea de instrumente integrate (precum ancorarea în Search și Maps), plus controlul efectiv al unui computer. Google susține că 3.5 Flash oferă „cea mai bună performanță de până acum” pentru sarcini de tip „agentic computer use” (automatizări în care agentul execută pași multipli în timp). Ce se schimbă pentru dezvoltatori și echipele IT Google indică faptul că dezvoltatorii și companiile pot începe să folosească „computer use” în 3.5 Flash prin două canale: Gemini API , pentru integrare în aplicații și servicii; Gemini Enterprise Agent Platform , pentru scenarii enterprise. În termeni practici, capabilitatea este poziționată pentru sarcini „de cursă lungă” (long-horizon), unde un agent trebuie să parcurgă mai multe etape și aplicații, inclusiv în automatizări de business. Exemplele menționate includ testare software continuă și muncă de tip „knowledge work” în aplicații profesionale. Miza de risc: protecții contra „ prompt injection ” în medii reale Google pune accent pe riscul de „prompt injection” (când un agent este manipulat prin instrucțiuni ascunse/indirecte în conținutul pe care îl procesează) și spune că folosește antrenare adversarială țintită pentru a reduce aceste vulnerabilități în Gemini 3.5 Flash. În plus, compania anunță două sisteme opționale de protecție pentru mediul enterprise, care pot: cere confirmare explicită a utilizatorului pentru acțiuni sensibile sau ireversibile; opri automat sarcina dacă este identificată o tentativă de prompt injection indirect. Google recomandă o abordare „defense-in-depth” (apărare în profunzime), combinând aceste măsuri cu izolare în sandbox (mediu controlat), verificare umană („human-in-the-loop”) și controale stricte de acces. Ce urmează Compania indică faptul că există deja clienți care „obțin valoare” din această capabilitate și direcționează dezvoltatorii către testare într-un mediu demo găzduit de Browserbase și către implementări de referință și documentație prin canalele Gemini API și platforma enterprise. Articolul nu oferă detalii despre prețuri, disponibilitate pe regiuni sau praguri de acces, dincolo de aceste puncte de intrare. [...]

OpenAI își mută o parte din „costul AI” în hardware propriu , printr-un cip de inferență (rulare a modelelor, nu antrenare) dezvoltat cu Broadcom , cu promisiunea unei eficiențe energetice semnificativ mai bune decât acceleratoarele de top de azi, potrivit OpenAI . Miza este una operațională și economică: inferența este zona care „atinge” utilizatorii (ChatGPT, Codex, API), iar orice câștig la consum și latență se poate traduce în costuri mai mici și capacitate mai mare în centrele de date. Cipul se numește Jalapeño și este descris ca primul „Intelligence Processor” al OpenAI, un accelerator proiectat de la zero pentru inferența LLM (modele lingvistice mari). Compania spune că Jalapeño este prima piesă dintr-o platformă de calcul pe mai multe generații, construită împreună cu Broadcom, pentru a face AI „mai rapid, mai fiabil și mai accesibil”. Ce promite Jalapeño și ce lipsește încă din date OpenAI afirmă că testele timpurii indică o „performanță pe watt” substanțial mai bună decât „state-of-the-art” (vârful actual al pieței), însă precizează că măsurătorile finale nu sunt încheiate. Un raport tehnic detaliat ar urma să fie prezentat „în lunile următoare”, ceea ce înseamnă că, deocamdată, nu există cifre publice comparabile (de tip throughput, latență, consum) care să cuantifice avantajul. În laborator, mostrele de inginerie rulează sarcini de machine learning la frecvența și puterea-țintă de producție, inclusiv „GPT‑5.3‑Codex‑Spark”, conform sursei. De ce contează pentru costuri și capacitate în centrele de date Unghiul principal al anunțului este eficiența în exploatare: OpenAI leagă direct îmbunătățirile de infrastructură de preț, viteză și disponibilitate pentru produse. Compania susține că arhitectura reduce mișcarea de date și echilibrează resursele de calcul, memorie și rețea pentru a obține o utilizare „mai aproape de vârful teoretic”. În termeni practici, OpenAI indică efecte posibile precum: răspunsuri mai rapide în ChatGPT; sarcini Codex care pot rula mai multe etape cu timpi de așteptare mai mici; costuri mai mici pentru produse bazate pe API; acces mai stabil în perioade de vârf. Cine face ce în proiect și când ar urma să fie implementat OpenAI spune că a proiectat cipul „de la zero” pe baza înțelegerii propriilor modele și sisteme de servire, iar Broadcom și Celestica au contribuit la industrializare: implementare silicon, plăci, integrare în rack-uri, rețelistică de înaltă performanță și sisteme de producție scalabile. Sunt menționate și tehnologii de rețea Broadcom, inclusiv „Tomahawk networking silicon”. Pe calendar, Jalapeño este descris ca primul pas al unei platforme multi-generație, cu „implementare inițială până la finalul lui 2026”. Broadcom afirmă că această colaborare ar permite implementarea unor centre de date „la scară de gigawați” cu Microsoft și alți parteneri, începând din 2026. Dezvoltare accelerată și rolul AI în proiectare Un alt element operațional este viteza: OpenAI afirmă că Jalapeño a ajuns de la design inițial la „manufacturing tape-out” (momentul în care designul este finalizat și trimis spre fabricație) în nouă luni și susține că acesta ar fi cel mai rapid ciclu de dezvoltare ASIC din semiconductori avansați de înaltă performanță. Compania adaugă că a folosit propriile modele pentru a accelera părți din procesul de proiectare și optimizare. Context suplimentar apare și în analiza Ars Technica , care reia ideea că Jalapeño este un ASIC specializat pentru inferență în centre de date și că OpenAI încă nu a publicat măsurători finale, urmând să vină cu un raport tehnic ulterior. În lipsa unor benchmark-uri publice, impactul real va depinde de datele tehnice promise și de ritmul în care OpenAI și partenerii pot duce cipul din laborator în producție și apoi în exploatare la scară mare, până la finalul lui 2026. [...]

Agenții AI mută munca de birou de la „întrebări punctuale” la sarcini delegate pe ore , iar datele interne prezentate de OpenAI arată că instrumentul său Codex a devenit, în mai puțin de un an, principalul mod de lucru cu AI în toate departamentele companiei, inclusiv în zone non-tehnice precum Juridic și Recrutare. Miza operațională este că AI nu mai este folosită doar ca „asistent de conversație”, ci ca executant de sarcini mai lungi, care rulează independent și coordonează instrumente. OpenAI descrie „agentic AI” (AI agentică) ca o schimbare de unitate a muncii de cunoaștere: de la interacțiuni scurte, autosuficiente, la sarcini delegate pe termen mai lung, în care agenții pot lucra minute sau ore, apelând instrumente și iterând până la soluție. În acest cadru, Codex este prezentat ca exemplu de produs care a accelerat trecerea de la chatbot la agent. Ce arată datele: sarcini mai lungi și utilizare dominantă în companie Potrivit analizei, utilizatorii folosesc Codex tot mai mult pentru activități estimate ca durată umană semnificativă. Până în mai 2026, în eșantionul de utilizatori individuali: 80,6% au făcut cel puțin o solicitare estimată la peste 30 de minute de muncă umană; 70,2% au făcut cel puțin o solicitare estimată la peste o oră; 25,6% au făcut cel puțin o solicitare estimată la peste opt ore. OpenAI mai notează că „aproape un sfert” din toate solicitările Codex vizează sarcini care ar lua unei persoane mai mult de o oră. În paralel, Codex a devenit instrumentul principal de lucru cu AI în interiorul companiei. Dacă până în august 2025 angajatul mediu OpenAI folosea Codex pentru mai puțin de 10% din „tokeni” (unități de text procesate/generate), acum utilizarea Codex depășește 85% din tokenii de ieșire ai angajatului mediu. La nivel agregat intern, OpenAI afirmă că Codex ajunge la 99,8% din tokenii săptămânali de ieșire generați în companie, menționând și că utilizatorii Codex tind să consume mai mulți tokeni decât non-utilizatorii. Extinderea dincolo de ingineri: Juridic, Financiar, Recrutare Tranziția a început în inginerie, unde, potrivit OpenAI, utilizarea s-a mutat majoritar către Codex până în decembrie 2025, iar „astăzi” inginerul mediu generează 99% din tokenii de ieșire cu Codex, nu cu ChatGPT. Departamentele non-tehnice (Juridic, Financiar, Recrutare) ar fi trecut la Codex ca instrument principal în jurul lunii aprilie 2026, însă „mult mai rapid”, iar un avocat sau recrutor mediu ar genera acum peste 85% din tokenii de ieșire în Codex. În ultimele șase luni (raportat la perioada analizată), OpenAI indică o intensificare a utilizării interne, măsurată prin creșterea tokenilor de ieșire combinați pe departamente. Exemplele oferite: Research: utilizare mediană de 56 de ori mai mare în iunie 2026 față de noiembrie 2025; Customer Support: +32 ori; Engineering: +27 ori; Legal: +13 ori. De ce contează pentru companii: cost mai mic de a trece granițele dintre roluri Un punct central al materialului este că adoptarea accelerată în rândul non-dezvoltatorilor poate schimba modul în care sunt proiectate fluxurile de lucru. OpenAI susține că agenții reduc costul de a trece între tipuri de sarcini și permit angajaților să execute „muncă adiacentă” care înainte necesita sprijin tehnic specializat. Ca exemplu intern, OpenAI afirmă că, în funcțiile de business, „peste un sfert” din munca realizată cu Codex ar fi fost inginerie sau programare, ceea ce sugerează o creștere a autonomiei operaționale în departamente care, tradițional, depind de echipe tehnice pentru automatizări, transformări de date, instrumente, depanare sau analiză structurată. Ce urmează, în logica OpenAI Concluzia OpenAI este că, pe măsură ce instrumentele agentice devin mai capabile și mai accesibile, utilizatorii le vor folosi pentru sarcini mai lungi, mai complexe și mai „transversale” între funcții. Companiile sunt puse, implicit, în fața unei decizii de organizare: dacă tratează AI ca un canal de suport (chat) sau ca o resursă de execuție delegată (agenți) care poate prelua bucăți consistente din munca de cunoaștere. [...]