Știri
Știri din categoria Inteligență artificială

Arm încearcă să-și securizeze lanțul de aprovizionare pentru cererea „explozivă” de calcul AI, trecând de la modelul tradițional de furnizor de proprietate intelectuală (IP) la livrarea de subsisteme integrate și, acum, la cipuri proprii, potrivit Inside Arm. Miza, așa cum reiese din discuția liderilor companiei, este una operațională: cum scalezi planificarea, producția și testarea astfel încât să poți livra hardware pentru AI într-o piață în care „sistemele tradiționale” nu mai țin pasul cu ritmul cererii.
În podcast, Arm descrie „călătoria” către ceea ce numește „AGI CPU” ca pe o schimbare de poziționare în infrastructura de centre de date: compania pornește din rădăcinile sale din zona mobilă și ajunge să livreze nu doar nuclee (cores) licențiate, ci soluții mai complete, până la siliciu (cip efectiv).
Mesajul central pentru industrie este că, în contextul creșterii accelerate a cererii de calcul pentru AI, diferențiatorii se mută dincolo de performanță brută: eficiența energetică („performanță per watt”), scalarea și certitudinea în lanțul de aprovizionare devin criterii de competitivitate.
Dermot O’Driscoll (VP Product Solutions, Cloud AI) plasează începutul intrării în zona de infrastructură în jurul anilor 2012–2013, când Arm era puternic orientată spre piața client/mobil și avea o înțelegere limitată a cerințelor din centrele de date.
Evoluția descrisă în discuție are câteva etape:
În discuție, Amazon este prezentată ca un partener care a accelerat maturizarea ecosistemului software în jurul Arm pentru centre de date, prin disponibilitatea de a contribui la construcția acestuia (de la Java la profiluri de utilizare), în loc să aștepte ca ecosistemul să fie „gata”. Potrivit lui O’Driscoll, acest rol a atras și alți clienți, care ulterior au cerut soluții tot mai integrate.
Steve Halter (Solutions Engineering) spune că CSS este „fundația” designului AGI CPU, iar avantajul este că Arm proiectează la nivel de sistem, nu doar la nivel de blocuri IP: nucleu CPU plus componentele care îl fac performant într-un sistem real (interconectare, componente de virtualizare, MMU, GIC etc.).
În paralel, Halter descrie și schimbarea de competențe necesară pentru a livra un cip: experiență de produse SoC (system-on-chip) de volum, decizii dure de compromis între arie, consum, performanță, funcții și termene, plus competențe suplimentare în zone precum ambalare (packaging) și integrarea interfețelor (de tip DDR, PCIe, die-to-die).
Eric Hayes (EVP Operations) își definește aria ca acoperind lanțul de aprovizionare, planificare, logistică, producție, calitate și testare, adică exact funcțiile care devin critice când treci de la „design” la „livrare” de hardware. În fragmentul disponibil, el insistă că totul pornește de la oameni cu experiență din companii de semiconductori și hyperscaleri și că „totul este centrat pe calitate”.
Notă: transcriptul furnizat este trunchiat spre final, astfel că detaliile despre procesele concrete de fabricație și planificare nu sunt integral disponibile în textul sursă.
Recomandate

Google își diversifică producția de cipuri pentru AI, reducând dependența de TSMC , printr-o comandă fermă către Intel pentru fabricarea a peste trei milioane de unități în 2028, potrivit The Next Web . Mișcarea vine pe fondul presiunii tot mai mari asupra capacităților TSMC, în special în zona de „advanced packaging” (împachetare avansată, adică integrarea cipului cu memoria), un blocaj care începe să schimbe strategiile de aprovizionare ale marilor cumpărători din AI. Informația, atribuită de publicație unui material The Information, indică faptul că Google a plasat comanda către Intel pentru producția de „tensor processing units” (TPU – acceleratoare dezvoltate intern pentru sarcini de inteligență artificială). În paralel, Nvidia testează tehnologiile Intel, inclusiv împachetarea avansată și procesul 18A, fără să fi luat încă o decizie de producție. Pe fondul știrii, acțiunile Intel au urcat cu aproximativ 12%. De ce contează: blocajele de capacitate la TSMC împing clienții spre „plan B” Miza nu este o schimbare de lider în industrie, ci reducerea riscului operațional într-un lanț de aprovizionare concentrat într-o singură țară și, practic, într-un singur furnizor pentru cele mai avansate cipuri AI. TSMC „se chinuie” să țină pasul cu cererea, iar presiunea este descrisă ca fiind cea mai severă în liniile de împachetare avansată, unde cipurile și memoria sunt „cusute” împreună pentru performanță. Pentru companiile care proiectează cipuri de top, această dependență devine o vulnerabilitate strategică, iar diversificarea furnizorilor începe să arate mai puțin ca o opțiune și mai mult ca o necesitate. Două strategii diferite: comandă fermă la Google, teste timpurii la Nvidia Publicația separă explicit cele două abordări: Google : comandă fermă către Intel pentru peste trei milioane de TPU în 2028 , după luni de testare a tehnologiilor de împachetare ale Intel. În context, este menționată și o estimare Morgan Stanley privind un „build-out” de peste șase milioane de TPU în 2027 și 2028 (estimare a băncii, nu cifră raportată de companie). Nvidia : nu a făcut un angajament , dar rulează teste timpurii, inclusiv „multiproject wafer runs” pe 18A, și verifică dacă Intel poate construi un procesor care combină patru cipuri grafice într-unul singur, design asociat arhitecturii Feynman, așteptată în 2028. Ce câștigă Intel și unde rămân semnele de întrebare Pentru Intel, interesul – chiar și prudent – este prezentat ca un prag important, în condițiile în care compania încearcă de ani să transforme divizia de producție pentru terți (foundry, adică fabricare la comandă) într-un rival credibil pentru TSMC, cu rezultate limitate și pierderi mari. Publicația amintește că Intel a încercat să atragă Apple ca client și că atât guvernul SUA, cât și Nvidia au luat participații în companie. Totuși, „fereastra” pe termen scurt pare să fie mai degrabă în împachetare decât în fabricația de vârf , unde Intel încă rămâne în urmă. Un punct critic rămâne dacă 18A poate egala TSMC la „yield” (randament – proporția de cipuri funcționale rezultate din producție), o problemă care a mai afectat Intel în trecut. În același timp, este menționat că SK Hynix ar testa compatibilitatea memoriei sale HBM (high-bandwidth memory) cu împachetarea Intel. Context: Google își întărește controlul asupra propriului „silicon” Comanda către Intel este prezentată și ca o continuare a strategiei Google de a-și controla infrastructura de cipuri: TPU-urile „se livrează acum în milioane”, iar compania și-a „împrăștiat” comenzile către mai mulți parteneri pentru a reduce dependența atât de Nvidia, cât și de TSMC. Adăugarea Intel este încă o măsură de acoperire. Concluzia implicită: TSMC nu este „detronată”, dar faptul că cei mai mari cumpărători din AI caută alternative arată că presiunea de capacitate și riscul de concentrare au devenit suficient de mari încât să redeseneze, treptat, harta furnizorilor. Pentru Intel, Google devine un client care validează – cel puțin parțial – ambiția de revenire. [...]

Anthropic împinge în sus costul utilizării modelelor sale AI , lansând Claude Fable 5 la tarife duble față de generația anterioară, într-un moment în care compania își pregătește listarea la bursă în SUA, potrivit Profit . Claude Fable 5 va fi disponibil pentru clienții corporate și pentru abonații plătitori, fiind prima lansare la scară largă a unei tehnologii din aceeași clasă cu Mythos, model prezentat în aprilie doar unui grup restrâns de organizații. Atunci, Anthropic a invocat riscuri legate de utilizări periculoase, inclusiv în securitate cibernetică, după ce sistemul s-a remarcat prin capacitatea de a identifica rapid vulnerabilități software, stârnind reacții atât pe Wall Street, cât și în rândul autorităților de reglementare. Prețuri mai mari, miză pe productivitate Noul model intră în zona premium a portofoliului Anthropic: compania va percepe 10 dolari (aprox. 46 lei) pentru un milion de tokenuri de intrare și 50 de dolari (aprox. 230 lei) pentru un milion de tokenuri generate, adică de două ori mai mult decât în cazul Claude Opus 4.8. (Tokenurile sunt unități de text folosite pentru măsurarea consumului într-un model AI.) Anthropic își justifică prețul prin interesul clienților pentru productivitate și precizie, susținând că modelele mai performante pot oferi un randament mai bun al investiției, chiar dacă sunt mai scumpe. Siguranță: filtre noi și „retrogradare” la o versiune mai restrictivă Compania afirmă că lansarea publică a fost posibilă datorită unor filtre și sisteme de protecție suplimentare. Dacă utilizatorii cer informații considerate periculoase — de exemplu instrucțiuni pentru producerea de substanțe toxice sau pentru atacuri informatice — modelul blochează răspunsul și transferă solicitarea către o versiune mai restrictivă a sistemului. Pe partea de performanță, Anthropic spune că Claude Fable 5 excelează în programare, analiză și activități bazate pe cunoaștere și că depășește cu peste 10% Claude Opus 4.8 pe anumite teste de referință. În paralel, o versiune Mythos cu restricții mai puține pentru utilizatori specializați Odată cu Fable 5, Anthropic a lansat și Claude Mythos 5 , o versiune actualizată a modelului original, destinată unor utilizatori specializați și cu mai puține restricții în anumite domenii. Context de piață: pregătiri de IPO și competiție tot mai dură Lansarea vine în timp ce Anthropic a confirmat că a depus confidențial documentele pentru listarea la bursă în Statele Unite, compania pregătindu-se pentru una dintre cele mai mari oferte publice inițiale din sectorul inteligenței artificiale. Potrivit datelor comunicate de companie, veniturile anuale estimate au urcat la aproximativ 47 de miliarde de dolari (aprox. 216 miliarde lei), de la circa 10 miliarde de dolari (aprox. 46 miliarde lei) anul trecut, iar ultima rundă de finanțare a evaluat Anthropic la aproximativ 965 de miliarde de dolari (aprox. 4.439 miliarde lei). În același timp, competiția se intensifică: OpenAI a depus, la rândul său, documentația pentru listarea la bursă, iar SpaceX și xAI se pregătesc pentru o ofertă publică de amploare, conform informațiilor citate de Profit. [...]

Oracle Cloud Infrastructure intră în ecosistemul Arm AGI CPU , mizând pe o infrastructură mai eficientă pentru „agentic AI” – o categorie de aplicații în care o parte semnificativă din execuție se mută pe CPU (procesor), nu doar pe acceleratoare dedicate, potrivit Oracle Cloud Infrastructure . Mișcarea este relevantă operațional pentru piața de cloud: furnizorii caută să crească densitatea de calcul la nivel de rack (dulap de servere) fără să depășească limitele de energie și răcire, pe fondul cererii în creștere pentru agenți AI. Anunțul a fost făcut la COMPUTEX, în contextul în care Arm susține că „agentic AI” accelerează mai repede decât anticipa după evenimentul Arm Everywhere (24 martie). În această logică, OCI se alătură unui ecosistem pe care Arm îl descrie ca incluzând deja companii precum Cerebras, Cloudflare, F5, Meta, OpenAI, SAP sau SK Telecom. „OCI a văzut un impuls puternic cu infrastructura bazată pe Arm în sarcini cloud-native la scară mare (...) și suntem entuziasmați să explorăm cum Arm AGI CPU poate extinde aceste beneficii către sisteme agentic AI de generație următoare”, a declarat Mahesh Thiagarajan, EVP Oracle Cloud Infrastructure. De ce contează: „agentic AI” mută o parte mare din muncă pe CPU Arm argumentează că sarcinile „agentic” (agenți care coordonează instrumente, servicii și surse de date, rulează cod și păstrează contextul în sisteme distribuite) cresc importanța CPU-ului în arhitectura AI. În sprijinul acestei idei, materialul citează o estimare SemiAnalysis, potrivit căreia 42% din timpul de execuție în sarcini moderne de „agentic coding” este consumat de utilizarea de instrumente condusă de CPU. În paralel, Arm invocă și dinamica pieței: Anthropic ar fi raportat că a ajuns la un „revenue run rate” (ritm anualizat al veniturilor) de aproape 50 de miliarde de dolari (aprox. 230 mld. lei) în mai, de la circa 9 miliarde de dolari (aprox. 41 mld. lei) la final de 2025. Ce promite Arm AGI CPU: densitate mai mare pe rack și constrângeri de energie Arm poziționează Arm AGI CPU drept un procesor „construit” pentru această etapă, susținând că oferă „peste 2x performanță per rack” față de implementări tradiționale pe x86. Implicația operațională pentru furnizorii de cloud și operatorii de infrastructură AI este creșterea densității de calcul în aceleași limite de consum și disipare termică. Tot Arm afirmă că, la Arm Everywhere, a estimat economii de până la 10 miliarde de dolari (aprox. 46 mld. lei) în cheltuieli de capital pentru fiecare gigawatt de capacitate de infrastructură AI instalată, iar acum consideră că impactul economic „ar putea fi și mai mare”, pe fondul accelerării adopției. Context: ecosistemul Arm în cloud se extinde, dincolo de OCI Materialul plasează intrarea OCI într-un trend mai larg de adopție a procesoarelor Arm în infrastructura AI: Google a anunțat Axion ca „head node” (nod principal de control) pentru cele mai recente sisteme TPU, înlocuind CPU-urile x86. AWS își extinde implementările Graviton și notează că există cerere pentru capacitate suplimentară. NVIDIA își promovează platforma Vera (bazată pe Arm), menționând implementări la clienți precum OpenAI, Anthropic și SpaceX. În concluzie, mesajul central este că, pe măsură ce agenții AI cresc ca pondere în aplicațiile enterprise și în cloud, CPU-ul devine tot mai mult „planul de control” al infrastructurii moderne, iar furnizorii de cloud caută opțiuni care să optimizeze performanța pe rack și consumul energetic. [...]

Refuzul lui Jensen Huang de a depune mărturie sub jurământ în Senatul SUA ridică miza unei posibile confruntări de reglementare pe exporturile de cipuri AI către China , într-un moment în care Nvidia încearcă să influențeze politica de control al exporturilor fără a intra direct în logica audierilor publice, potrivit The Next Web . Directorul general al Nvidia a respins invitația senatoarei Elizabeth Warren de a apărea joi în fața Comisiei Bancare a Senatului, unde ar fi urmat să discute despre vânzările companiei către China și despre modul în care cipurile Nvidia ajung la cumpărători chinezi, în contextul restricțiilor americane la export. În schimb, Huang a propus un tur al sediului Nvidia din Santa Clara și o discuție „despre tehnologia noastră, ecosistemul american de inteligență artificială și cum putem sprijini leadershipul SUA”. Ce urmărește Senatul: riscul de utilizare militară și „portițele” din controale Warren vrea clarificări privind posibilitatea ca cipurile Nvidia, folosite la antrenarea și rularea (inferența) modelelor de inteligență artificială, să fie redirecționate către aplicații militare în China. În scrisoarea către Huang, senatoarea susține că aceste cipuri nu sunt utilizate doar în industrie, ci și „în scopuri militare”. Totodată, Warren critică regimul de control al exporturilor al Departamentului Comerțului, pe care îl consideră plin de lacune ce ar permite companiilor chineze să obțină cipuri avansate prin filiale din țări precum Singapore, Malaezia și Thailanda . Poziția Nvidia: restricțiile lovesc competitivitatea SUA, nu încetinesc China Huang a argumentat în mod repetat că limitarea vânzărilor către China afectează competitivitatea companiilor americane, fără să oprească dezvoltarea inteligenței artificiale în China. Conform publicației, el face parte din Consiliul de consilieri pentru știință și tehnologie al președintelui Trump și a susținut o abordare în care firmele americane ar avea „prioritate” la cele mai performante cipuri, dar ar putea vinde în continuare produse competitive pe piața chineză. „Ar trebui să ne asigurăm că firmele americane au cele mai bune și cele mai multe și primele”, a spus Huang, în decembrie, potrivit sursei. „Ar trebui să oferim cele mai competitive cipuri pe care le putem pieței chineze.” De ce contează: semnalul politic despre cât de departe merge Congresul The Next Web notează că refuzul de a depune mărturie nu este neobișnuit pentru un CEO din tehnologie, însă „optica” este sensibilă, pe fondul eforturilor lui Warren de a construi un dosar mai amplu de politici publice în jurul inteligenței artificiale (exporturi de cipuri, evaluări voluntare ale modelelor, posibile participații ale guvernului). Următorul pas – dacă Senatul va accepta invitația la sediul Nvidia sau va încerca să-l constrângă pe Huang să apară (de exemplu, printr-o citație) – va indica cât de hotărât este Congresul să escaladeze presiunea asupra celui mai influent furnizor de hardware pentru inteligență artificială. [...]

Companiile încep să mute o parte din AI din cloud înapoi „acasă”, pe fond de costuri și control al datelor , iar asta împinge arhitecturile IT spre un model „hibrid” în trei straturi (cloud public, centre de date private și dispozitive), potrivit unei discuții din podcastul Inside Arm cu analistul Bob O’Donnell (TECHnalysis Research). Miza operațională este schimbarea de strategie: după un deceniu în care multe organizații au încercat să ducă „totul în cloud”, AI – mai ales modelele generative – aduce presiuni noi legate de costuri, securitate și infrastructură, care fac atractivă readucerea unor sarcini de calcul în centre de date proprii sau în medii private (inclusiv colocare). De ce se întorc unele sarcini AI din cloud în centrele de date ale companiilor O’Donnell descrie „marea repatriere AI” ca o mișcare în care organizațiile încep să retragă o parte din sarcinile AI din cloudul public către infrastructură proprie. În conversație sunt indicate trei motive principale: Costurile : analistul spune că acesta a fost „motivul numărul unu” invocat de companii pentru mutarea unor sarcini AI înapoi on-premises (în infrastructura proprie). Securitatea și controlul datelor : companiile vor să-și folosească datele interne pentru a adapta modelele, fără să le expună inutil în cloud. „Gravitația datelor” : ideea că e mai eficient să duci calculul acolo unde se află datele. Pentru multe organizații, cele mai valoroase date rămân „în spatele firewall-ului”. În plus, O’Donnell leagă această tendință de disponibilitatea tot mai mare a serverelor echipate cu GPU (procesoare grafice folosite intens în AI), livrate de marii producători de infrastructură, ceea ce face fezabilă rularea unor sarcini care înainte erau practic rezervate cloudului. Cum arată „hibridul” în practică: cloud, privat și „client” Definiția de lucru pentru „hybrid AI” din discuție pornește de la analogia cu „hybrid cloud”: combinația dintre cloud public și cloud privat, extinsă cu un al treilea nivel – dispozitivul (PC, smartphone), unde apar capabilități noi de calcul local. O’Donnell anticipează că nu va exista un singur model standard, ci „toate variațiile posibile”, în funcție de tipul sarcinii și de date: sarcini care rămân în cloud (instrumente și servicii deja mature); sarcini mutate în centre de date private (mai ales când e multă mișcare de date pentru antrenare/ajustare); sarcini rulate local pe dispozitive, pe măsură ce „modelele mici” (small language models) și aplicațiile capabile să ruleze pe device se maturizează. Un exemplu discutat este ideea de „browser AI” , în care o parte din cereri ar putea fi rezolvate local, iar altele trimise către cloud, în funcție de complexitate și de accesul la date. Standardele și „orchestrarea” sarcinilor, următorul bloc de construcție Un element important pentru această distribuție este apariția unor mecanisme de „orchestrare” – adică software care decide unde se execută fiecare parte dintr-o sarcină AI. În discuție este menționat MCP (Model Context Protocol) , descris ca un standard care ar facilita distribuirea sarcinilor către diverse servere AI, indiferent de locația lor fizică. În același timp, O’Donnell spune că este încă devreme pentru a vorbi despre tipare stabile de plasare a sarcinilor: combinațiile „client–cloud” abia prind contur, iar integrarea în aplicații enterprise este în construcție. Ce ar trebui să rețină CIO și liderii IT Concluzia operațională a discuției este că strategiile „cloud-only” sunt tot mai des reevaluate, pe măsură ce AI trece de la experimente la utilizare la scară. Pentru companii, asta înseamnă decizii concrete despre: unde își țin datele și cum le folosesc pentru ajustarea modelelor; ce infrastructură merită cumpărată sau închiriată (inclusiv servere cu GPU); cum își pregătesc arhitectura pentru un viitor „decentralizat și eterogen”, în care AI rulează „din cloud până la client și peste tot între ele”. Sursa nu oferă cifre sau un calendar ferm al tranziției, dar indică direcția: pe măsură ce costurile și cerințele de control cresc, „hibridul” devine mai puțin o opțiune de design și mai mult o necesitate de operare. [...]

Perplexity mizează pe un IPO în 2028, pariind pe „a doua fereastră” de listări AI , într-un moment în care OpenAI și Anthropic se grăbesc să ajungă pe bursă încă din 2026, potrivit The Next Web . Mesajul CEO-ului Aravind Srinivas este că planul companiei nu se schimbă, chiar dacă rivalii intră într-o cursă a listărilor. Srinivas a declarat pentru CNBC că Perplexity își păstrează calendarul: compania vizează în continuare o listare publică în 2028, „independent” de mișcările OpenAI și Anthropic. În lectura publicației, poziționarea o transformă într-un „outlier” deliberat într-o piață în care cele mai mari nume din AI se aliniază pentru IPO-uri la distanță de câteva luni. De ce contează: riscul și avantajul de a veni după „primul val” În timp ce OpenAI și Anthropic ar încerca să capteze apetitul investitorilor în 2026, Perplexity pare să parieze pe beneficiile unei listări mai târzii: să observe cum este primit primul val de IPO-uri AI, să construiască un istoric financiar mai lung și să intre pe bursă după ce entuziasmul inițial al pieței fie se confirmă, fie se corectează. Publicația notează și reversul medaliei: „înțelepciunea convențională” spune că primele companii listate într-o fereastră de IPO atrag cea mai mare parte a capitalului. Dacă OpenAI și Anthropic „absorb” cererea pentru acțiuni AI în 2026, Perplexity ar putea găsi în 2028 un bazin mai mic de investitori disponibili. Unde se află Perplexity față de giganți Perplexity a fost evaluată ultima dată la aproximativ 20 miliarde de dolari, după o rundă de finanțare din septembrie 2025, și a atras în total circa 900 milioane de dolari, potrivit articolului. Prin comparație, OpenAI ar fi strâns 122 miliarde de dolari într-o singură rundă, iar Anthropic 30 miliarde de dolari. Compania dezvoltă un „motor de răspunsuri” bazat pe inteligență artificială, concurând cu Google Search, ChatGPT și Claude. Pentru zona corporate, Perplexity are un pachet enterprise la 40 de dolari pe utilizator pe lună (aprox. 184 lei), însă veniturile pentru 2026 nu au fost făcute publice, mai arată sursa. Ce trebuie să se întâmple până în 2028 Potrivit analizei, teza unui IPO în 2028 se sprijină pe două ipoteze: că piața de „căutare AI” va fi suficient de mare pentru a susține o companie listată de sine stătătoare și că Perplexity va rămâne suficient de diferențiată încât să ia o cotă relevantă. Ambele rămân întrebări deschise, în condițiile în care Google integrează agresiv AI în Search, iar ChatGPT este deja interfața AI implicită pentru sute de milioane de utilizatori. În esență, Perplexity pariază că răbdarea va fi mai valoroasă decât urgența — iar piața va valida sau infirma această strategie abia în 2028. [...]