Știri
Știri din categoria Inteligență artificială

Companiile încep să mute o parte din AI din cloud înapoi „acasă”, pe fond de costuri și control al datelor, iar asta împinge arhitecturile IT spre un model „hibrid” în trei straturi (cloud public, centre de date private și dispozitive), potrivit unei discuții din podcastul Inside Arm cu analistul Bob O’Donnell (TECHnalysis Research).
Miza operațională este schimbarea de strategie: după un deceniu în care multe organizații au încercat să ducă „totul în cloud”, AI – mai ales modelele generative – aduce presiuni noi legate de costuri, securitate și infrastructură, care fac atractivă readucerea unor sarcini de calcul în centre de date proprii sau în medii private (inclusiv colocare).
O’Donnell descrie „marea repatriere AI” ca o mișcare în care organizațiile încep să retragă o parte din sarcinile AI din cloudul public către infrastructură proprie. În conversație sunt indicate trei motive principale:
În plus, O’Donnell leagă această tendință de disponibilitatea tot mai mare a serverelor echipate cu GPU (procesoare grafice folosite intens în AI), livrate de marii producători de infrastructură, ceea ce face fezabilă rularea unor sarcini care înainte erau practic rezervate cloudului.
Definiția de lucru pentru „hybrid AI” din discuție pornește de la analogia cu „hybrid cloud”: combinația dintre cloud public și cloud privat, extinsă cu un al treilea nivel – dispozitivul (PC, smartphone), unde apar capabilități noi de calcul local.
O’Donnell anticipează că nu va exista un singur model standard, ci „toate variațiile posibile”, în funcție de tipul sarcinii și de date:
Un exemplu discutat este ideea de „browser AI”, în care o parte din cereri ar putea fi rezolvate local, iar altele trimise către cloud, în funcție de complexitate și de accesul la date.
Un element important pentru această distribuție este apariția unor mecanisme de „orchestrare” – adică software care decide unde se execută fiecare parte dintr-o sarcină AI. În discuție este menționat MCP (Model Context Protocol), descris ca un standard care ar facilita distribuirea sarcinilor către diverse servere AI, indiferent de locația lor fizică.
În același timp, O’Donnell spune că este încă devreme pentru a vorbi despre tipare stabile de plasare a sarcinilor: combinațiile „client–cloud” abia prind contur, iar integrarea în aplicații enterprise este în construcție.
Concluzia operațională a discuției este că strategiile „cloud-only” sunt tot mai des reevaluate, pe măsură ce AI trece de la experimente la utilizare la scară. Pentru companii, asta înseamnă decizii concrete despre:
Sursa nu oferă cifre sau un calendar ferm al tranziției, dar indică direcția: pe măsură ce costurile și cerințele de control cresc, „hibridul” devine mai puțin o opțiune de design și mai mult o necesitate de operare.
Recomandate

Anthropic împinge în sus costul utilizării modelelor sale AI , lansând Claude Fable 5 la tarife duble față de generația anterioară, într-un moment în care compania își pregătește listarea la bursă în SUA, potrivit Profit . Claude Fable 5 va fi disponibil pentru clienții corporate și pentru abonații plătitori, fiind prima lansare la scară largă a unei tehnologii din aceeași clasă cu Mythos, model prezentat în aprilie doar unui grup restrâns de organizații. Atunci, Anthropic a invocat riscuri legate de utilizări periculoase, inclusiv în securitate cibernetică, după ce sistemul s-a remarcat prin capacitatea de a identifica rapid vulnerabilități software, stârnind reacții atât pe Wall Street, cât și în rândul autorităților de reglementare. Prețuri mai mari, miză pe productivitate Noul model intră în zona premium a portofoliului Anthropic: compania va percepe 10 dolari (aprox. 46 lei) pentru un milion de tokenuri de intrare și 50 de dolari (aprox. 230 lei) pentru un milion de tokenuri generate, adică de două ori mai mult decât în cazul Claude Opus 4.8. (Tokenurile sunt unități de text folosite pentru măsurarea consumului într-un model AI.) Anthropic își justifică prețul prin interesul clienților pentru productivitate și precizie, susținând că modelele mai performante pot oferi un randament mai bun al investiției, chiar dacă sunt mai scumpe. Siguranță: filtre noi și „retrogradare” la o versiune mai restrictivă Compania afirmă că lansarea publică a fost posibilă datorită unor filtre și sisteme de protecție suplimentare. Dacă utilizatorii cer informații considerate periculoase — de exemplu instrucțiuni pentru producerea de substanțe toxice sau pentru atacuri informatice — modelul blochează răspunsul și transferă solicitarea către o versiune mai restrictivă a sistemului. Pe partea de performanță, Anthropic spune că Claude Fable 5 excelează în programare, analiză și activități bazate pe cunoaștere și că depășește cu peste 10% Claude Opus 4.8 pe anumite teste de referință. În paralel, o versiune Mythos cu restricții mai puține pentru utilizatori specializați Odată cu Fable 5, Anthropic a lansat și Claude Mythos 5 , o versiune actualizată a modelului original, destinată unor utilizatori specializați și cu mai puține restricții în anumite domenii. Context de piață: pregătiri de IPO și competiție tot mai dură Lansarea vine în timp ce Anthropic a confirmat că a depus confidențial documentele pentru listarea la bursă în Statele Unite, compania pregătindu-se pentru una dintre cele mai mari oferte publice inițiale din sectorul inteligenței artificiale. Potrivit datelor comunicate de companie, veniturile anuale estimate au urcat la aproximativ 47 de miliarde de dolari (aprox. 216 miliarde lei), de la circa 10 miliarde de dolari (aprox. 46 miliarde lei) anul trecut, iar ultima rundă de finanțare a evaluat Anthropic la aproximativ 965 de miliarde de dolari (aprox. 4.439 miliarde lei). În același timp, competiția se intensifică: OpenAI a depus, la rândul său, documentația pentru listarea la bursă, iar SpaceX și xAI se pregătesc pentru o ofertă publică de amploare, conform informațiilor citate de Profit. [...]

Oracle Cloud Infrastructure intră în ecosistemul Arm AGI CPU , mizând pe o infrastructură mai eficientă pentru „agentic AI” – o categorie de aplicații în care o parte semnificativă din execuție se mută pe CPU (procesor), nu doar pe acceleratoare dedicate, potrivit Oracle Cloud Infrastructure . Mișcarea este relevantă operațional pentru piața de cloud: furnizorii caută să crească densitatea de calcul la nivel de rack (dulap de servere) fără să depășească limitele de energie și răcire, pe fondul cererii în creștere pentru agenți AI. Anunțul a fost făcut la COMPUTEX, în contextul în care Arm susține că „agentic AI” accelerează mai repede decât anticipa după evenimentul Arm Everywhere (24 martie). În această logică, OCI se alătură unui ecosistem pe care Arm îl descrie ca incluzând deja companii precum Cerebras, Cloudflare, F5, Meta, OpenAI, SAP sau SK Telecom. „OCI a văzut un impuls puternic cu infrastructura bazată pe Arm în sarcini cloud-native la scară mare (...) și suntem entuziasmați să explorăm cum Arm AGI CPU poate extinde aceste beneficii către sisteme agentic AI de generație următoare”, a declarat Mahesh Thiagarajan, EVP Oracle Cloud Infrastructure. De ce contează: „agentic AI” mută o parte mare din muncă pe CPU Arm argumentează că sarcinile „agentic” (agenți care coordonează instrumente, servicii și surse de date, rulează cod și păstrează contextul în sisteme distribuite) cresc importanța CPU-ului în arhitectura AI. În sprijinul acestei idei, materialul citează o estimare SemiAnalysis, potrivit căreia 42% din timpul de execuție în sarcini moderne de „agentic coding” este consumat de utilizarea de instrumente condusă de CPU. În paralel, Arm invocă și dinamica pieței: Anthropic ar fi raportat că a ajuns la un „revenue run rate” (ritm anualizat al veniturilor) de aproape 50 de miliarde de dolari (aprox. 230 mld. lei) în mai, de la circa 9 miliarde de dolari (aprox. 41 mld. lei) la final de 2025. Ce promite Arm AGI CPU: densitate mai mare pe rack și constrângeri de energie Arm poziționează Arm AGI CPU drept un procesor „construit” pentru această etapă, susținând că oferă „peste 2x performanță per rack” față de implementări tradiționale pe x86. Implicația operațională pentru furnizorii de cloud și operatorii de infrastructură AI este creșterea densității de calcul în aceleași limite de consum și disipare termică. Tot Arm afirmă că, la Arm Everywhere, a estimat economii de până la 10 miliarde de dolari (aprox. 46 mld. lei) în cheltuieli de capital pentru fiecare gigawatt de capacitate de infrastructură AI instalată, iar acum consideră că impactul economic „ar putea fi și mai mare”, pe fondul accelerării adopției. Context: ecosistemul Arm în cloud se extinde, dincolo de OCI Materialul plasează intrarea OCI într-un trend mai larg de adopție a procesoarelor Arm în infrastructura AI: Google a anunțat Axion ca „head node” (nod principal de control) pentru cele mai recente sisteme TPU, înlocuind CPU-urile x86. AWS își extinde implementările Graviton și notează că există cerere pentru capacitate suplimentară. NVIDIA își promovează platforma Vera (bazată pe Arm), menționând implementări la clienți precum OpenAI, Anthropic și SpaceX. În concluzie, mesajul central este că, pe măsură ce agenții AI cresc ca pondere în aplicațiile enterprise și în cloud, CPU-ul devine tot mai mult „planul de control” al infrastructurii moderne, iar furnizorii de cloud caută opțiuni care să optimizeze performanța pe rack și consumul energetic. [...]

Arm încearcă să-și securizeze lanțul de aprovizionare pentru cererea „explozivă” de calcul AI , trecând de la modelul tradițional de furnizor de proprietate intelectuală (IP) la livrarea de subsisteme integrate și, acum, la cipuri proprii, potrivit Inside Arm . Miza, așa cum reiese din discuția liderilor companiei, este una operațională: cum scalezi planificarea, producția și testarea astfel încât să poți livra hardware pentru AI într-o piață în care „sistemele tradiționale” nu mai țin pasul cu ritmul cererii. De ce contează: de la licențiere la execuție industrială În podcast, Arm descrie „călătoria” către ceea ce numește „AGI CPU” ca pe o schimbare de poziționare în infrastructura de centre de date: compania pornește din rădăcinile sale din zona mobilă și ajunge să livreze nu doar nuclee (cores) licențiate, ci soluții mai complete, până la siliciu (cip efectiv). Mesajul central pentru industrie este că, în contextul creșterii accelerate a cererii de calcul pentru AI, diferențiatorii se mută dincolo de performanță brută: eficiența energetică („performanță per watt”), scalarea și certitudinea în lanțul de aprovizionare devin criterii de competitivitate. Cum a evoluat strategia Arm în centrele de date Dermot O’Driscoll (VP Product Solutions, Cloud AI) plasează începutul intrării în zona de infrastructură în jurul anilor 2012–2013, când Arm era puternic orientată spre piața client/mobil și avea o înțelegere limitată a cerințelor din centrele de date. Evoluția descrisă în discuție are câteva etape: Licențe de arhitectură către startup-uri care își construiau propriul siliciu (exemple menționate: Calxeda), într-o perioadă în care Arm prefera să lase „înțelegerea pieței” la parteneri. Întoarcerea cererii către Arm , pe măsură ce clienții au cerut capabilități specifice de infrastructură: suport de virtualizare, interconectări și posibilitatea de a construi sisteme cu multe nuclee. Trecerea către subsisteme de calcul preintegrate (CSS) , pe ideea că o parte din clienți nu mai vor „să coasă” singuri componentele IP, ci să primească o soluție integrată și validată. Rolul parteneriatelor și „efectul Amazon” În discuție, Amazon este prezentată ca un partener care a accelerat maturizarea ecosistemului software în jurul Arm pentru centre de date, prin disponibilitatea de a contribui la construcția acestuia (de la Java la profiluri de utilizare), în loc să aștepte ca ecosistemul să fie „gata”. Potrivit lui O’Driscoll, acest rol a atras și alți clienți, care ulterior au cerut soluții tot mai integrate. De la CSS la cip: ce înseamnă, practic, „AGI CPU” Steve Halter (Solutions Engineering) spune că CSS este „fundația” designului AGI CPU , iar avantajul este că Arm proiectează la nivel de sistem, nu doar la nivel de blocuri IP: nucleu CPU plus componentele care îl fac performant într-un sistem real (interconectare, componente de virtualizare, MMU, GIC etc.). În paralel, Halter descrie și schimbarea de competențe necesară pentru a livra un cip: experiență de produse SoC (system-on-chip) de volum, decizii dure de compromis între arie, consum, performanță, funcții și termene, plus competențe suplimentare în zone precum ambalare (packaging) și integrarea interfețelor (de tip DDR, PCIe, die-to-die). Lanțul de aprovizionare devine parte din produs Eric Hayes (EVP Operations) își definește aria ca acoperind lanțul de aprovizionare, planificare, logistică, producție, calitate și testare , adică exact funcțiile care devin critice când treci de la „design” la „livrare” de hardware. În fragmentul disponibil, el insistă că totul pornește de la oameni cu experiență din companii de semiconductori și hyperscaleri și că „totul este centrat pe calitate”. Notă: transcriptul furnizat este trunchiat spre final, astfel că detaliile despre procesele concrete de fabricație și planificare nu sunt integral disponibile în textul sursă. [...]

Refuzul lui Jensen Huang de a depune mărturie sub jurământ în Senatul SUA ridică miza unei posibile confruntări de reglementare pe exporturile de cipuri AI către China , într-un moment în care Nvidia încearcă să influențeze politica de control al exporturilor fără a intra direct în logica audierilor publice, potrivit The Next Web . Directorul general al Nvidia a respins invitația senatoarei Elizabeth Warren de a apărea joi în fața Comisiei Bancare a Senatului, unde ar fi urmat să discute despre vânzările companiei către China și despre modul în care cipurile Nvidia ajung la cumpărători chinezi, în contextul restricțiilor americane la export. În schimb, Huang a propus un tur al sediului Nvidia din Santa Clara și o discuție „despre tehnologia noastră, ecosistemul american de inteligență artificială și cum putem sprijini leadershipul SUA”. Ce urmărește Senatul: riscul de utilizare militară și „portițele” din controale Warren vrea clarificări privind posibilitatea ca cipurile Nvidia, folosite la antrenarea și rularea (inferența) modelelor de inteligență artificială, să fie redirecționate către aplicații militare în China. În scrisoarea către Huang, senatoarea susține că aceste cipuri nu sunt utilizate doar în industrie, ci și „în scopuri militare”. Totodată, Warren critică regimul de control al exporturilor al Departamentului Comerțului, pe care îl consideră plin de lacune ce ar permite companiilor chineze să obțină cipuri avansate prin filiale din țări precum Singapore, Malaezia și Thailanda . Poziția Nvidia: restricțiile lovesc competitivitatea SUA, nu încetinesc China Huang a argumentat în mod repetat că limitarea vânzărilor către China afectează competitivitatea companiilor americane, fără să oprească dezvoltarea inteligenței artificiale în China. Conform publicației, el face parte din Consiliul de consilieri pentru știință și tehnologie al președintelui Trump și a susținut o abordare în care firmele americane ar avea „prioritate” la cele mai performante cipuri, dar ar putea vinde în continuare produse competitive pe piața chineză. „Ar trebui să ne asigurăm că firmele americane au cele mai bune și cele mai multe și primele”, a spus Huang, în decembrie, potrivit sursei. „Ar trebui să oferim cele mai competitive cipuri pe care le putem pieței chineze.” De ce contează: semnalul politic despre cât de departe merge Congresul The Next Web notează că refuzul de a depune mărturie nu este neobișnuit pentru un CEO din tehnologie, însă „optica” este sensibilă, pe fondul eforturilor lui Warren de a construi un dosar mai amplu de politici publice în jurul inteligenței artificiale (exporturi de cipuri, evaluări voluntare ale modelelor, posibile participații ale guvernului). Următorul pas – dacă Senatul va accepta invitația la sediul Nvidia sau va încerca să-l constrângă pe Huang să apară (de exemplu, printr-o citație) – va indica cât de hotărât este Congresul să escaladeze presiunea asupra celui mai influent furnizor de hardware pentru inteligență artificială. [...]

Perplexity mizează pe un IPO în 2028, pariind pe „a doua fereastră” de listări AI , într-un moment în care OpenAI și Anthropic se grăbesc să ajungă pe bursă încă din 2026, potrivit The Next Web . Mesajul CEO-ului Aravind Srinivas este că planul companiei nu se schimbă, chiar dacă rivalii intră într-o cursă a listărilor. Srinivas a declarat pentru CNBC că Perplexity își păstrează calendarul: compania vizează în continuare o listare publică în 2028, „independent” de mișcările OpenAI și Anthropic. În lectura publicației, poziționarea o transformă într-un „outlier” deliberat într-o piață în care cele mai mari nume din AI se aliniază pentru IPO-uri la distanță de câteva luni. De ce contează: riscul și avantajul de a veni după „primul val” În timp ce OpenAI și Anthropic ar încerca să capteze apetitul investitorilor în 2026, Perplexity pare să parieze pe beneficiile unei listări mai târzii: să observe cum este primit primul val de IPO-uri AI, să construiască un istoric financiar mai lung și să intre pe bursă după ce entuziasmul inițial al pieței fie se confirmă, fie se corectează. Publicația notează și reversul medaliei: „înțelepciunea convențională” spune că primele companii listate într-o fereastră de IPO atrag cea mai mare parte a capitalului. Dacă OpenAI și Anthropic „absorb” cererea pentru acțiuni AI în 2026, Perplexity ar putea găsi în 2028 un bazin mai mic de investitori disponibili. Unde se află Perplexity față de giganți Perplexity a fost evaluată ultima dată la aproximativ 20 miliarde de dolari, după o rundă de finanțare din septembrie 2025, și a atras în total circa 900 milioane de dolari, potrivit articolului. Prin comparație, OpenAI ar fi strâns 122 miliarde de dolari într-o singură rundă, iar Anthropic 30 miliarde de dolari. Compania dezvoltă un „motor de răspunsuri” bazat pe inteligență artificială, concurând cu Google Search, ChatGPT și Claude. Pentru zona corporate, Perplexity are un pachet enterprise la 40 de dolari pe utilizator pe lună (aprox. 184 lei), însă veniturile pentru 2026 nu au fost făcute publice, mai arată sursa. Ce trebuie să se întâmple până în 2028 Potrivit analizei, teza unui IPO în 2028 se sprijină pe două ipoteze: că piața de „căutare AI” va fi suficient de mare pentru a susține o companie listată de sine stătătoare și că Perplexity va rămâne suficient de diferențiată încât să ia o cotă relevantă. Ambele rămân întrebări deschise, în condițiile în care Google integrează agresiv AI în Search, iar ChatGPT este deja interfața AI implicită pentru sute de milioane de utilizatori. În esență, Perplexity pariază că răbdarea va fi mai valoroasă decât urgența — iar piața va valida sau infirma această strategie abia în 2028. [...]

China pregătește un plan de circa 2 trilioane de yuani pentru centre de date, cu efect direct asupra pieței de cipuri AI , potrivit Reuters , care citează un material Bloomberg News. Planul ar viza cheltuieli de aproximativ 2 trilioane de yuani (295,43 miliarde dolari, aprox. 1.360 miliarde lei) în următorii cinci ani pentru construirea de centre de date la nivel național, pe fondul competiției tot mai dure cu SUA în domeniul inteligenței artificiale. Potrivit informațiilor Bloomberg News citate de Reuters, Comisia Națională pentru Dezvoltare și Reformă (NDRC) se numără printre agențiile guvernamentale care elaborează un „plan-cadru” pentru o rețea de hub-uri de calcul interconectate în toată țara. Documentul este încă în discuții incipiente, iar detaliile se pot schimba. Presiune pe furnizorii străini: ținta de 80% tehnologie locală Un element cu impact economic și industrial major este intenția de a se baza pe furnizori locali pentru cel puțin 80% din tehnologie, inclusiv cipuri pentru AI, ceea ce ar reduce semnificativ spațiul pentru jucători americani precum Nvidia și Advanced Micro Devices, conform aceluiași material. În paralel, Reuters amintește că a relatat anterior despre îndrumări ale guvernului chinez potrivit cărora proiectele noi de centre de date care primesc orice fel de finanțare de la stat ar trebui să folosească doar cipuri AI produse pe plan intern—un semnal de continuitate în direcția „autosuficienței tehnologice”. Cine ar opera infrastructura și care e contextul global Bloomberg News mai notează că firme de stat precum China Mobile și China Telecom ar urma să opereze cea mai mare parte a centrelor de date și să asigure conectarea lor în rețea. Contextul este o accelerare a investițiilor în AI la nivel global: Reuters indică faptul că marile companii de tehnologie din SUA sunt așteptate să cheltuiască peste 700 miliarde dolari în acest an pentru planurile lor de extindere a infrastructurii AI. China Mobile, China Telecom și NDRC nu au răspuns imediat solicitărilor Reuters pentru comentarii. [...]