Google colaborează cu patru parteneri pentru a construi o rețea de aprovizionare cu cipuri destinate inferenței AI - Strategia vizează reducerea costurilor și competiția directă cu Nvidia

21 aprilie 2026, 11:32

Cipuri AI avansate pentru eficiență și costuri reduse în tehnologie.

TLDRPe scurt:

01Google colaborează cu Broadcom, MediaTek, Marvell și Intel pentru a dezvolta cipuri AI.
02Strategia vizează reducerea dependenței de Nvidia și optimizarea costurilor pentru inferență.
03TPU-urile proiectate vor fi fabricate de TSMC, cu livrări planificate până în 2031.
04Google intenționează să producă aproape două milioane de unități de procesare dedicate inferenței.

Google își diversifică agresiv lanțul de aprovizionare pentru cipuri AI, mizând pe patru parteneri ca să reducă dependența de Nvidia în inferență, potrivit The Next Web. Strategia combină mai mulți furnizori de proiectare, o relație unică de fabricație cu TSMC și o foaie de parcurs care merge de la TPU-ul „Ironwood” (deja livrat) până la procesoare pe 2 nanometri așteptate în 2027.

Miza este economică și operațională: inferența (rularea modelelor pentru utilizatori) devine costul dominant în AI, iar Google încearcă să obțină un cost mai mic „pe interogare” prin cipuri dedicate, în locul GPU-urilor generaliste.

Ce face Google diferit: patru parteneri, roluri separate

Programul de cipuri al Google este construit în jurul a patru parteneri de proiectare, cu responsabilități împărțite pe segmente:

Broadcom: gestionează variantele de înaltă performanță și proiectează TPU v8 pentru antrenare („Sunfish”), țintind procesul TSMC pe 2 nm pentru finalul lui 2027. Google și Broadcom au semnat pe 6 aprilie un acord pe termen lung pentru livrări până în 2031 (TPU-uri și componente de rețea).
MediaTek: proiectează varianta optimizată pe cost pentru inferență a TPU v8 („Zebrafish”), tot pentru TSMC 2 nm în finalul lui 2027. Implicarea MediaTek a început cu module I/O și componente periferice la Ironwood, unde designurile sale ar fi cu 20–30% mai ieftine decât alternativele.
Marvell: este în discuții cu Google pentru o unitate de procesare a memoriei și un nou TPU orientat pe inferență; dacă se semnează contractul, ar deveni un al treilea partener de design pe această zonă. Google ar intenționa să producă aproape două milioane de astfel de unități, cu finalizarea designului așteptată anul viitor.
Intel: are un acord multianual (din 9 aprilie) pentru procesoare Xeon și unități personalizate de procesare pentru infrastructura centrelor de date AI ale Google, acoperind straturile de rețea și calcul general care „înconjoară” TPU-urile, nu acceleratoarele AI propriu-zise.

Indiferent de partenerul de proiectare, TSMC fabrică toate cipurile personalizate ale Google, ceea ce face relația cu producătorul taiwanez un element structural al strategiei.

Ironwood, „capul de pod” în inferență

Piesa centrală „de azi” este Ironwood, a șaptea generație TPU și primul cip Google proiectat explicit pentru inferență. Conform articolului, Ironwood oferă:

de 10 ori performanța de vârf a TPU v5p;
192 GB memorie HBM3E per cip și 7,2 TB/s lățime de bandă;
scalare până la 9.216 cipuri răcite cu lichid într-un „superpod”, cu 42,5 exaflopși FP8.

Ironwood este deja disponibil pentru clienții Google Cloud, iar Google intenționează să producă milioane de unități în acest an. Anthropic s-a angajat la până la un milion de TPU-uri, iar Meta are un aranjament de închiriere, potrivit sursei.

De ce contează: inferența schimbă economia AI

Rațiunea strategică invocată este că antrenarea unui model de vârf este un eveniment intens, dar relativ „punctual”, în timp ce inferența este continuă și crește cu fiecare utilizator și produs care integrează AI. La scara Google (căutări augmentate cu AI, conversații Gemini, apeluri API), costul per inferență devine determinant pentru profitabilitatea întregului business AI.

În acest context, Google încearcă să atace punctul forte al Nvidia nu printr-un „cip unic” superior, ci printr-un sistem de cipuri specializate pe sarcini și costuri, care să reducă treptat ponderea hardware-ului Nvidia în infrastructura proprie.

Cifrele și ce urmează la Cloud Next

Articolul menționează proiecții de livrări totale TPU de 4,3 milioane de unități în 2026, cu o creștere la peste 35 de milioane până în 2028. Totodată, TrendForce ar estima că vânzările de cipuri personalizate (ASIC – circuite integrate proiectate pentru o sarcină specifică) vor crește cu 45% în 2026, față de 16% pentru livrările de GPU-uri, iar piața ar putea ajunge la 118 miliarde dolari (aprox. 531 miliarde lei) până în 2033.

Google Cloud Next începe miercuri, la Las Vegas, cu keynote-uri susținute de Sundar Pichai și Thomas Kurian. Evenimentul este așteptat să detalieze arhitectura următoarei generații de TPU și legătura dintre Ironwood și generația v8. În paralel, Nvidia ar încerca să rămână relevantă și în ecosistemul de cipuri personalizate, inclusiv prin investiția de 2 miliarde dolari (aprox. 9 miliarde lei) în Marvell și prin programul NVLink Fusion, conform sursei.

Tag-uri:tsmc marvell google broadcom ironwood intel mediatek

AutorEdi Claw

Sursăthenextweb.com

Google colaborează cu patru parteneri pentru a construi o rețea de aprovizionare cu cipuri destinate inferenței AI - Strategia vizează reducerea costurilor și competiția directă cu Nvidia

Ce face Google diferit: patru parteneri, roluri separate

Ironwood, „capul de pod” în inferență

De ce contează: inferența schimbă economia AI

Cifrele și ce urmează la Cloud Next

Articole pe același subiect

Google negociază cu Marvell dezvoltarea a două cipuri AI pentru a contracara Nvidia - Compania își propune să îmbunătățească eficiența în rularea modelelor de inteligență artificială și să crească veniturile din serviciile cloud

Sondaj eJobs: 80% dintre angajatori nu anticipează scăderea recrutării din cauza AI în următorii doi ani - Competențele căutate se vor schimba, iar 47% utilizează AI sporadic

Amazon investește până la 25 de miliarde de dolari în Anthropic - Asigură un angajament cloud de 100 de miliarde de dolari pe 10 ani

Google AI oferă abonaților Pro și Ultra acces extins la AI Studio - Utilizatorii beneficiază de limite de utilizare crescute și modele avansate pentru dezvoltarea rapidă a aplicațiilor

Laboratorul AI al lui Jeff Bezos, Prometheus, aproape de o finanțare de 10 miliarde de dolari - Evaluarea totală ar putea ajunge la 38 miliarde de dolari, consolidându-i poziția în sectorul tehnologic

Deutsche Telekom promovează AI suveran și 6G pentru industria germană - Investiții de 6 miliarde de euro anual pentru infrastructură și tehnologie