Google lansează procesoarele Tensor 8 pentru centrele de date - Reducerea consumului de energie promite beneficii ecologice, dar costurile rămân neclare

22 aprilie 2026, 22:40

Procesoare TPU 8 pentru eficiență energetică în centrele de date Google.

AMZN

$232.07-6.31%GOOGL

$319.77-8.45%

TLDRPe scurt:

01Google a lansat TPU 8t și TPU 8i pentru a separa antrenarea de inferență în centrele de date.
02Noua abordare promite reducerea consumului de energie și costurilor operaționale.
03Separarea hardware-ului poate duce la un impact ecologic mai mic prin eficiență energetică crescută.
04Costurile pentru clienți rămân neclare, deși Google sugerează economii potențiale.

Google își separă noile TPU-uri pentru antrenare și inferență, o schimbare care poate reduce consumul de energie în centrele de date, dar fără garanții că economiile se vor vedea în prețurile plătite de clienți, potrivit Android Authority.

La Cloud Next 2026, compania a anunțat a opta generație de Tensor Processing Units (TPU) pentru centrele sale de date, împărțită în două familii: TPU 8t pentru antrenarea modelelor de inteligență artificială și TPU 8i pentru inferență (rularea efectivă a modelelor, adică generarea de răspunsuri și predicții pe baza a ceea ce au învățat). Miza operațională este folosirea de hardware diferit pentru sarcini cu cerințe diferite, în locul unei abordări „un singur cip pentru toate”.

De ce contează separarea: energie, răcire și costuri de operare

Google susține că această separare răspunde diferențelor de consum și putere de calcul dintre antrenare și inferență. În practică, compania spune că abordarea poate reduce consumul de energie al centrelor de date, ceea ce ar însemna atât costuri operaționale mai mici, cât și un impact de mediu redus.

Publicația notează și un efect colateral invocat în text: dacă inferența devine mai eficientă energetic, utilizarea unor servicii precum Gemini ar putea necesita mai puțină apă pentru răcirea centrelor de date (mențiune formulată ca speranță, nu ca angajament ferm).

Context tehnic, pe scurt: de ce antrenarea „cere” alt hardware decât inferența

Android Authority explică diferența prin natura celor două procese:

Antrenarea rețelelor neuronale este intensă: folosește memorie cu lățime mare de bandă și clustere mari de procesoare, deoarece presupune actualizarea a miliarde de parametri în fiecare secundă. Include „propagarea inversă a erorilor” (backpropagation), adică bucle repetate de feedback prin care modelul este optimizat pe setul de antrenament.
Inferența este, în general, mai puțin solicitantă și poate rula pe hardware mai puțin capabil, cu consum mai mic de memorie.

Concluzia operațională a sursei: folosirea aceluiași hardware pentru ambele tipuri de sarcini poate duce la costuri mai mari, ceea ce ridică „costul efectiv” al inferenței.

Întrebarea rămasă: cine păstrează beneficiul economic

Deși Google pune accent pe beneficiile de mediu ale TPU-urilor dedicate inferenței, Android Authority spune că nu a văzut promisiuni explicite privind reducerea costurilor pentru clienți. Rămâne de văzut dacă economiile din eficiență vor fi transferate către consumatori sau vor rămâne la companie și partenerii săi.

În același context, sursa amintește că Google a mai avut TPU v5e (unde „e” ar veni de la eficiență) pentru operațiuni la scară mai mică, iar TPU 8i ar părea o adaptare pentru scară mare. În paralel, Amazon urmărește o direcție similară cu AWS Inferentia.

Tag-uri:centre date google reducere consum energie tpu 8i cloud next 2026 tensor processing units tpu 8t

AutorEdi Claw

Sursăandroidauthority.com

Google lansează procesoarele Tensor 8 pentru centrele de date - Reducerea consumului de energie promite beneficii ecologice, dar costurile rămân neclare

De ce contează separarea: energie, răcire și costuri de operare

Context tehnic, pe scurt: de ce antrenarea „cere” alt hardware decât inferența

Întrebarea rămasă: cine păstrează beneficiul economic

Articole pe același subiect

Google semnează codul de practică al UE pentru transparența conținutului generat de AI - compania invocă și riscul de „complexitate” de reglementare pe măsură ce soluțiile tehnice evoluează

Reddit renegociază acordul cu Google pentru folosirea postărilor în AI și ia în calcul blocarea accesului - miza: trafic mai mic din Search și un preț „la utilizare”, nu taxă fixă

Google DeepMind lansează Gemini 3.6 Flash, 3.5 Flash-Lite și 3.5 Flash Cyber - mizează pe modele mai ieftine și eficiente, în timp ce Gemini 3.5 Pro rămâne în testare

ANCOM, propusă ca autoritate națională pentru supravegherea aplicării Regulamentului UE privind inteligența artificială - România trebuie să stabilească până la 2 august 2026 cadrul instituțional și regimul de sancțiuni

Nvidia donează Școlii Postuniversitare Navale un supercomputer DGX GB300 cu Blackwell Ultra - primul astfel de sistem în armata SUA, folosit pentru instruirea ofițerilor în limitele și utilizarea responsabilă a AI

Jensen Huang (Nvidia) respinge panica privind pierderea locurilor de muncă din cauza AI - susține că automatizarea schimbă sarcini, nu „joburi”, și avertizează că utilizatorii de AI vor înlocui neutilizatorii