Tag: tensor processing units

Știri despre „tensor processing units”

Tehnologie23 apr. 2026

Google Cloud anunță noi soluții AI la Cloud Next ‘26 - 75% dintre clienții Google Cloud utilizează produsele AI pentru a-și transforma afacerile

Google își accelerează infrastructura pentru „agenți” AI, iar utilizarea în rândul clienților Cloud crește rapid , potrivit Google Blog , care rezumă principalele noutăți prezentate la conferința Google Cloud Next ’26 . Compania spune că aproape 75% dintre clienții Google Cloud folosesc deja produsele sale de inteligență artificială, iar volumul de procesare prin API (interfață de programare) a urcat la peste 16 miliarde de „tokeni” pe minut, de la 10 miliarde în trimestrul anterior. Miza economică și operațională este că Google încearcă să transforme cererea pentru AI „agentic” (sisteme care pot executa sarcini în mod autonom, pe baza unui obiectiv) într-un consum mai mare de infrastructură și servicii cloud, într-un moment în care competiția între furnizori se duce tot mai mult pe capacitate de calcul, cost și guvernanță (control și reguli de utilizare) pentru aplicațiile AI. Ce indică datele de utilizare comunicate de Google În materialul de sinteză, Google oferă câteva repere despre amploarea utilizării: aproape 75% dintre clienții Google Cloud folosesc produse AI ale companiei; 330 de clienți Google Cloud au procesat fiecare „peste un trilion de tokeni” în ultimele 12 luni; modelele Google procesează „peste 16 miliarde de tokeni pe minut” prin utilizare directă via API de către clienți, față de „10 miliarde” în trimestrul anterior. „Tokenii” sunt unități de text (sau fragmente de text) folosite la procesarea limbajului de către modele AI; creșterea volumelor sugerează atât extinderea utilizării, cât și intensificarea încărcării pe infrastructură. Direcția anunțată: platformă pentru agenți și o nouă generație de TPU Google poziționează „transformarea către o întreprindere agentică” drept o evoluție inevitabilă pentru organizații și spune că la Cloud Next ’26 a prezentat „foaia de parcurs” pentru tranziție, cu două repere centrale: Gemini Enterprise Agent Platform , descrisă ca o platformă pentru a construi, scala, guverna și optimiza agenți autonomi; a opta generație de Tensor Processing Units (TPU) , cu „două cipuri specializate” și o abordare „dual-chip” pentru antrenare și inferență (rularea modelului pentru a produce răspunsuri). Materialul nu include detalii de preț, termene de disponibilitate sau specificații tehnice complete în pagina de sinteză, ci trimite către articole separate din colecție. Ce urmează și la ce să se uite companiile Din perspectiva utilizatorilor enterprise, mesajul principal este că Google împinge simultan pe două fronturi: instrumente „deasupra” (platforme pentru agenți, integrare cu datele și procesele) și capacitate „dedesubt” (cipuri și infrastructură de centre de date). Pentru companii, întrebările practice rămân legate de costul total al utilizării (consum de tokeni și calcul), controlul asupra agenților și integrarea cu datele interne — aspecte pe care Google le leagă de noua platformă și de infrastructura dedicată. [...]

Google Cloud anunță noi soluții AI la Cloud Next ‘26 - 75% dintre clienții Google Cloud utilizează produsele AI pentru a-și transforma afacerile

Google lansează procesoarele Tensor 8 pentru centrele de date - Reducerea consumului de energie promite beneficii ecologice, dar costurile rămân neclare