Tehnologie23 apr. 2026
Google Cloud lansează platforma Gemini Enterprise și noi TPUs pentru a sprijini inovația în AI - Investiții semnificative în infrastructură pentru a susține creșterea rapidă a utilizării agenților AI
Google își mută accentul investițiilor de calcul pentru învățare automată către cloud , estimând că în 2026 „puțin peste jumătate” din investiția totală de compute pentru machine learning va merge către Google Cloud, pe fondul creșterii rapide a utilizării modelelor sale prin API și al cererii pentru „mii” de agenți AI în companii, potrivit Google Cloud . În mesajul publicat la Cloud Next 2026, CEO-ul Google și Alphabet, Sundar Pichai, spune că modelele „first-party” ale companiei procesează acum peste 16 miliarde de tokeni pe minut prin utilizare directă via API de către clienți, față de 10 miliarde în trimestrul anterior. Tokenii sunt unități de text folosite de modelele de inteligență artificială pentru a „citi” și „genera” conținut, iar volumul indică presiune în creștere pe infrastructura de calcul. De ce contează: capacitatea de calcul devine un diferențiator comercial Mesajul central este că Google încearcă să transforme cererea pentru agenți AI (programe care pot executa sarcini în mod autonom, pe baza unor obiective) într-un avantaj competitiv pentru Google Cloud, atât prin platforme de management, cât și prin infrastructură dedicată. Pichai descrie o schimbare de la întrebarea „putem construi un agent?” la „cum administrăm mii dintre ei?”, ceea ce mută discuția din zona de prototipuri în zona de operare la scară, cu cerințe de guvernanță (reguli și control), securitate și optimizare a costurilor. Platformă pentru „misiunea de control” a agenților Google spune că a introdus Gemini Enterprise Agent Platform , pe care o prezintă drept o platformă „full-stack” (adică acoperă mai multe straturi tehnice, de la integrare la operare) pentru a construi, scala, guverna și optimiza agenți. Compania leagă această direcție de performanța produsului Gemini Enterprise: în T1, numărul de utilizatori activi lunari plătitori ar fi crescut cu 40% față de trimestrul anterior. Securitate: soluții „agentice” și integrare cu Wiz Pe zona de securitate cibernetică, Google anunță o serie de soluții „agentice” pentru detecția amenințărilor, ca parte a unei platforme de securitate alimentate de AI care combină Threat Intelligence și Security Operations ale Google cu platforma de securitate cloud și AI a Wiz. Tot aici, compania menționează lansarea Wiz AI Application Protection Platform (AI-APP) , descrisă ca oferind protecție autonomă „de la cod la cloud și runtime” (adică inclusiv în faza de rulare a aplicațiilor), în medii multi-cloud, hibride și AI. Infrastructură: TPU-uri generația a 8-a, separate pentru antrenare și inferență Google introduce a opta generație de TPU (Tensor Processing Unit) , cipuri specializate pentru sarcini de inteligență artificială, cu o abordare în două variante: TPU 8t , optimizat pentru antrenare: poate scala până la 9.600 TPU și 2 petabytes de memorie partajată într-un singur „superpod”; ar oferi de trei ori puterea de procesare față de Ironwood și până la 2 ori mai multă performanță pe watt. TPU 8i , optimizat pentru inferență (rularea modelelor deja antrenate): conectează 1.152 TPU într-un singur pod, cu scopul de a reduce latența; are de trei ori mai mult SRAM „on-chip” și este poziționat pentru a rula „milioane de agenți” concomitent, „cost-eficient”. Google precizează că va oferi aceste TPU-uri clienților cloud, alături de o ofertă de instanțe cu GPU NVIDIA. „Customer zero”: utilizare internă ca argument de eficiență În același text, Pichai susține că Google folosește intern propriile tehnologii ca „customer zero” (primul client), inclusiv în dezvoltare software și operațiuni: 75% din codul nou la Google ar fi „generat de AI și aprobat de ingineri”, față de 50% în toamna trecută; un proiect de migrare de cod realizat de agenți și ingineri ar fi fost finalizat de șase ori mai repede decât era posibil cu un an în urmă doar cu ingineri; în securitate, agenții din centrul de operațiuni ar triaja automat zeci de mii de rapoarte neorganizate lunar, reducând timpul de atenuare a amenințărilor cu peste 90%; în operațiuni de marketing, utilizarea modelelor ar fi dus la un timp de execuție cu 70% mai rapid și o creștere a conversiilor cu 20% pentru lansarea Gemini în Chrome. Google indică faptul că va reveni cu noutăți la Google I/O, programat pe 19 mai. [...]