Inteligență artificială20 mai 2026
Google crește investițiile în infrastructura AI la 180–190 mld. dolari în 2026 - miza: extinderea Gemini și a agenților 24/7 în Search, Chrome și Workspace
Google ridică miza investițiilor în infrastructura pentru AI la 180–190 mld. dolari (aprox. 828–874 mld. lei) în 2026 , pe fondul creșterii accelerate a utilizării modelelor Gemini și a extinderii „agenților” (software care poate executa sarcini în numele utilizatorului) în produse precum Search, Docs sau aplicația Gemini, potrivit Google Workspace . În textul atribuit CEO-ului Sundar Pichai , compania leagă direct această escaladare a cheltuielilor de capital (capex) de nevoia de a susține atât cererea din partea consumatorilor, cât și pe cea a dezvoltatorilor și companiilor, într-un moment în care AI trece de la funcții punctuale la fluxuri de lucru „agentice”, care rulează în fundal și consumă multă putere de calcul. De ce contează: costul AI devine o decizie de buget, nu doar de produs Google indică o accelerare puternică a volumelor procesate de modelele sale, folosind „tokenii” (unități de date procesate de modele) ca indicator de adopție. Compania spune că a ajuns la „peste 3,2 cvadrilioane” de tokeni procesați pe lună, după ce cu doi ani înainte era la 9,7 trilioane, iar anul trecut la aproximativ 480 trilioane. În paralel, Google susține că: peste 8,5 milioane de dezvoltatori folosesc lunar modelele sale pentru a construi aplicații și experiențe noi; API-urile (interfețe de programare) procesează aproximativ 19 miliarde de tokeni pe minut; în ultimele 12 luni, peste 375 de clienți Google Cloud au procesat fiecare mai mult de un trilion de tokeni. Acest context explică de ce compania mută discuția din zona „funcții noi” în zona „capacitate industrială”: fără investiții masive în centre de date și cipuri dedicate, extinderea AI în produse de masă și în mediul enterprise devine greu de susținut la costuri și timpi de răspuns acceptabili. Infrastructură: TPU 8t/8i și antrenare distribuită la scară mare Google afirmă că în 2022 cheltuia anual 31 mld. dolari (aprox. 143 mld. lei) în capex, iar în 2026 estimează un nivel de circa șase ori mai mare, la 180–190 mld. dolari (aprox. 828–874 mld. lei). O componentă centrală este „siliciul” propriu, adică cipurile TPU (Tensor Processing Unit) , dedicate sarcinilor de inteligență artificială. Compania prezintă a 8-a generație de TPU, cu o abordare „dual chip”: TPU 8t , optimizat pentru antrenare (pretraining), despre care Google spune că are aproape de trei ori puterea brută de calcul față de generația anterioară și poate distribui antrenarea pe mai multe locații, la o scară de „peste 1 milion de TPU-uri” la nivel global; TPU 8i , orientat spre inferență (rularea modelelor în producție), unde accentul este pe viteză și latență. Google mai susține că ambele cipuri sunt mai eficiente energetic, cu „până la două ori” performanță per watt. Efect operațional: presiune pe bugetele de AI și promisiunea de reducere a costurilor În aceeași logică a costurilor, compania introduce Gemini 3.5 Flash , pe care îl descrie ca fiind „frontier” (la vârful performanței) și, totodată, rapid. Google afirmă că modelul ar fi „la mai puțin de jumătate din prețul” modelelor comparabile și oferă un exemplu de economii: dacă firmele ar muta 80% din sarcini de la alte modele de top către 3.5 Flash, ar putea economisi „peste 1 miliard de dolari anual” (aprox. 4,6 mld. lei). Este o estimare a companiei, nu un rezultat auditat independent în text. Google mai spune că folosește intern 3.5 Flash în platforma sa „agent-first” Antigravity și că a crescut de la „jumătate de trilion” la „peste trei trilioane” de tokeni procesați pe zi în instrumentele interne pentru dezvoltatori. Ce urmează: agenți în produse și funcții cu lansare etapizată Pe partea de produse, Google descrie o extindere a funcțiilor conversaționale și „agentice”: Docs Live , o funcție bazată pe voce pentru crearea de documente, este anunțată ca urmând să fie disponibilă „în această vară” pentru abonați; compania spune că funcții similare de voce vor ajunge și în Gmail și Keep; Ask YouTube intră în testare, cu lansare mai largă în SUA „în această vară”; Gemini Spark , un „agent personal” care rulează 24/7 pe mașini virtuale dedicate în Google Cloud, începe să fie livrat către „testeri de încredere”, iar versiunea beta este programată pentru abonații Google AI Ultra din SUA; în Search, Google anunță „information agents” care rulează în fundal și apar „în această vară”, inițial pentru abonații Google AI Pro și Ultra, plus interfețe generate dinamic („generative UI”) gratuite „în această vară”. Separat, compania pune accent și pe trasabilitatea conținutului generat de AI: SynthID ar fi marcat „peste o sută de miliarde” de imagini și videoclipuri și „șaizeci de mii de ani” de active audio, iar verificarea „Content Credentials” ar urma să fie extinsă în Search și Chrome, cu noi parteneri anunțați pentru adoptarea SynthID (inclusiv OpenAI, Kakao și Eleven Labs). Pentru companii, mesajul central este că următoarea etapă a AI nu mai înseamnă doar integrarea unui asistent în aplicații, ci operarea la scară a unor agenți care execută sarcini în fundal — ceea ce mută discuția către infrastructură, cost pe utilizare și control operațional. [...]