Știri
Știri din categoria Inteligență artificială

Google își diversifică agresiv lanțul de aprovizionare pentru cipuri AI, mizând pe patru parteneri ca să reducă dependența de Nvidia în inferență, potrivit The Next Web. Strategia combină mai mulți furnizori de proiectare, o relație unică de fabricație cu TSMC și o foaie de parcurs care merge de la TPU-ul „Ironwood” (deja livrat) până la procesoare pe 2 nanometri așteptate în 2027.
Miza este economică și operațională: inferența (rularea modelelor pentru utilizatori) devine costul dominant în AI, iar Google încearcă să obțină un cost mai mic „pe interogare” prin cipuri dedicate, în locul GPU-urilor generaliste.
Programul de cipuri al Google este construit în jurul a patru parteneri de proiectare, cu responsabilități împărțite pe segmente:
Indiferent de partenerul de proiectare, TSMC fabrică toate cipurile personalizate ale Google, ceea ce face relația cu producătorul taiwanez un element structural al strategiei.
Piesa centrală „de azi” este Ironwood, a șaptea generație TPU și primul cip Google proiectat explicit pentru inferență. Conform articolului, Ironwood oferă:
Ironwood este deja disponibil pentru clienții Google Cloud, iar Google intenționează să producă milioane de unități în acest an. Anthropic s-a angajat la până la un milion de TPU-uri, iar Meta are un aranjament de închiriere, potrivit sursei.
Rațiunea strategică invocată este că antrenarea unui model de vârf este un eveniment intens, dar relativ „punctual”, în timp ce inferența este continuă și crește cu fiecare utilizator și produs care integrează AI. La scara Google (căutări augmentate cu AI, conversații Gemini, apeluri API), costul per inferență devine determinant pentru profitabilitatea întregului business AI.
În acest context, Google încearcă să atace punctul forte al Nvidia nu printr-un „cip unic” superior, ci printr-un sistem de cipuri specializate pe sarcini și costuri, care să reducă treptat ponderea hardware-ului Nvidia în infrastructura proprie.
Articolul menționează proiecții de livrări totale TPU de 4,3 milioane de unități în 2026, cu o creștere la peste 35 de milioane până în 2028. Totodată, TrendForce ar estima că vânzările de cipuri personalizate (ASIC – circuite integrate proiectate pentru o sarcină specifică) vor crește cu 45% în 2026, față de 16% pentru livrările de GPU-uri, iar piața ar putea ajunge la 118 miliarde dolari (aprox. 531 miliarde lei) până în 2033.
Google Cloud Next începe miercuri, la Las Vegas, cu keynote-uri susținute de Sundar Pichai și Thomas Kurian. Evenimentul este așteptat să detalieze arhitectura următoarei generații de TPU și legătura dintre Ironwood și generația v8. În paralel, Nvidia ar încerca să rămână relevantă și în ecosistemul de cipuri personalizate, inclusiv prin investiția de 2 miliarde dolari (aprox. 9 miliarde lei) în Marvell și prin programul NVLink Fusion, conform sursei.
Recomandate

Google își accelerează strategia de a reduce dependența de Nvidia prin discuții cu Marvell Technology pentru dezvoltarea a două cipuri dedicate inteligenței artificiale, într-un demers care ar putea influența costurile și capacitatea de livrare a Google Cloud, potrivit ITmedia . Informația, atribuită de ITmedia publicației The Information, indică negocieri între Google (parte a Alphabet) și Marvell pentru a crea două componente noi menite să ruleze mai eficient modele de inteligență artificială. Miza este dublă: performanță mai bună pentru sarcini AI și o alternativă mai credibilă la plăcile grafice (GPU) Nvidia, care domină infrastructura de antrenare și inferență pentru AI. Două cipuri, două roluri: memorie și procesare AI Potrivit materialului, proiectul ar include: un „memory processing unit” (unitate de procesare a memoriei) , concepută să funcționeze împreună cu TPU -urile Google (Tensor Processing Unit – acceleratoare dezvoltate de Google pentru calcule AI); un nou TPU , proiectat special pentru rularea modelelor de inteligență artificială. ITmedia notează că Google lucrează de mai mult timp la poziționarea TPU ca alternativă viabilă la GPU-urile Nvidia folosite pe scară largă în industrie. De ce contează pentru Google Cloud și investitori Articolul leagă direct această inițiativă de presiunea asupra Google de a demonstra investitorilor că investițiile în AI se transformă în rezultate comerciale. În acest context, vânzările de TPU sunt prezentate ca un factor important pentru creșterea veniturilor din Google Cloud. Cu alte cuvinte, dacă Google reușește să-și întărească oferta de cipuri proprii (și ecosistemul din jurul lor), poate câștiga atât la nivel de costuri și disponibilitate a infrastructurii, cât și la nivel de diferențiere față de competitori care depind mai mult de Nvidia. Calendar: proiectare posibil finalizată anul viitor Conform informațiilor citate, cele două companii ar urmări ca proiectarea unității de procesare a memoriei să fie finalizată cel mai devreme anul viitor , după care ar urma livrarea pentru producție de test . Materialul nu oferă detalii despre termeni comerciali, volume sau despre momentul în care noul TPU ar putea intra în producție. [...]

Piața muncii nu pare să se contracte pe fondul AI, dar se reconfigurează pe competențe , arată un sondaj citat de Economedia : 8 din 10 angajatori spun că, în următorii doi ani, vor recruta aproximativ același număr de oameni, însă o parte importantă anticipează că vor căuta candidați cu abilități diferite față de cele cerute acum. Adopția AI în companii rămâne, în mare, la nivel de utilizare „ad-hoc”: 47,4% dintre angajatorii participanți la sondajul eJobs România declară că folosesc soluții bazate pe inteligență artificială sporadic, mai degrabă la inițiativa angajaților decât ca politică internă. Doar 5,2% spun că AI este integrată strategic în majoritatea departamentelor, iar 15,5% au câteva procese clar definite care implică AI. În organizațiile unde există implementări, percepția asupra efectelor este mixtă: angajatorii au observat atât entuziasm și curiozitate, cât și reticență sau indiferență. Potrivit Ralucăi Dumitra, Head of Marketing la eJobs, măsurătorile indică faptul că volumul de muncă nu s-a schimbat, dar calitatea muncii este mai bună. Ce se schimbă operațional: productivitate, control și încredere „moderată” Datele din sondaj indică efecte diferite asupra volumului de muncă: 26% dintre angajatori spun că volumul de muncă a scăzut cu 10% până la peste 20% din timp; 10% afirmă că volumul a crescut, din cauza timpului necesar pentru învățarea și verificarea instrumentelor; alți 10% spun că reducerea volumului de muncă este vizibilă, dar cu rezultate mai slabe calitativ. În paralel, peste jumătate dintre respondenți declară că au o încredere moderată în acuratețea rezultatelor oferite de AI și că acestea necesită verificare amănunțită (fact-checking). 11,4% au încredere scăzută și folosesc AI mai ales pentru generare de idei, în timp ce 33% spun că au un nivel ridicat de încredere și fac doar revizuiri rapide. Recrutarea rămâne, dar criteriile se mută spre „alfabetizare AI” În privința impactului asupra nevoii de personal, 8 din 10 angajatori se așteaptă să angajeze același număr de oameni ca până acum. Jumătate dintre aceștia adaugă însă că vor fi necesare competențe noi. 16% cred că vor angaja mai puțin, deoarece AI va prelua din sarcini, iar 1,2% anticipează o creștere a nevoii de personal pentru gestionarea tehnologiei. În prezent, „alfabetizarea AI” (capacitatea de a folosi instrumente AI și de a formula cerințe eficiente către ele) este mai degrabă un avantaj decât un filtru: 39% dintre angajatori spun că nu o evaluează încă la interviu, iar pentru 17,1% reprezintă un avantaj competitiv major. Barierele: date, competențe digitale și costuri Principalele obstacole menționate de angajatori țin de securitatea și confidențialitatea datelor. Apar și bariere legate de competențele digitale ale angajaților, inclusiv dificultatea de a formula prompturi. În plus, 17,2% indică drept problemă costurile ridicate ale licențelor și implementării, iar 12,6% menționează rezistența culturală a echipei la schimbare. Pe partea de beneficii observate după integrarea AI: aproape 40% indică eliminarea sarcinilor repetitive; 30% văd un plus pe creativitate și generare de idei; 19,8% menționează viteză mai mare de răspuns în piață; 3,7% vorbesc despre reducerea costurilor cu recrutarea și salariile, deoarece angajează mai puțin; 2,5% indică reducerea costurilor operaționale. Sondajul eJobs a fost realizat în martie, pe un eșantion de 196 de companii din 19 domenii, reprezentate de manageri HR, specialiști HR, manageri de departament și antreprenori. [...]

Amazon își securizează pe 10 ani cererea de calcul pentru AI printr-un acord care poate duce investiția în Anthropic la 33 mld. dolari (aprox. 151 mld. lei), în schimbul unui angajament de peste 100 mld. dolari (aprox. 460 mld. lei) cheltuieli cloud pe AWS, potrivit The Next Web . Amazon a convenit să investească „până la” 25 mld. dolari în Anthropic, compania din spatele modelelor Claude, însă structura tranzacției arată că nu este vorba de un cec integral: 5 mld. dolari sunt investiți imediat, iar până la 20 mld. dolari sunt condiționați de atingerea unor obiective comerciale. Suma se adaugă celor 8 mld. dolari pe care Amazon îi angajase deja din 2023, ceea ce ridică investiția potențială totală la circa 33 mld. dolari (aprox. 152 mld. lei). În paralel, Anthropic își asumă un angajament de peste 100 mld. dolari pentru AWS pe următorul deceniu, dar publicația precizează că acesta este un „angajament de achiziție” (procurement pledge), nu o plată în avans: compania se obligă să cumpere capacitate de calcul, cipuri personalizate pentru AI și servicii de infrastructură de la Amazon. Practic, Amazon finanțează Anthropic, iar Anthropic direcționează o parte semnificativă din acești bani către infrastructura Amazon. De ce contează: AWS își blindează cererea și împinge Trainium în centrul AI-ului „frontieră” Miza operațională a acordului este capacitatea de calcul și, implicit, controlul lanțului de aprovizionare pentru antrenarea și rularea modelelor. În centrul înțelegerii se află Trainium, linia de cipuri dezvoltată intern de Amazon ca alternativă la GPU-urile Nvidia pentru antrenare și inferență (rularea modelelor). Acordul acoperă Trainium2, viitorul Trainium3 și Trainium4 (încă nelansat), plus „zeci de milioane” de nuclee CPU Graviton. Anthropic obține până la 5 gigawați de capacitate pentru a antrena și a rula Claude. Amazon afirmă că o capacitate semnificativă Trainium2 intră în funcțiune în trimestrul al doilea din 2026, iar până la finalul anului ar urma să fie disponibil aproape 1 gigawatt combinat Trainium2 și Trainium3. Context: creșterea Anthropic și consolidarea distribuției prin AWS Acordul vine pe fondul unei cereri în creștere rapide, pe care Anthropic o leagă de evoluția veniturilor: compania a ajuns la venituri anualizate de 30 mld. dolari, de la aproximativ 9 mld. dolari la final de 2025. Parteneriatul se adâncește și pe distribuție: clienții AWS vor putea accesa „întreaga Claude Platform” (interfața nativă a Anthropic) direct din conturile lor AWS, fără acreditări sau facturare separate. Este un pas peste disponibilitatea Claude prin Amazon Bedrock, „piața” de AI gestionat a Amazon. În același timp, Claude rămâne, potrivit sursei, singurul model „frontieră” disponibil pe toate cele trei mari platforme cloud: AWS Bedrock, Google Cloud Vertex AI și Microsoft Azure Foundry. Raportul de forțe: Amazon devine partenerul principal de infrastructură The Next Web notează că structura este similară cu un acord de acum două luni, când Amazon ar fi investit 50 mld. dolari în OpenAI în cadrul unui angajament comparabil de 100 mld. dolari pentru cloud. În cazul Anthropic, acordul cu AWS „surclasează” o înțelegere separată din noiembrie 2025, când Microsoft a investit până la 5 mld. dolari în Anthropic, iar compania s-a angajat să cumpere 30 mld. dolari capacitate de calcul pe Azure. Noua înțelegere cu AWS „stabilește ferm Amazon” ca partenerul principal de infrastructură al Anthropic, potrivit articolului. Evaluarea folosită pentru investiția inițială este cea mai recentă evaluare a Anthropic, de 380 mld. dolari. Publicația mai menționează că fonduri de capital de risc ar fi oferit finanțare la evaluări de 800 mld. dolari sau mai mult înaintea unei posibile listări, însă nu a fost anunțată o astfel de rundă. [...]

Abonații Google AI Pro și Ultra primesc limite mai mari în AI Studio , ceea ce mută prototiparea cu modele Gemini într-o zonă cu costuri mai previzibile și cu mai puține fricțiuni pentru dezvoltatorii care au depășit nivelul gratuit, potrivit Google Blog . Actualizarea, disponibilă „începând de astăzi”, crește limitele de utilizare în Google AI Studio pentru abonații Google AI Pro și Ultra și adaugă acces la modele precum Nano Banana Pro și Gemini Pro . Mesajul central al Google este operațional: dezvoltatorii ar putea trece „în câteva minute” de la idee la o aplicație funcțională, cu costuri „previzibile”, în cadrul abonamentului. Ce se schimbă pentru dezvoltatori Pentru cei care au epuizat limitele din varianta gratuită, Google poziționează abonamentul Google AI ca o „punte” cu configurare redusă către facturare, utilă pentru testare și prototipare mai profundă în AI Studio. În paralel, compania menține că pentru lansări la scară de producție standardul rămâne utilizarea cheilor API cu tarifare „per cerere” (pay-per-request). Cum se face trecerea către producție Google susține că, atunci când un proiect este gata de lansare, tranziția de la beneficiile din abonament la o configurare bazată pe API poate fi realizată direct din AI Studio. Publicația nu oferă însă detalii despre nivelurile exacte ale noilor limite sau despre prețuri, dincolo de ideea de „costuri previzibile” în etapa de prototipare. Beneficiile sunt în curs de activare pentru toți abonații AI Pro și Ultra; utilizatorii trebuie să se autentifice cu contul asociat abonamentului pentru a le accesa. [...]

Laboratorul AI „Prometheus”, condus de Jeff Bezos , ar fi aproape de o finanțare de 10 miliarde de dolari (aprox. 46 mld. lei) la o evaluare de 38 miliarde de dolari (aprox. 175 mld. lei) , ceea ce l-ar propulsa între cele mai bine capitalizate start-up-uri aflate încă la început de drum, potrivit IT之家 . Informația este atribuită de publicație unui material Financial Times. Prometheus este descris ca un laborator de „fizică inginerească” aplicată în inteligență artificială, condus de fondatorul Amazon, Jeff Bezos. De ce contează: o rundă care schimbă rapid raportul de forțe în AI Dacă tranzacția se închide în termenii vehiculați, noua rundă ar urma să fie realizată la o evaluare de 38 miliarde de dolari, pentru un total de 10 miliarde de dolari finanțare. Surse citate de Financial Times, potrivit IT之家, spun că investitori precum JPMorgan și BlackRock ar participa la rundă. Publicația notează că tranzacția este așteptată să fie finalizată „în curând”, însă termenii nu ar fi încă definitiv stabiliți, ceea ce indică faptul că detaliile pot suferi modificări până la semnare. Context: start-up-ul ar fi strâns deja 6,2 miliarde de dolari Prometheus ar fi atras în noiembrie anul trecut 6,2 miliarde de dolari (aprox. 28,5 mld. lei) ca finanțare inițială. O nouă infuzie de capital de dimensiunea discutată acum ar consolida rapid capacitatea proiectului de a investi agresiv în infrastructură, echipe și dezvoltare, chiar înainte de a ajunge la maturitate comercială. Ce urmează: discuții pentru o structură de tip holding și achiziții în industrie Separat de această rundă, Prometheus ar purta negocieri pentru finanțarea înființării unei companii de tip holding. Planul menționat în material vizează achiziția, „pentru câteva zeci de miliarde de dolari”, a unor companii din industria prelucrătoare (manufacturieră) ale căror modele operaționale ar putea fi afectate semnificativ de AI, potrivit aceleiași surse. [...]

Deutsche Telekom mizează pe „AI suveran” ca infrastructură pentru industrie , iar mesajul CEO-ului Tim Höttges către companii este că avantajul competitiv va veni din combinația dintre aplicații de inteligență artificială și controlul asupra datelor și platformelor, potrivit Mobile World Live . Declarațiile au fost făcute în keynote-ul de la Hannover Messe , unde executivul a legat direct adoptarea AI în mediile industriale de nevoia unei infrastructuri „suverane”. Höttges a susținut că Germania are „toate ingredientele” pentru a juca un rol global de vârf în ceea ce el a numit „AI fizic” – adică utilizarea AI în medii industriale. În același timp, a avertizat că beneficiile nu vin automat: companiile trebuie să aleagă aplicațiile potrivite și să își reproiecteze procesele de business, ținând cont și de efectele în lanț asupra forței de muncă. „Progresul se întâmplă acolo unde AI și suveranitatea se întâlnesc.” Ce înseamnă „suveranitate” pentru clienții enterprise În oferta către companii, CEO-ul Deutsche Telekom a descris „niveluri” diferite de suveranitate, în funcție de caz de utilizare și industrie. Acestea includ: produse pentru procesarea de date sensibile, astfel încât să fie respectate cerințele de reglementare; „suveranitate operațională” pentru procesele de bază ale afacerii; „suveranitate tehnologică” pentru companiile care vor să își îndepărteze arhitectura IT de furnizori din afara Europei. Investiții și miza 6G pentru industrie Höttges a folosit intervenția și pentru a promova investițiile Deutsche Telekom în Germania orientate către segmentul industrial. Printre acestea se află un proiect „AI Factory” la München, realizat împreună cu partenerii Nvidia, SAP și Siemens, precum și întărirea arhitecturii de rețea pentru a susține tehnologiile actuale și viitoare. Operatorul indică faptul că investește anual 6 miliarde euro (aprox. 30 miliarde lei) în rețele și alte infrastructuri în Germania. În paralel, avansează și dezvoltarea 6G, despre care se așteaptă să permită sisteme capabile să gestioneze operațiunile de rețea „în mare parte autonom”, și să deschidă calea către aplicații noi pentru industrie. [...]