Știri
Știri din categoria Inteligență artificială

Google își reproiectează acceleratoarele TPU pentru a rula antrenarea și inferența pe același cip, iar pentru generația TPUv9 „Triggerfish” a apelat din nou la MediaTek, potrivit Wccftech. Miza este una operațională: reducerea fragmentării între cipuri dedicate (separat pentru antrenare și pentru inferență) și simplificarea modului în care sunt comutate sarcinile de lucru în aplicații de tip „agentic AI” (modele care execută pași multipli și iau decizii pe parcurs).
Din informațiile citate de publicație, TPUv9 „Triggerfish” ar urma să combine capabilități de antrenare și inferență într-o singură soluție, cu câteva elemente tehnice orientate direct spre utilizare în centre de date:
Wccftech, citând un raport FundaAI, notează că seria TPUv9 este așteptată să intre în producție de masă în T3 2027, cu „Humufish” primul, urmat de „Triggerfish” în T4 2027, iar ambele ar urma să ajungă la „volume ramp” (creștere accelerată a producției) în 2028.
În același context, publicația menționează o estimare potrivit căreia livrările totale de TPU în 2027 ar putea fi de circa 10–11 milioane de unități. Este o proiecție din surse de analiză, nu o cifră confirmată oficial de Google.
Materialul mai indică o posibilă împărțire a rolurilor între producție și ambalare (packaging), într-un moment în care ambalarea avansată a devenit un blocaj pentru industria de cipuri AI:
Pentru partea de memorie, articolul afirmă că:
HBM (High Bandwidth Memory) este memoria cu lățime de bandă foarte mare folosită în acceleratoare AI, iar trecerea la generații noi este relevantă pentru performanță și disponibilitate, în condițiile în care cererea globală rămâne ridicată.
Dincolo de numele de cod, direcția indicată de aceste informații sugerează că Google încearcă să consolideze antrenarea și inferența într-o singură platformă TPU, reducând dependența de configurații separate și optimizând comutarea sarcinilor în aplicații „agentic AI”. Dacă planul de producție (T3/T4 2027) se confirmă, următoarea etapă de urmărit va fi cum își împarte Google efectiv producția și ambalarea între TSMC și Intel, într-o piață în care capacitatea de packaging avansat a devenit la fel de critică precum fabricarea propriu-zisă.
Recomandate

Google intră direct în lanțul de producție din Hollywood cu o investiție de 75 milioane de dolari (aprox. 345 milioane lei) în studioul independent A24, într-un parteneriat de cercetare cu Google DeepMind care vizează dezvoltarea de instrumente de inteligență artificială pentru realizarea de filme, potrivit The Next Web . Tranzacția, raportată inițial de Wall Street Journal , este prima participație de capital a Google într-un studio de film. Miza nu este accesul la conținut, ci integrarea tehnologiei în fluxul creativ: A24 primește acces „pe teren” la infrastructura de cercetare DeepMind, iar DeepMind obține feedback în timp real de la regizori și echipe aflate în producție, pe măsură ce își construiește noile instrumente. Cum e construit acordul și de ce contează pentru date și drepturi Un element-cheie al înțelegerii este limitarea explicită a accesului la conținut: acordul nu oferă Google acces la biblioteca existentă de film și televiziune a A24 și nici la datele de conținut ale studioului. În plus, parteneriatul este descris ca fiind: multianual și neexclusiv (A24 nu este obligat să folosească doar instrumentele Google); structurat astfel încât Google să nu poată antrena modele pe catalogul A24 . În practică, această arhitectură încearcă să reducă una dintre cele mai sensibile teme din industrie: folosirea materialelor protejate de drepturi de autor pentru antrenarea modelelor de inteligență artificială. Primele utilizări: schițe vizuale (storyboard) generate cu AI Un proiect aflat deja în derulare la A24 Labs vizează folosirea AI pentru a genera storyboard-uri — schițe vizuale aproximative utilizate de regizori pentru planificarea scenelor înainte de filmare. Scott Belsky, partener A24 și liderul diviziei tehnologice a studioului, a spus pentru Wall Street Journal că multe înțelegeri AI din Hollywood sunt prezentate greșit, ca promisiuni de a face filme „mai ieftine și mai rapide”, în loc de „mai bune”. La rândul său, CEO-ul DeepMind, Demis Hassabis, a indicat că obiectivul este dezvoltarea de instrumente care „îi împuternicesc pe artiști”, construite împreună cu ei „din prima zi”, nu în izolare. Context: competiția pentru „AI-ul de producție” se intensifică Acordul vine într-un moment în care marile companii din tehnologie și divertisment își fixează poziții în zona instrumentelor AI pentru producție: Netflix a cumpărat în martie startup-ul InterPositive (fondat de Ben Affleck), obținând instrumente exclusive de post-producție antrenate pe filmări reale, și a creat ulterior INKubator, un studio intern de animație „AI-native”. Martin Scorsese a devenit consilier la Black Forest Labs și folosește modelul FLUX pentru storyboard-uri. OpenAI susține „Critterz”, un lungmetraj animat asistat de AI, cu buget sub 30 milioane de dolari (aprox. 138 milioane lei), prezentat la Cannes, produs într-un interval de nouă luni. În acest peisaj, A24 are o poziție aparte: studioul și-a construit un brand puternic în filmul independent, iar publicația notează că date de sondaj citate de mai multe outlet-uri arată că peste jumătate dintre spectatori se declară fani ai studioului ca brand, nu doar ai unor titluri individuale. De ce investiția e mică pentru Google, dar relevantă strategic Pentru Google, 75 milioane de dolari sunt o sumă modestă raportată la cheltuielile de capital estimate de Alphabet pentru 2026, între 175 și 185 miliarde de dolari. Relevanța acordului este însă strategică: poziționarea DeepMind ca partener preferat de cineaști — „ales, nu respins” — într-o industrie în care negocierile legate de utilizarea AI în muncă și producție rămân un subiect sensibil. Separat, publicația amintește și un risc de guvernanță și reputație: Amazon a renunțat recent la un film aproape finalizat despre Sam Altman, pe fondul relatărilor că producția ar fi prezentat nefavorabil partenerul său de investiții, OpenAI. Episodul este un exemplu despre cum legăturile financiare dintre companii de tehnologie și studiouri pot genera conflicte editoriale — o dinamică pe care parteneriatul Google–A24 ar putea fi nevoit să o gestioneze pe măsură ce instrumentele dezvoltate ajung să fie folosite în producții reale. [...]

HyperLight a atras 80 mil. dolari (aprox. 368 mil. lei) într-o rundă condusă de jucători-cheie din lanțul de producție hardware , un semnal că industria începe să parieze pe o alternativă la siliciu pentru interconectările optice necesare clusterelor uriașe de GPU-uri, potrivit The Next Web . Pe măsură ce infrastructura de inteligență artificială se extinde spre sute de mii de GPU-uri, „gâtul de sticlă” se mută de la cipuri la legăturile dintre ele: conexiunile din cupru, folosite pentru a transporta date, ajung la limite de viteză și consum energetic. În acest context, industria încearcă să mute traficul de date pe fibră/optică, adică pe lumină. Pariul HyperLight: niobat de litiu în strat subțire, nu siliciu HyperLight, companie desprinsă din Harvard și cu sediul în Cambridge (Massachusetts), dezvoltă componente pe bază de „thin-film lithium niobate” (TFLN) – niobat de litiu în strat subțire –, un material folosit pentru a converti semnale electrice în semnale optice la viteză mare, cu consum redus și pierderi mici, conform aceleiași surse. Majoritatea competitorilor construiesc optica pe siliciu („silicon photonics”). HyperLight susține că TFLN poate performa mai bine, mai ales pe măsură ce cresc vitezele de interconectare. Compania spune că platforma sa „Chiplet” ar acoperi, într-un design fabricabil, atât legături scurte din centrele de date, cât și conexiuni mai lungi, de tip telecom. În stadiul actual, HyperLight afirmă că: produse la 200G per bandă sunt deja livrate; componente la 400G per bandă sunt în faza de testare la clienți („sampling”). De ce contează: finanțarea vine de la cei care pot fabrica și cumpăra tehnologia Miza rundei nu este doar suma, ci componența investitorilor. Finanțarea a fost condusă de MediaTek , iar printre investitori se află Foxconn și Jabil (producție/assemblare), UMC (turnătorie/„foundry”), EDBI (Singapore), CDIB-TEN Capital (Taiwan) și Qatar Investment Authority. Publicația interpretează această structură ca pe un indiciu de „aliniere de ecosistem”: adică firmele care ar putea produce la scară și integra tehnologia în lanțurile lor de aprovizionare au un interes direct în reușita ei. CEO-ul Mian Zhang este citat astfel: „Această finanțare este despre mai mult decât capital. Este despre alinierea ecosistemului.” Ce urmează și care este limita informațiilor Potrivit articolului, banii vor merge către capacitate de producție , calificarea la clienți (procesul prin care un furnizor este validat pentru utilizare în produse/instalații) și relații mai strânse cu partenerii de tip foundry . În același timp, The Next Web notează explicit o rezervă: afirmațiile tehnice sunt ale companiei , iar o parte dintre investitori ar beneficia direct dacă TFLN devine materialul dominant pentru interconectările optice din infrastructura AI. În final, adoptarea la scară va depinde de piață și de capacitatea de a produce în volum, nu de anunțul de finanțare. [...]

Google își folosește bilanțul pentru a atrage clienți de centre de date către propriile cipuri TPU, replicând mecanismele de finanțare care au alimentat ascensiunea Nvidia , potrivit The Next Web . Miza nu este doar tehnologică, ci financiară: garanții și structuri de tip „finanțare circulară” pot muta cererea de la GPU-urile Nvidia către alternative, dar cresc și dependența industriei de datorie pentru extinderea infrastructurii AI. Garanții de miliarde pentru a împinge TPU-urile în centrele de date Un exemplu central este un cluster de centre de date pentru AI din vestul statului New York, cunoscut ca Lake Mariner . Acolo, Google ar fi oferit o garanție financiară de 3,2 miliarde de dolari (aprox. 14,7 miliarde lei), conform unei investigații The Wall Street Journal citate de publicație. Dezvoltatorii sitului, TeraWulf și furnizorul de cloud FluidStack (susținut de Google), ar urma să închirieze putere de calcul de la mii de unități TPU ale Google către Anthropic . Efectul economic al garanției este reducerea costului finanțării: centrul de date poate atrage datorie mai ieftină, un mecanism pe care Nvidia l-ar fi folosit în mod repetat pentru a stimula cererea pentru propriile cipuri. „Finanțarea circulară”: banii se întorc sub formă de comenzi de cipuri A doua tactică descrisă este „finanțarea circulară”, un aranjament în care o parte din banii investiți de producătorul de cipuri se întorc la acesta sub formă de achiziții ale propriilor produse. În aceeași logică, Google ar susține mai multe proiecte legate de Anthropic, inclusiv: un centru de date de 7 miliarde de dolari (aprox. 32,2 miliarde lei) numit River Bend, lângă Baton Rouge; încă 1,4 miliarde de dolari (aprox. 6,4 miliarde lei) în garanții pentru un contract de închiriere de capacitate de calcul în Colorado City, Texas. Aceste inițiative se suprapun peste un acord amplu de capacitate de calcul între Google și Broadcom (menționat de publicație) și peste un aranjament de credit privat de circa 35 miliarde de dolari (aprox. 161 miliarde lei), intermediat de Apollo și Blackstone, care cumpără TPU-uri Google și le închiriază către Anthropic. De ce contează: presiune reală pe „șanțul” Nvidia, dar și risc mai mare pe datorie Google nu mai păstrează TPU-urile doar pentru uz intern. Publicația notează că, în mai, compania a spus că va începe să vândă TPU-uri direct clienților și a prezentat primul cip construit special pentru „inferință” (rularea interogărilor AI, nu antrenarea modelelor). Totodată, Google a anunțat un acord de 5 miliarde de dolari (aprox. 23 miliarde lei) cu Blackstone pentru lansarea unei companii de cloud care vizează furnizori susținuți de Nvidia, precum CoreWeave și Nebius, și a indicat luna aceasta că ar urma să strângă 85 miliarde de dolari (aprox. 391 miliarde lei) capital propriu, în mare parte pentru infrastructură AI. Pe partea operațională, argumentul de cost începe să apară: Citadel Securities, un utilizator timpuriu, spune că rulează unele sarcini cu costuri cu 30% mai mici și cu viteze de până la patru ori mai mari pe TPU-uri. Nvidia, care deține „peste 90%” din piața cipurilor pentru AI, își apără poziția prin ecosistemul software CUDA și hardware-ul ușor de integrat. Jensen Huang a minimalizat amenințarea, susținând că Anthropic ar fi singurul client extern important pentru TPU-uri și provocând Google să demonstreze că cipurile sunt mai ieftine. Pentru piață, testul real este dacă Google poate transforma avantajul de bilanț într-o schimbare de comportament la nivelul centrelor de date. Dacă modelul prinde, competiția pe cipuri AI se mută parțial din laborator în zona de finanțare — cu un efect secundar: extinderea AI devine și mai dependentă de structuri alimentate de datorie și de mecanisme „circulare”, care pot amplifica riscul în cazul unei încetiniri a cererii. [...]

Întreruperea Claude a lovit simultan chat-ul și API-ul, riscând să blocheze fluxuri de lucru în companii , după ce Anthropic a confirmat că „investighează” problema și implementează o remediere, potrivit TechRadar . Problemele au început în jurul orei 10:02 ET (17:02, ora României), când a apărut un vârf de raportări pe Downdetector . La momentul relatării, numărul sesizărilor din SUA depășise 8.000, semn că incidentul a afectat un volum mare de utilizatori. Ce servicii au fost afectate și ce a comunicat Anthropic Pagina oficială Claude Status a indicat „o rată ridicată de erori” la nivelul modelelor și a transmis că „se implementează o remediere”. Ulterior, statusul a fost actualizat cu mesajul că „o remediere a fost implementată și monitorizăm rezultatele”. Din informațiile publicate, întreruperea a fost una extinsă, vizând: toate modelele Claude; atât conturile gratuite, cât și cele plătite; mai multe platforme Claude (interfața de chat, Claude Code, Claude Cowork și API-ul), cu excepția „Claude for Government”, menționat ca neafectat. Utilizatorii au raportat fie blocarea răspunsurilor („gândește” fără să finalizeze), fie mesaje de tipul „acest model nu este disponibil acum”. Evoluția incidentului: semne de revenire, dar cu întârzieri Pe parcursul zilei, raportările de pe Downdetector au început să scadă, însă mii de utilizatori ar fi rămas în continuare cu probleme, inclusiv în redacția TechRadar . Publicația notează că, după aproximativ o oră de la remedierea anunțată de Anthropic, serviciul a revenit pentru mulți utilizatori, deși cu întârzieri în răspunsuri în unele cazuri. TechRadar compară incidentul cu întreruperea semnificativă din 2 iunie, despre care spune că a fost mai mică și legată de modelul Opus 4.6, în timp ce întreruperea din 23 iunie ar fi fost „mai mare” și extinsă la toate modelele și platformele. De ce contează pentru companii Faptul că au fost afectate atât interfața de chat, cât și API-ul sugerează un impact operațional direct: de la utilizarea zilnică a asistentului în echipe până la aplicații și procese interne care depind de integrarea Claude. Anthropic a indicat că monitorizează situația după implementarea remedierii, ceea ce lasă deschisă posibilitatea unor probleme reziduale pe termen scurt. [...]

SpaceX își consolidează pivotul spre afacerea de „închiriere” de putere de calcul , după ce a semnat cu Reflection AI un contract de circa 6,3 miliarde de dolari (aprox. 29 mld. lei) până în 2029, potrivit The Next Web . Acordul adaugă un nou chiriaș major în centrele de date „Colossus” din Memphis și întărește ideea că SpaceX monetizează infrastructura AI ca linie de business separată, nu doar ca suport pentru propriile modele. Reflection AI va plăti 150 milioane de dolari pe lună (aprox. 690 mil. lei) pentru a închiria cipuri Nvidia în „Colossus 2”, cu plăți începând de la 1 iulie 2026 și până în 2029, suma totală ajungând la aproximativ 6,3 miliarde de dolari, conform CNBC (link în sursă). The Information a relatat prima despre tranzacție, iar contractul permite oricăreia dintre părți să renunțe cu un preaviz de 90 de zile după primele trei luni. Puterea de calcul ar rula pe sisteme Nvidia GB300, menționează publicația. Nvidia, furnizor și investitor în același timp Structura tranzacției este relevantă pentru dinamica pieței: Nvidia nu doar furnizează hardware-ul (cipurile), ci este și investitor în Reflection AI. Tech Funding News (link în sursă) scrie că Nvidia ar fi investit circa 800 milioane de dolari (aprox. 3,7 mld. lei) în startup anul trecut, ceea ce pune compania „de ambele părți” ale contractului: vinde tehnologia și sprijină financiar clientul care o închiriază. Cine este Reflection AI și ce urmărește Reflection AI este un startup „open-source” (în sensul că promovează „open weights” – modele cu parametri publicați, spre deosebire de laboratoarele „închise”), fondat în 2024 de Misha Laskin și Ioannis Antonoglou, ambii foști Google DeepMind; Antonoglou a contribuit la dezvoltarea AlphaGo, potrivit articolului. Compania a atras 2 miliarde de dolari (aprox. 9,2 mld. lei) în octombrie, la o evaluare de 8 miliarde de dolari (aprox. 36,8 mld. lei), cu Nvidia, Sequoia și Lightspeed printre investitori. Acum ar strânge din nou capital la o evaluare de 25 miliarde de dolari (aprox. 115 mld. lei), potrivit Bloomberg (link în sursă). The Next Web notează că Reflection nu a lansat încă un „frontier model” public (model de vârf, la limita performanței curente), iar compania are legături cu proiecte ale Departamentului Energiei din SUA și inițiative AI ale Pentagonului. SpaceX, din constructor de infrastructură pentru Grok în „proprietar” de centre de date Miza economică pentru SpaceX este că „Colossus” a devenit, în practică, o afacere de închiriere de capacitate. Publicația afirmă că SpaceX a construit inițial Colossus pentru Grok (modelul xAI), dar ulterior a transformat situl într-un business de tip „compute landlord”, inclusiv pe fondul faptului că nu ar fi reușit să facă centrul de date să funcționeze pentru propriile modele. Reflection intră într-o listă de chiriași care, potrivit articolului, include deja: Anthropic , cu plăți de aproximativ 1,25 miliarde de dolari pe lună (aprox. 5,75 mld. lei); Google, cu 920 milioane de dolari pe lună (aprox. 4,23 mld. lei). Tech Funding News mai susține (link în sursă) că aceste contracte ar duce SpaceX la peste 80 miliarde de dolari (aprox. 368 mld. lei) venituri angajate din compute până în 2029. Context operațional: Colossus 2 și dimensiunea infrastructurii Colossus 2 este campusul mai nou dintre cele două din Memphis. Colossus 1 ar găzdui deja peste 220.000 de GPU-uri Nvidia, iar SpaceX ar viza ca întregul complex să ajungă la o putere de 2 gigawați, ceea ce ar transforma Memphis într-una dintre cele mai mari concentrări de putere de calcul pentru AI, potrivit articolului. De ce contează Deși contractul cu Reflection (150 milioane de dolari/lună) este mult mai mic decât cel cu Anthropic, The Next Web îl tratează ca pe un semnal: infrastructura SpaceX ajunge să finanțeze, prin capacitate disponibilă, și „tabăra” modelelor deschise din cursa AI. În paralel, pentru Nvidia, tranzacția este încă un exemplu de model în care compania „vinde uneltele” și deține participații în „mina” care le folosește. [...]

Huawei vizează reducerea consumului de energie și a timpului de rulare pentru asistenții AI pe dispozitive , printr-o metodă de „potrivire” automată a modelelor în funcție de capabilitățile hardware, potrivit Huawei Central , care scrie că firma a primit aprobarea pentru un nou brevet pe această direcție. Brevetul, intitulat „An Artificial Intelligence (AI) Communication Method and Device”, descrie o soluție de comunicare între un asistent AI și dispozitive, cu obiectivul de a îmbunătăți eficiența și acuratețea rulării modelelor de tip LLM (modele lingvistice mari) direct pe device. Miza practică este ca utilizatorul să beneficieze de funcții AI mai „potrivite” contextului, fără testări repetate și consumatoare de resurse. Cum ar funcționa mecanismul descris în brevet Conform descrierii, sistemul implică două dispozitive într-un „sistem de comunicare”: un al doilea dispozitiv trimite către primul dispozitiv detalii despre modelele AI, inclusiv date complexe care înregistrează timpul de rulare și consumul de energie pentru diferite modele; după ce primește aceste informații, primul dispozitiv poate testa modelul în funcție de propriile capabilități hardware și poate transmite feedback către al doilea dispozitiv. Publicația notează că soluția introduce un mecanism de auto-verificare și potrivire a funcțiilor AI, astfel încât dispozitivele să nu mai fie nevoite să evalueze modelele „unul câte unul”. În schimb, ar putea determina mai rapid ce model este mai potrivit pentru mediul curent. De ce contează operațional: evaluare mai rapidă, rezultate mai precise În logica brevetului, metoda ar permite evaluarea capabilităților AI „mai ușor și mai eficient”, optimizând în același timp acuratețea rezultatelor evaluării. Sursa nu oferă un calendar de implementare și nici nu confirmă că soluția va ajunge într-un produs comercial; este vorba despre o aprobare de brevet și despre o descriere tehnică a unei posibile abordări. [...]