Știri
Tag: tpu

Cipurile TPU ale Google au ajuns la 121 exaflopși, o miză directă pentru costul și viteza rulării modelelor AI : potrivit Google Cloud , cea mai nouă generație de Tensor Processing Units (TPU) poate procesa 121 exaflopși putere de calcul și vine cu o lățime de bandă dublă față de generațiile anterioare, într-un moment în care sarcinile de lucru pentru inteligență artificială devin tot mai „grele”. TPU-urile sunt cipuri specializate, proiectate „pentru un singur job”: efectuarea de calcule matematice la scară foarte mare, necesare pentru antrenarea și rularea modelelor AI. Google spune că le-a proiectat „de la zero” în urmă cu mai bine de un deceniu, tocmai pentru a rula astfel de modele. De ce contează pentru companii: performanță mai mare pe infrastructură dedicată AI În practică, creșterea de putere de calcul și de lățime de bandă are impact operațional: poate reduce timpii de procesare pentru sarcini AI și poate susține modele mai mari sau mai multe cereri simultane, în funcție de modul în care sunt folosite aceste resurse în infrastructură. Google își poziționează TPU-urile ca infrastructură din spatele produselor sale de zi cu zi, subliniind că aceste cipuri sunt construite pentru a accelera calculele care stau la baza funcționării modelelor AI. Ce a comunicat concret Google Din informațiile publicate, elementele tehnice punctuale sunt: TPU = „Tensor Processing Unit”, cip personalizat pentru calcule matematice la scară mare; proiectate de Google de peste un deceniu pentru rularea modelelor AI; cea mai nouă generație: 121 exaflopși și lățime de bandă dublă față de generațiile anterioare. Materialul include și un video explicativ despre modul în care funcționează TPU-urile, fără alte detalii financiare sau de disponibilitate comercială în textul extras. [...]

Google își accelerează strategia de a reduce dependența de Nvidia prin discuții cu Marvell Technology pentru dezvoltarea a două cipuri dedicate inteligenței artificiale, într-un demers care ar putea influența costurile și capacitatea de livrare a Google Cloud, potrivit ITmedia . Informația, atribuită de ITmedia publicației The Information, indică negocieri între Google (parte a Alphabet) și Marvell pentru a crea două componente noi menite să ruleze mai eficient modele de inteligență artificială. Miza este dublă: performanță mai bună pentru sarcini AI și o alternativă mai credibilă la plăcile grafice (GPU) Nvidia, care domină infrastructura de antrenare și inferență pentru AI. Două cipuri, două roluri: memorie și procesare AI Potrivit materialului, proiectul ar include: un „memory processing unit” (unitate de procesare a memoriei) , concepută să funcționeze împreună cu TPU -urile Google (Tensor Processing Unit – acceleratoare dezvoltate de Google pentru calcule AI); un nou TPU , proiectat special pentru rularea modelelor de inteligență artificială. ITmedia notează că Google lucrează de mai mult timp la poziționarea TPU ca alternativă viabilă la GPU-urile Nvidia folosite pe scară largă în industrie. De ce contează pentru Google Cloud și investitori Articolul leagă direct această inițiativă de presiunea asupra Google de a demonstra investitorilor că investițiile în AI se transformă în rezultate comerciale. În acest context, vânzările de TPU sunt prezentate ca un factor important pentru creșterea veniturilor din Google Cloud. Cu alte cuvinte, dacă Google reușește să-și întărească oferta de cipuri proprii (și ecosistemul din jurul lor), poate câștiga atât la nivel de costuri și disponibilitate a infrastructurii, cât și la nivel de diferențiere față de competitori care depind mai mult de Nvidia. Calendar: proiectare posibil finalizată anul viitor Conform informațiilor citate, cele două companii ar urmări ca proiectarea unității de procesare a memoriei să fie finalizată cel mai devreme anul viitor , după care ar urma livrarea pentru producție de test . Materialul nu oferă detalii despre termeni comerciali, volume sau despre momentul în care noul TPU ar putea intra în producție. [...]