Știri
Știri din categoria Inteligență artificială

Google își separă noile TPU-uri pentru antrenare și inferență, o schimbare care poate reduce consumul de energie în centrele de date, dar fără garanții că economiile se vor vedea în prețurile plătite de clienți, potrivit Android Authority.
La Cloud Next 2026, compania a anunțat a opta generație de Tensor Processing Units (TPU) pentru centrele sale de date, împărțită în două familii: TPU 8t pentru antrenarea modelelor de inteligență artificială și TPU 8i pentru inferență (rularea efectivă a modelelor, adică generarea de răspunsuri și predicții pe baza a ceea ce au învățat). Miza operațională este folosirea de hardware diferit pentru sarcini cu cerințe diferite, în locul unei abordări „un singur cip pentru toate”.
Google susține că această separare răspunde diferențelor de consum și putere de calcul dintre antrenare și inferență. În practică, compania spune că abordarea poate reduce consumul de energie al centrelor de date, ceea ce ar însemna atât costuri operaționale mai mici, cât și un impact de mediu redus.
Publicația notează și un efect colateral invocat în text: dacă inferența devine mai eficientă energetic, utilizarea unor servicii precum Gemini ar putea necesita mai puțină apă pentru răcirea centrelor de date (mențiune formulată ca speranță, nu ca angajament ferm).
Android Authority explică diferența prin natura celor două procese:
Concluzia operațională a sursei: folosirea aceluiași hardware pentru ambele tipuri de sarcini poate duce la costuri mai mari, ceea ce ridică „costul efectiv” al inferenței.
Deși Google pune accent pe beneficiile de mediu ale TPU-urilor dedicate inferenței, Android Authority spune că nu a văzut promisiuni explicite privind reducerea costurilor pentru clienți. Rămâne de văzut dacă economiile din eficiență vor fi transferate către consumatori sau vor rămâne la companie și partenerii săi.
În același context, sursa amintește că Google a mai avut TPU v5e (unde „e” ar veni de la eficiență) pentru operațiuni la scară mai mică, iar TPU 8i ar părea o adaptare pentru scară mare. În paralel, Amazon urmărește o direcție similară cu AWS Inferentia.
Recomandate

Google împinge cumpărăturile second-hand spre „căutare asistată de AI” , prin funcții din Search și Shopping care ajută utilizatorii să găsească produse similare, să compare prețuri și chiar să estimeze valoarea de revânzare, potrivit Google Blog . Miza practică este reducerea fricțiunii din piața de resale (revânzare) – de la descoperire și verificare, până la decizia de cumpărare sau vânzare. În contextul în care interesul de căutare pentru „vintage” și „how to thrift” a atins maxime istorice în 2026, Google își poziționează instrumentele ca „strat” de orientare pentru cumpărăturile de obiecte second-hand și vintage, inclusiv pentru căutări aflate în trend precum „vintage jersey” și „thrifted heels”. Ce se schimbă operațional pentru utilizatori: 5 funcții, un singur flux Google descrie cinci moduri prin care Search poate „ridica nivelul” cumpărăturilor de tip thrift/vintage, cu accent pe căutare vizuală și întrebări în limbaj natural: AI Mode în Search : utilizatorii pot formula întrebări detaliate pentru a-și planifica „ieșirea la thrift”, iar răspunsurile includ opțiuni și detalii relevante, plus linkuri pentru documentare. Exemplul din articol combină căutarea de „tricouri vintage” cu o condiție logistică (brunch fără gluten în apropiere). Google Lens pentru identificare și context : prin fotografierea unui obiect în magazin, Lens poate afișa potriviri vizuale și permite întrebări despre designer sau perioadă („din ce eră este?”). Tot aici apare componenta cu impact direct în tranzacție: utilizatorul poate vedea la ce preț se vinde online și câte oferte similare există, pentru a evalua dacă e „piesă rară” sau produs comun. Circle to Search (Android) : utilizatorul încercuiește un obiect văzut pe ecran, iar funcția caută rapid produse similare, prețuri și locuri de cumpărare; apoi pot urma întrebări de rafinare (de exemplu, stiluri cu „vibe” de anii ’90). Virtual Try-On : un „cabina de probă” digitală. Utilizatorul găsește un produs similar cu Lens, apasă „try it on” și încarcă o fotografie full-body pentru a vedea cum ar arăta purtat. Lens pentru vânzare din propria garderobă : Google sugerează folosirea Lens pentru a estima cât ar valora un obiect la revânzare și ce tip de magazine ar cumpăra astfel de produse („Could I resell this?”). De ce contează: mai multă transparență de preț și mai puține „achiziții la ghici” Din perspectiva pieței, setul de funcții descris de Google mută o parte din „munca” specifică second-hand (identificare, autentificare informală prin comparații, orientare de preț) în interfața de căutare. În practică, asta poate crește transparența pentru cumpărători și poate accelera decizia de achiziție sau revânzare, mai ales când utilizatorul compară rapid cu ofertele online. Google nu oferă în material date despre lansări pe piețe, disponibilitate în România sau rezultate măsurabile (de tip conversii ori economii), astfel că impactul concret depinde de accesul efectiv la aceste funcții și de cât de bine acoperă ofertele locale. [...]

Inteligența artificială a devenit în SUA principalul motiv invocat pentru concedieri , după ce angajatorii au atribuit tehnologiei 40% din cele 97.006 posturi desființate în luna mai, potrivit HotNews , care citează un raport Challenger, Gray & Christmas. Miza economică este că AI nu mai apare doar ca promisiune de productivitate, ci ca justificare operațională imediată pentru reducerea costurilor cu personalul. Raportul indică faptul că este cea mai mare rată lunară de când Challenger a început, în 2023, să urmărească impactul inteligenței artificiale asupra pierderilor de locuri de muncă. În total, în 2026, 87.714 concedieri au fost atribuite AI, peste nivelul de 54.836 raportat pentru 2025. „Datele noastre arată că firmele deja acționează în acest sens, invocând inteligența artificială mai mult decât orice alt motiv pentru a face mai multe reduceri”, a declarat Andy Challenger, director de venituri la Challenger, Gray & Christmas. Concedieri la cel mai ridicat nivel din 2020, cu tehnologia în frunte Per ansamblu, Challenger a constatat că în mai 2026 s-a înregistrat cel mai mare număr de concedieri din 2020, când au fost anunțate 397.016 concedieri în vârful pandemiei. Sectorul tehnologic rămâne domeniul cu cele mai multe concedieri, „cu o marjă mare”, potrivit raportului. Cât din „vina AI” este reală: contestări din industrie și din zona macro Atribuirea concedierilor către AI este contestată inclusiv de actori din ecosistemul tehnologic. CEO-ul OpenAI, Sam Altman , a spus recent că unele firme își „spală” concedierile dând vina pe tehnologie. Separat, economistul-șef al Apollo Global Management , Torsten Sløk, a scris că nu vede „nicio dovadă a pierderilor de locuri de muncă din cauza inteligenței artificiale”, invocând Raportul național privind ocuparea forței de muncă al ADP. Alte sectoare care au redus personal în mai Dincolo de AI, raportul notează tăieri și în alte industrii: Farmaceutice : 5.045 reduceri în mai; 12.485 în primele cinci luni din 2026 (în creștere cu 753% față de 1.463 până în mai 2025). Administrații federale/statale/locale : 4.499 reduceri în mai; 15.918 în 2026 (în scădere cu 94% față de 284.827 până în mai 2025, când au predominat reducerile legate de DOGE). Media : 436 reduceri în mai; 3.390 în 2026 (minus 17% față de 4.107 în primele cinci luni ale anului trecut). În paralel, până acum în 2026, cele mai frecvente motive invocate de angajatori pentru concedieri au fost „condițiile de piață și economice” (69.645), falimentele (66.733) și „restructurarea” (52.249), ceea ce sugerează că AI se suprapune peste un context mai larg de ajustare a costurilor. Pentru detalii, raportul Challenger este disponibil aici . [...]

NVIDIA și SK hynix își leagă pe mai mulți ani dezvoltarea de memorii avansate, într-o mișcare menită să reducă riscul de blocaje de aprovizionare pe fondul extinderii „fabricilor de AI”. Parteneriatul, prezentat de NVIDIA News , aliniază co-dezvoltarea de memorii „next-generation” la foaia de parcurs a infrastructurii NVIDIA și vizează explicit susținerea capacității de livrare, într-un domeniu cu cicluri lungi de dezvoltare și investiții mari în producție. Acordul pornește de la colaborarea tehnică existentă dintre cele două companii și pune accent pe faptul că, pe măsură ce centrele de date dedicate AI se extind global, memoria avansată devine un factor critic de performanță și disponibilitate pentru platformele de calcul. În acest context, parteneriatul este descris ca un mecanism de a ține pasul cu cererea și cu ritmul de evoluție al infrastructurii NVIDIA. „Fabricile de AI sunt motoarele următoarei revoluții industriale, iar memoria avansată este esențială pentru performanța lor”, a declarat Jensen Huang, fondator și CEO al NVIDIA. Ce acoperă parteneriatul: produse și piețe vizate În cadrul acordului multianual, SK hynix ar urma să co-dezvolte memorii pentru mai multe familii de produse NVIDIA, pe segmente diferite, de la infrastructură la dispozitive: supercomputerele AI NVIDIA Vera Rubin și procesoarele NVIDIA Vera ; PC-uri cu NVIDIA RTX Spark ; platforme de calcul pentru robotică NVIDIA Jetson Thor . Publicația notează și intenția SK hynix de a se diversifica în piețe pe care NVIDIA le dezvoltă în jurul infrastructurii AI, „personal AI” și „physical AI” (AI aplicată în sisteme care interacționează cu lumea fizică). AI în proiectarea și fabricația de cipuri: simulări accelerate și „ digital twins ” O componentă operațională importantă a colaborării este folosirea AI în proiectarea și producția de semiconductori. SK hynix utilizează bibliotecile NVIDIA CUDA-X și cadrul NVIDIA PhysicsNeMo pentru a accelera simulările din zona de proiectare și fabricație, inclusiv fluxuri de lucru de tip TCAD (Technology Computer-Aided Design – simulări pentru proiectarea tehnologiilor de fabricație) și litografie computațională, precum și coduri interne de inginerie. Separat, SK hynix dezvoltă „digital twins” (gemeni digitali – replici virtuale ale fabricilor) pentru operațiuni autonome în fabrici, combinând NVIDIA Omniverse , optimizări de scene 3D prin OpenUSD și motorul de optimizare decizională NVIDIA cuOpt . În același pachet este menționată și platforma NVIDIA Metropolis , pentru analiză video inteligentă în medii industriale. De ce contează pentru piață Mesajul central al acordului este legat de securizarea și extinderea aprovizionării cu memorie avansată într-un moment în care „fabricile de AI” se construiesc și se extind rapid, iar dezvoltarea și fabricarea memoriilor de ultimă generație presupun cicluri lungi și investiții de capital ridicate. În practică, parteneriatul încearcă să reducă presiunea pe lanțul de aprovizionare și să sincronizeze mai strâns evoluția memoriei cu cerințele viitoare ale platformelor NVIDIA. Companiile mai menționează că explorează conectarea gemenilor digitali cu software-ul existent și fluxuri de lucru bazate pe „agentic AI” (sisteme AI care pot planifica și executa sarcini), pentru a automatiza activități și a îmbunătăți deciziile în producție. Materialul nu oferă însă un calendar, volume de livrare sau valori financiare ale acordului. [...]

SK Telecom vizează construirea unui AI Cloud de „scară gigawatt” în Coreea, cu prima „fabrică AI” planificată pentru 2027 , într-un parteneriat tehnologic cu NVIDIA care mizează pe eficiență energetică și cost mai mic per unitate de calcul pentru aplicații industriale și enterprise, potrivit NVIDIA News . Inițiativa folosește platforma NVIDIA DSX (o arhitectură „full-stack”, adică de la cipuri și sisteme până la software și operațiuni) ca „plan” de proiectare pentru centre de date optimizate pentru sarcini de inteligență artificială. În logica anunțului, miza este ca infrastructura să producă „token-uri” (unități de procesare folosite în modele generative) la cost cât mai redus și cu eficiență energetică ridicată, într-un context în care consumul de energie și accesul la acceleratoare (GPU) devin constrângeri operaționale majore pentru extinderea AI. Ce construiește SK Telecom și de ce contează operațional SK Telecom spune că AI Cloud-ul va susține servicii de tip „sovereign AI” (modele și date operate sub control național/organizațional), „physical AI” (AI aplicată în sisteme fizice, precum robotică și producție) și „agentic AI” (agenți software care execută sarcini), pentru companii și industrii din Coreea, cu o viziune de extindere în regiuni mai largi din Asia. Compania își bazează proiectul pe infrastructura proprie de rețea, centre de date și competențe enterprise, iar NVIDIA DSX este prezentată ca un set integrat de tehnologii care ar accelera „timpul până la producție” (cât de repede poate fi pusă în funcțiune o capacitate AI utilizabilă comercial) și ar îmbunătăți performanța raportată la energie („token performance per megawatt”). Elemente de colaborare și utilizări deja anunțate Parteneriatul este poziționat ca o extindere a colaborării dintre NVIDIA și grupul SK, inclusiv către cercetare comună pentru „arhitecturi de fabrici AI” de generație următoare, cu accent pe optimizări „de la siliciu la rețea” (cipuri, memorie și operarea centrelor de date). În paralel, SK Telecom indică proiecte conexe care conturează tipul de aplicații vizate: utilizarea „digital twins” (replici digitale ale unor procese/instalații) în fabrici de semiconductori SK hynix , pe baza bibliotecilor NVIDIA Omniverse (detalii suplimentare sunt menționate de SK Telecom aici: https://news.sktelecom.com/en/3077 ); adoptarea seturilor de date open-source NVIDIA Nemotron pentru antrenarea modelului A.X K1, în cadrul proiectului guvernamental coreean „Sovereign AI Foundation Model Project”. Totodată, SK Telecom urmează să devină „NVIDIA Cloud Partner”, adică parte dintr-un program global prin care furnizorii folosesc infrastructura și ecosistemul NVIDIA pentru a livra servicii AI în cloud. Ce urmează Calendarul explicit din anunț indică drept reper punerea în funcțiune a primei „fabrici AI” în 2027 . Dincolo de acest termen, materialul nu oferă detalii despre investiții, capacitate instalată (în GPU) sau clienți contractați, astfel că impactul economic nu poate fi cuantificat pe baza informațiilor publicate acum; accentul rămâne pe arhitectura tehnică și pe ținta de scalare la nivel „gigawatt”. [...]

NAVER își extinde infrastructura de „sovereign AI” de la 55 MW spre scară de gigawați , mizând pe platforma NVIDIA DSX pentru a proiecta și opera „fabrici de AI” (centre de date optimizate pentru antrenare și rulare de modele) într-un moment în care cererea globală pentru servicii AI trece tot mai mult din faza de test în producție, potrivit NVIDIA News . Extinderea începe cu creșterea infrastructurii la GAK Sejong , un centru de date hyperscale din Sejong, Coreea de Sud, descris ca fiind proiectat pentru densități mari de calcul accelerat (hardware specializat pentru AI), cu operațiuni eficiente energetic, automatizare avansată, funcții de sustenabilitate și capabilități de răspuns la dezastre. Obiectivul declarat este să poată deservi companii, industrii și instituții publice, inclusiv clienți globali ai diviziei de AI cloud. De ce contează: energia și „costul pe token” devin criterii de competitivitate Mesajul central al proiectului este trecerea la o infrastructură dimensionată în megawați și, ulterior, în gigawați, într-o industrie în care costul de operare al AI este tot mai strâns legat de consumul energetic și de eficiența cu care centrele de date pot produce „tokeni” (unități de text generate/procesate de modele). NVIDIA susține că DSX oferă un „blueprint” (plan standardizat) de fabrică de AI care urmărește reducerea costului pe token și scurtarea timpului până la primele implementări în producție. În această logică, NAVER își poziționează infrastructura ca alternativă „de încredere” pentru guverne și companii care au cerințe de conformitate locală și suveranitate a datelor, în special pe piețe unde astfel de condiții sunt decisive în achiziția de servicii cloud. Ce construiește NAVER și unde se vede impactul operațional Planul anunțat vizează: construirea de „AI factories” pe platforma NVIDIA DSX™ la scară de gigawați, pornind de la 55 MW; extinderea cloudului bazat pe DSX în jurul centrului de date GAK Sejong; folosirea unei suite „full-stack” NVIDIA (platforme, modele și software) pentru modele regionale și servicii de tip „agentic AI” (sisteme care pot executa sarcini în mod autonom, pe baza unor obiective). Publicația mai precizează că NAVER combină DSX cu experiența proprie în operarea de clustere GPU la scară mare și centre de date hyperscale, cu intenția de a accelera și businessul său de centre de date pentru AI. Legătura cu produsele AI: HyperCLOVA X, agenți și „world model” Pe partea de modele și aplicații, NAVER spune că își avansează modelele HyperCLOVA X prin ajustarea (fine-tuning) modelului deschis NVIDIA Nemotron™ 3 Ultra cu date proprietare și expertiză proprie de antrenare, pentru a obține un model mai adaptat cultural și lingvistic. În plus, compania este prezentată ca prima din Coreea care participă în NVIDIA Nemotron Coalition (anunțată de NVIDIA pe blogul companiei, aici: NVIDIA Nemotron Coalition ) și afirmă că intenționează să lanseze o platformă de agenți AI în Coreea în a doua jumătate a anului, bazată pe „blueprints” NVIDIA NemoClaw™ . Separat, NAVER dezvoltă un „Seoul World Model” folosind date urbane proprietare și tehnologie de modelare spațială, pe baza NVIDIA Cosmos™ . Ce urmează Conform anunțului, extinderea pornește de la 55 MW și are ca direcție trecerea la scară de gigawați, cu DSX ca platformă de proiectare și operare a fabricilor de AI. Materialul nu oferă un calendar detaliat sau investiții estimate, dar indică faptul că NAVER își aliniază infrastructura la cererea în creștere pentru AI „în producție”, inclusiv pentru clienți din afara Coreei, în contexte unde suveranitatea datelor și conformitatea locală sunt criterii de selecție. [...]

O firmă chineză ar folosi IA pentru „supraveghere predictivă”, adică anticiparea potențialilor disidenți înainte ca aceștia să acționeze , potrivit Digi24 . Miza depășește zona drepturilor civile: modelul descris arată cum instrumentele de analiză avansată a datelor pot muta controlul statului „mai devreme în lanț”, cu efecte directe asupra modului în care sunt proiectate și exportate tehnologii de supraveghere. Informațiile pleacă de la documente scurse pe internet, citate de The Times, dintr-o scurgere mai amplă care ar viza două firme asociate cu aparatul științific de stat chinez și folosite în arhitectura de administrare a internetului cunoscută drept „Marele Firewall”. O analiză a Institutului de Securitate Națională de la Universitatea Vanderbilt, menționată în material, susține că una dintre companii ar utiliza inteligența artificială pentru a procesa volume mari de date despre indivizi – de la obiceiuri zilnice și călătorii până la relații și istoricul de navigare – pentru a construi profiluri comportamentale și a anticipa comportamente viitoare. Cum ar funcționa „supravegherea predictivă” Firma indicată în articol, Geedge Networks , ar încerca să dezvolte un sistem care agregă mai multe tipuri de date într-un profil unic pentru fiecare persoană, cu scopul de a deduce intenții și riscuri înainte ca o eventuală disidență să devină vizibilă, potrivit raportului academic citat. În studiul menționat de Digi24, cercetătorii descriu schimbarea de paradigmă astfel: „Motivul care determină acțiunea statului nu mai este ceva ce a făcut cetățeanul. Este ceva ce statul crede că cetățeanul va face.” Tot acolo, „supravegherea predictivă” este prezentată ca un mecanism care mută intervenția statului mai devreme, prin identificarea persoanelor și rețelelor care „ar putea deveni” o amenințare și prin deducerea intenției. Componenta comercială: clienți externi și export de tehnologie Deși Geedge este descrisă ca firmă privată, materialul arată că ar face parte dintr-un ecosistem de companii rezultate din cercetări supravegheate de Academia Chineză de Științe , care pot vinde servicii către agenții guvernamentale (inclusiv Ministerul Securității de Stat), către clienți privați și, cu aprobarea Beijingului, către guverne străine. Printre clienții enumerați în articol se află Myanmar, Pakistan, Etiopia și Kazahstan, ceea ce sugerează o dimensiune de export a infrastructurii de control al internetului și a instrumentelor asociate. Separat, în scurgerea de documente este menționată și o a doua firmă, Golaxy, specializată în utilizarea datelor pentru a dezvolta „personalități AI” care ar putea fi folosite pentru a viza și, dacă este necesar, a manipula indivizi. Blocajul tehnologic: dependența de GPU-uri și restricțiile SUA Un element operațional important din material este dependența de cipuri de ultimă generație (GPU-uri – unități de procesare grafică, folosite intens în antrenarea și rularea modelelor de inteligență artificială). Digi24 notează că Geedge ar fi fost încetinită de o penurie de astfel de cipuri, fabricate în principal de companii americane precum Nvidia și AMD. Articolul menționează restricțiile impuse de administrația Biden la vânzarea acestor cipuri către China și faptul că președintele Trump le-ar fi relaxat ulterior în contextul războaielor comerciale de anul trecut, însă fără reluarea vânzărilor pentru unele modele-cheie. În același context, funcționari americani anonimi citați de The New York Times ar fi estimat că Geedge ar avea suficiente GPU-uri pentru produsele actuale, dar nu și pentru a transforma în realitate modelul de IA „predictiv”. Context: controlul opiniei publice și prevenirea protestelor Materialul plasează aceste evoluții în strategia mai largă a Partidului Comunist Chinez de a „ghida” opinia publică și de a preveni apariția bruscă a mișcărilor de protest, cu referire la demonstrațiile din Piața Tiananmen din 1989 și la represiunea din noaptea de 3-4 iunie. Sunt amintite și pedepse repetate pentru activism neautorizat, precum și rețeaua de centre de detenție din Xinjiang, prezentate ca instrumente proactive de control social. În ansamblu, cazul descris indică o direcție în care inteligența artificială nu este folosită doar pentru monitorizare, ci pentru anticipare – iar limitările de acces la hardware avansat devin, implicit, un instrument de politică externă și de control al capacităților tehnologice. [...]