Știri
Știri din categoria Inteligență artificială

Nvidia pregătește lansarea unui nou cip dedicat inteligenței artificiale, bazat pe tehnologia companiei Groq, anunțul urmând să fie făcut de CEO-ul Jensen Huang la conferința GTC 2026 din San Jose, potrivit Nvidia News.
Evenimentul anual GPU Technology Conference (GTC) se desfășoară între 16 și 19 martie 2026 și va reuni peste 30.000 de participanți din peste 190 de țări, fiind unul dintre cele mai importante evenimente globale dedicate tehnologiei AI. În discursul de deschidere, programat luni la ora 11:00 PT, Jensen Huang ar urma să prezinte mai multe inovații majore din portofoliul Nvidia.
Cel mai așteptat anunț este un procesor specializat pentru inferență AI, realizat pe baza tehnologiei startup-ului Groq, companie pe care Nvidia a cumpărat-o în decembrie 2025 pentru aproximativ 20 de miliarde de dolari.
Noul sistem ar urma să rezolve una dintre limitările actuale ale infrastructurii Nvidia. GPU-urile companiei sunt extrem de eficiente pentru antrenarea modelelor de inteligență artificială, dar devin mai puțin eficiente în etapa de inferință – procesul prin care modelele AI generează răspunsuri în timp real, precum în cazul asistenților de cod sau al agenților AI.
Tehnologia Groq, bazată pe arhitecturi cu memorie SRAM de mare viteză, este optimizată pentru generarea rapidă de „tokeni” – unitățile de bază ale textului produse de modelele AI.
În paralel, compania este așteptată să prezinte și noua platformă Vera Rubin, succesorul arhitecturii Blackwell utilizate în prezent în centrele de date AI.
Noua platformă ar include:
Analiștii estimează că performanța ar putea fi de 3,3 până la 5 ori mai mare decât generația Blackwell în anumite sarcini AI.
Pe lângă hardware, Nvidia ar putea prezenta și NemoClaw, o platformă open-source pentru dezvoltarea de agenți AI autonomi. Interesant este că software-ul ar putea funcționa și pe cipurile competitorilor, nu doar pe hardware Nvidia.
Compania a discutat deja posibilul proiect cu giganți tehnologici precum:
Totuși, parteneriate oficiale nu au fost confirmate până în prezent.
Anunțurile vin într-un moment complicat pentru sectorul semiconductorilor. Exporturile de cipuri AI către China sunt limitate de politica comercială a SUA, care a permis doar livrări condiționate ale procesoarelor H200, cu plafonarea vânzărilor la jumătate din nivelul pieței interne.
În prezent, Nvidia susține că nu mai generează venituri din centre de date din China, pe fondul acestor restricții.
CEO-ul Jensen Huang a rezumat miza actuală a industriei AI astfel: „Inteligența artificială nu mai este doar o aplicație sau o descoperire izolată. Ea devine infrastructură esențială pentru fiecare companie și pentru fiecare națiune”.
Recomandate

Giganți din industria tehnologică, printre care AMD, Microsoft, NVIDIA și OpenAI, au anunțat formarea unui consorțiu pentru dezvoltarea unui standard deschis de interconectare optică destinat infrastructurilor AI. Inițiativa poartă numele Optical Compute Interconnect Multi-Source Agreement ( OCI MSA ) și vizează modul în care vor fi conectate sistemele de calcul din centrele de date care rulează modele de inteligență artificială de mari dimensiuni. Consorțiul reunește șase membri fondatori: AMD, Broadcom, Meta, Microsoft, NVIDIA și OpenAI . Scopul principal este definirea unei specificații tehnice comune care să permită echipamentelor produse de companii diferite să funcționeze împreună în infrastructurile AI de tip hyperscale. De ce apare această inițiativă Creșterea rapidă a dimensiunii clusterelor AI pune presiune pe tehnologiile de interconectare utilizate în prezent în centrele de date. Conexiunile tradiționale pe cupru devin limitate în ceea ce privește lățimea de bandă, consumul energetic și distanța la care pot transmite date. Prin urmare, consorțiul propune trecerea către interconectări optice , care folosesc fibre și semnale optice pentru a transmite date între procesoare, acceleratoare AI și echipamente de rețea. Obiectivele consorțiului Potrivit anunțului, OCI MSA urmărește trei direcții principale: definirea unei specificații deschise și interoperabile pentru interconectările utilizate în clustere AI de mari dimensiuni; sprijinirea tranziției industriei de la conexiuni pe cupru la interconectări optice cu consum redus de energie ; dezvoltarea unui ecosistem multi-vendor , care să reducă dependența de soluții proprietare și să permită interoperabilitatea echipamentelor produse de companii diferite. Ce prevede prima specificație tehnică Prima specificație publicată de consorțiu descrie o interfață optică de aproximativ 200 Gbps , destinată conexiunilor din interiorul centrelor de date. Sistemul utilizează tehnici precum multiplexarea pe lungimi de undă și transmisia bidirecțională pe aceeași fibră, pentru a crește densitatea conexiunilor și eficiența energetică. Documentul tehnic stabilește și parametri pentru sincronizare, corecția erorilor și funcționarea transceiverelor optice pe distanțe tipice din centrele de date, de până la aproximativ 500 de metri de fibră optică . Context Standardele de interconectare sunt considerate critice pentru infrastructura AI deoarece performanța modelelor depinde nu doar de puterea GPU-urilor sau a acceleratoarelor, ci și de viteza cu care acestea pot comunica între ele. Prin crearea unui standard deschis, companiile implicate încearcă să faciliteze dezvoltarea infrastructurilor AI de mari dimensiuni și să accelereze adoptarea tehnologiilor optice în centrele de date. [...]

Nvidia a investit în Thinking Machines Lab , startupul de inteligență artificială fondat de fosta directoare tehnologică a OpenAI, Mira Murati , într-un parteneriat strategic care prevede utilizarea masivă a cipurilor companiei pentru dezvoltarea unor modele AI de ultimă generație, potrivit informațiilor publicate de The Wall Street Journal . Acordul presupune implementarea a cel puțin un gigawatt de cipuri Nvidia pentru antrenarea și rularea sistemelor de inteligență artificială dezvoltate de Thinking Machines Lab. De asemenea, cele două companii vor colabora pentru a construi infrastructuri dedicate antrenării și implementării modelelor AI la scară foarte mare. Startupul lansat de Mira Murati în februarie 2025 a crescut rapid în industria tehnologică. În iulie 2025, compania a atras 2 miliarde de dolari într-o rundă de finanțare de tip seed , evaluând startupul la aproximativ 12 miliarde de dolari , potrivit datelor publicate de Reuters . Echipa Thinking Machines Lab include mai mulți cercetători importanți din domeniul AI, printre care foști membri ai OpenAI, iar compania lucrează la dezvoltarea unor sisteme multimodale capabile să interacționeze cu utilizatorii prin conversație, imagini și alte forme naturale de comunicare . Investiția face parte din strategia mai amplă a Nvidia de a susține financiar și tehnologic companii care dezvoltă modele de inteligență artificială. Producătorul de cipuri a participat în ultimii ani la finanțări pentru mai multe startupuri majore din domeniu, inclusiv OpenAI, Anthropic, xAI sau Mistral AI. Parteneriatul cu Thinking Machines Lab ar putea folosi noua platformă de hardware Vera Rubin , anunțată de Nvidia pentru 2026, care promite performanțe de inferență mult mai eficiente decât arhitectura actuală Blackwell. [...]

Modelul AI „Avocado” dezvoltat de Meta ar putea fi amânat , după ce testele interne au arătat că sistemul nu reușește să egaleze performanțele celor mai noi modele create de Google și Anthropic, potrivit Benzinga . Modelul „Avocado” este conceput ca un sistem de inteligență artificială fundamental care ar urma să stea la baza viitoarelor produse AI ale Meta, inclusiv chatboți, instrumente de programare asistată de inteligență artificială și alte aplicații integrate în platformele companiei. În cadrul testelor interne, sistemul a arătat rezultate mai bune decât generațiile anterioare de modele dezvoltate de Meta și chiar a depășit o versiune mai veche a modelului Google Gemini . Cu toate acestea, potrivit unor persoane familiarizate cu proiectul, performanțele sale nu reușesc să ajungă la nivelul celei mai recente versiuni Gemini și nici la cele ale modelelor dezvoltate de compania Anthropic. Din acest motiv, conducerea Meta ar fi decis să își reevalueze calendarul de lansare. Dacă inițial compania plănuia să prezinte modelul în martie 2026, lansarea ar putea fi amânată cel puțin până în luna mai. În paralel, există discuții interne privind posibilitatea ca Meta să licențieze temporar tehnologie bazată pe modelul Gemini al Google pentru a susține anumite produse AI, însă o decizie finală nu a fost anunțată. Întârzierea apare într-un moment în care Meta investește masiv în dezvoltarea inteligenței artificiale, domeniu considerat esențial pentru strategia companiei conduse de Mark Zuckerberg . Pentru anul 2026, Meta estimează cheltuieli de până la 135 de miliarde de dolari pentru infrastructură și dezvoltarea tehnologiilor AI, aproape dublu față de aproximativ 72 de miliarde de dolari investite anul trecut. În paralel cu „Avocado”, compania lucrează și la alte modele aflate în dezvoltare, printre care „Mango”, dedicat generării de imagini și video, și un sistem viitor cu numele de cod „Watermelon”, toate acestea făcând parte din planul Meta de a concura direct cu liderii actuali ai industriei AI. [...]

Inteligența artificială începe să schimbe radical modul în care este scris software-ul , iar mulți programatori spun că rolul lor se transformă din autori de cod în „arhitecți” care coordonează agenți AI, potrivit unei analize publicate de The New York Times . Articolul, bazat pe interviuri cu peste 70 de dezvoltatori de la companii precum Google, Amazon sau Microsoft, descrie o schimbare majoră în industrie: în tot mai multe cazuri, inteligența artificială scrie cea mai mare parte a codului , iar programatorii doar explică în limbaj natural ce vor să construiască și verifică rezultatul. Programatorii discută cu AI-ul, nu mai scriu cod Un exemplu este Manu Ebert, cofondator al start-up-ului Hyperspell, care folosește Claude Code – un instrument dezvoltat de compania Anthropic. În trecut, dezvoltarea unei funcții software putea dura o zi întreagă; acum, AI-ul poate genera și testa codul în aproximativ 30 de minute. În loc să scrie manual fiecare linie de program, dezvoltatorii: descriu ce trebuie să facă aplicația analizează planul propus de AI verifică testele și rezultatele generate automat Astfel, munca programatorilor devine mai apropiată de designul și arhitectura sistemelor software decât de scrierea efectivă a codului. Productivitatea ar putea crește de zeci de ori Mai mulți dezvoltatori spun că AI-ul le crește productivitatea semnificativ. Unele estimări indică: creșteri de 10 până la 20 de ori în start-up-uri până la 100 de ori mai rapid pentru anumite sarcini simple aproximativ 10% creștere a eficienței în companii foarte mari precum Google În firmele mari, unde există miliarde de linii de cod vechi, AI-ul este util mai ales pentru: analizarea codului existent găsirea erorilor sugerarea de modificări sau optimizări Programatorii devin „arhitecți” ai sistemelor În noul model de lucru, dezvoltatorii se concentrează mai mult pe: proiectarea sistemului software coordonarea agenților AI verificarea calității codului generat Mulți programatori spun că se simt mai degrabă „arhitecți” care proiectează sistemul , în timp ce AI-ul face munca de construcție. Impactul asupra pieței muncii Schimbarea ridică însă și întrebări despre viitorul profesiei. Date analizate de economiști de la Stanford arată că numărul locurilor de muncă pentru programatori foarte tineri a scăzut cu aproximativ 16% din 2022 , sugerând că posturile de început ar putea fi cele mai afectate. În același timp, există și argumentul invers: dacă dezvoltarea software devine mult mai ieftină și rapidă, mai multe companii vor crea propriile aplicații, ceea ce ar putea crește cererea totală pentru programatori. O schimbare similară cu evoluția limbajelor de programare Unii veterani din industrie cred că transformarea actuală este doar o nouă etapă a evoluției programării. În trecut, limbaje precum Python sau JavaScript au simplificat mult scrierea codului, eliminând sarcini tehnice complexe precum gestionarea memoriei. Acum, inteligența artificială reprezintă un nou nivel de abstractizare , în care programatorii descriu intenția, iar sistemele automate transformă acea descriere în cod funcțional. [...]

Google introduce funcții bazate pe inteligență artificială în Google Maps , transformând aplicația într-un instrument conversațional capabil să ofere recomandări personalizate și o navigație mult mai vizuală. Noile funcții sunt construite pe baza modelelor Gemini și vizează două direcții principale: modul în care utilizatorii descoperă locuri și modul în care navighează spre destinație. Compania susține că aceasta reprezintă cea mai importantă actualizare a sistemului de navigație din ultimul deceniu. „Ask Maps” – harta care răspunde la întrebări Prima funcție, numită Ask Maps , transformă Google Maps într-o interfață conversațională. Utilizatorii pot adresa întrebări complexe despre locuri sau activități, iar aplicația generează răspunsuri personalizate și afișează rezultatele direct pe hartă. De exemplu, utilizatorii pot întreba: unde pot încărca telefonul fără a sta la coadă într-o cafenea ce terenuri de tenis publice sunt deschise seara ce opriri interesante pot face într-o călătorie Răspunsurile sunt generate pe baza datelor din Google Maps, care include informații despre peste 300 de milioane de locuri și recenzii provenite de la mai mult de 500 de milioane de contributori din comunitatea platformei. Rezultatele sunt personalizate și în funcție de preferințele utilizatorului, cum ar fi locurile salvate sau căutările anterioare. După alegerea unei destinații, utilizatorii pot face rapid rezervări, salva locații sau trimite recomandările prietenilor. Funcția Ask Maps începe să fie lansată treptat în Statele Unite și India , pe dispozitive Android și iOS, iar versiunea pentru desktop va apărea ulterior. „Immersive Navigation” – cea mai mare schimbare a navigației din ultimii 10 ani A doua funcție majoră este Immersive Navigation , un sistem de navigație complet redesenat care introduce o reprezentare tridimensională a traseului. Noua interfață oferă: vedere 3D detaliată a drumurilor și clădirilor evidențierea benzilor de circulație, semafoarelor și trecerilor de pietoni indicații vocale mai naturale previzualizarea destinației cu imagini Street View Sistemul analizează imagini din Street View și fotografii aeriene pentru a construi o reprezentare mai realistă a traseului. Informații în timp real despre trafic și rute alternative Actualizarea aduce și funcții noi pentru planificarea traseelor. Google Maps procesează peste 5 milioane de actualizări de trafic pe secundă și poate explica diferențele dintre rutele alternative. Aplicația va indica, de exemplu: dacă o rută este mai rapidă, dar include taxe de drum dacă un traseu este mai lung, dar evită traficul dacă apar incidente precum accidente sau lucrări rutiere De asemenea, înainte de sosire, utilizatorii pot vedea intrarea clădirii și recomandări pentru locuri de parcare. Funcția Immersive Navigation începe să fie disponibilă în Statele Unite și va fi extinsă treptat pe Android, iOS, Android Auto, CarPlay și în mașinile care au sistemul Google integrat. Prin integrarea modelelor Gemini cu datele globale ale platformei, Google încearcă să transforme hărțile digitale din simple instrumente de orientare în asistenți inteligenți pentru explorarea și planificarea activităților zilnice. [...]

Sam Altman spune că inteligența artificială ar putea fi vândută „la contor”, precum electricitatea , sugerând un model economic în care utilizatorii plătesc strict pentru cantitatea de „inteligență” consumată. Declarația, făcută la un eveniment major al industriei financiare din SUA, a devenit rapid virală și a relansat dezbaterea despre modul în care va fi controlat și tarifat accesul la tehnologiile AI. Potrivit NDTV Profit , directorul OpenAI a vorbit despre această viziune pe 11 martie 2026, la Infrastructure Summit organizat de BlackRock în Washington. Într-o discuție cu Bayo Ogunlesi, președintele Global Infrastructure Partners, Altman a explicat că inteligența artificială ar putea deveni o infrastructură digitală de bază, accesată la cerere, similar cu apa sau electricitatea. Modelul de funcționare este deja vizibil în industria AI. Companiile care dezvoltă modele mari de limbaj taxează utilizarea în funcție de „tokenuri”, unități care reprezintă textul sau datele procesate de sistem. Acest mecanism permite gestionarea eficientă a resurselor de calcul, mai ales în perioadele de cerere intensă pentru servicii bazate pe inteligență artificială. Altman a subliniat că obiectivul companiei este extinderea masivă a accesului la aceste tehnologii. „Vrem să inundăm lumea cu inteligență. Vrem ca oamenii să o folosească pentru orice”, a spus el, indicând că inteligența artificială ar putea deveni un element central al economiei digitale, de la productivitate personală până la procese industriale complexe. Declarațiile vin într-un context de investiții uriașe în infrastructura AI. Potrivit unei analize publicate de Fortune , companiile din domeniu investesc zeci de miliarde de dolari în centre de date și capacitate de calcul pentru a susține dezvoltarea modelelor avansate. În paralel, OpenAI a atras recent finanțări masive pentru extinderea infrastructurii, inclusiv cu sprijinul unor investitori majori din sectorul tehnologic. Reacțiile din mediul online au fost însă împărțite. Unii utilizatori au comparat ideea cu scenarii distopice din cultura pop, sugerând că „inteligența ca utilitate” ar putea transforma gândirea asistată de AI într-un serviciu plătit permanent. Alții au remarcat că analogia cu electricitatea ar putea implica, pe termen lung, și reglementări stricte din partea statului dacă inteligența artificială devine infrastructură critică. Conceptul nu este nou în discursul lui Altman. În 2025, el declara într-un eveniment economic că industria se apropie de momentul în care va putea oferi „inteligență prea ieftină pentru a fi contorizată”, susținând că prețul procesării AI a scăzut de peste zece ori pe an în ultimii ani, după cum relata Inkl . Totuși, în 2026 discuția capătă o dimensiune diferită, pe fondul costurilor uriașe ale infrastructurii, al consumului de energie și al întrebărilor tot mai frecvente despre cine va controla accesul la această tehnologie. [...]