Știri
Știri din categoria Inteligență artificială

NVIDIA și partenerii săi au deschis ca standard MRC, un protocol care crește reziliența rețelelor pentru antrenarea AI la scară foarte mare, după ce a fost folosit în producție pe infrastructura Spectrum‑X, potrivit NVIDIA. Miza este una operațională: în clustere cu mii de GPU-uri, întreruperile sau congestia de rețea pot încetini ori opri antrenări lungi și costisitoare, iar MRC este proiectat să reducă aceste blocaje prin rutare pe mai multe căi și recuperare rapidă la pierderi de pachete.
MRC (Multipath Reliable Connection) este descris ca un protocol de transport RDMA (Remote Direct Memory Access – tehnologie care permite transferuri de date cu latență mică, ocolind o parte din procesarea clasică a sistemului de operare). Concret, MRC permite ca o singură conexiune RDMA să distribuie traficul pe mai multe rute din rețea, cu efecte urmărite direct în exploatare:
NVIDIA susține că MRC ajută la menținerea unui nivel ridicat de utilizare a GPU-urilor, tocmai prin faptul că „ține” lățimea de bandă necesară pe durata antrenării și reduce timpii morți generați de problemele de rețea.
În arhitectura descrisă, MRC folosește mecanisme care vizează două tipuri de incidente frecvente la scară mare: congestia și pierderile de date.
Pe congestie, protocolul ar evita dinamic rutele supraîncărcate „în timp real”, pentru a susține lățime de bandă ridicată chiar și când rețeaua este aglomerată. La pierderi de date, NVIDIA indică o retransmisie „rapidă și precisă”, menită să limiteze efectul întreruperilor scurte asupra joburilor de lungă durată.
Un element cheie este „failure bypass”: tehnologia ar detecta o cădere de rută și ar reruta traficul automat, în hardware, „în doar microsecunde” — un detaliu relevant pentru antrenarea distribuită, unde sincronizarea între mii de GPU-uri este sensibilă la întreruperi.
NVIDIA indică drept utilizatori ai Spectrum‑X Ethernet (în acest context) OpenAI, Microsoft și Oracle. În plus, compania afirmă că centrele de date Microsoft Fairwater și Oracle Cloud Infrastructure (OCI) Abilene se bazează pe MRC pentru cerințe de performanță, scalare și eficiență.
Un punct cu impact de industrie este că MRC, după utilizarea în producție cu performanță optimizată pe hardware Spectrum‑X, a fost „lansat ca specificație deschisă” prin Open Compute Project (OCP) — o mișcare care, în mod tipic, facilitează adoptarea mai largă și interoperabilitatea între furnizori.
NVIDIA mai precizează că a colaborat la dezvoltarea MRC cu AMD, Broadcom, Intel, Microsoft și OpenAI.
„Implementarea MRC în generația Blackwell a avut mult succes și a fost posibilă datorită unei colaborări puternice cu NVIDIA”, a declarat Sachin Katti, șeful diviziei de industrial compute la OpenAI. „Abordarea end‑to‑end a MRC ne-a permis să evităm o mare parte din încetinirile și întreruperile tipice legate de rețea și să menținem eficiența antrenărilor de frontieră la scară.”
Pe Spectrum‑X Ethernet, clienții ar avea opțiuni de modele de transport RDMA: atât Adaptive RDMA, cât și MRC, plus alte protocoale personalizate, care rulează nativ pe NVIDIA ConnectX SuperNICs și switch-urile Spectrum‑X și susțin designuri de rețea „multiplanar”.
În această arhitectură, o rețea multiplanară înseamnă mai multe „plane” (fabrice) independente, fiecare oferind rute alternative între GPU-uri. NVIDIA afirmă că funcția Spectrum‑X Multiplane adaugă echilibrare de sarcină accelerată în hardware între plane, pentru reziliență și scalare, menținând latențe predictibile și permițând extinderea la „sute de mii de GPU-uri”.
Pentru piață, mesajul operațional este că, pe măsură ce infrastructura de antrenare AI crește, diferențiatorul nu mai este doar viteza brută, ci capacitatea rețelei de a evita congestia și de a „supraviețui” defectelor fără a opri joburile — iar standardizarea deschisă a MRC urmărește să transforme aceste mecanisme într-o practică mai ușor de adoptat la scară.
Recomandate

Actualizarea „tăcută” a GPT-5.5 schimbă modul în care ChatGPT gestionează conversațiile , iar asta poate reduce efortul operațional al utilizatorilor care lucrează iterativ (mai puține reformulări și „corecții” repetate), potrivit TechRadar . OpenAI spune că ChatGPT a devenit „mai puțin literal” și „mai conversațional” după actualizarea GPT-5.5 Instant pentru toți utilizatorii, cu scopul de a face interacțiunea mai ușoară, nu neapărat modelul „dramatic mai inteligent”. Ce se schimbă, concret, în utilizarea prin text Conform descrierii OpenAI, modelul ar trebui să: deducă mai bine ce vrea utilizatorul să obțină, în loc să ia fiecare comandă „ad litteram”; se adapteze mai natural când utilizatorul se răzgândește pe parcurs; urmărească mai bine firul unei discuții, cu mai puține „reamintiri” din partea utilizatorului. În testarea autorului TechRadar , efectul a fost mixt: unele conversații au părut mai naturale, iar modelul a părut să își ajusteze mai repede direcția după clarificări. Diferența observată nu este că „înțelege fără să i se spună”, ci că, odată corectat, pare mai probabil să păstreze feedbackul în restul conversației, în loc să revină la interpretarea inițială. Unde rămân limitele: Voice Mode încă „sună” nenatural În Voice Mode (care folosește tot GPT-5.5), autorul spune că nu a observat o schimbare relevantă. Mai mult, într-un test cu sarcasm, replica „No way!” a fost interpretată literal, iar ChatGPT a presupus că utilizatorul vrea să încheie conversația — un exemplu că „nuanța” și „conștientizarea contextului” pot rămâne fragile în interacțiunea vocală. De ce contează pentru utilizatori și echipe Miza practică a unei interpretări mai puțin literale este reducerea fricțiunii în lucru: dacă modelul „ține minte” corecțiile pe durata unei sesiuni și se repliază mai ușor, utilizatorii pot ajunge mai repede la rezultat, mai ales în sarcini iterative (brainstorming, rafinare de text, clarificări succesive). În același timp, testul din Voice Mode sugerează că, pentru scenarii în care tonul și intenția sunt esențiale, interacțiunea vocală poate necesita în continuare formulări explicite și verificări. Per ansamblu, concluzia TechRadar este că actualizarea pare să fi făcut conversația prin text „un pic” mai naturală, dar interacțiunea vocală om–AI este încă departe de a fi complet fluidă. [...]

OpenAI își întărește echipa de hardware prin recrutarea unui executiv-cheie de la Apple , într-un moment în care compania își concentrează eforturile pe un smartphone cu inteligență artificială care ar urma să concureze direct cu iPhone-ul, potrivit Wccftech . Paul Meade , vicepreședinte de inginerie hardware în cadrul Vision Products Group de la Apple și responsabil de Vision Pro, dar și de inițiativa de ochelari inteligenți a companiei, pleacă la OpenAI, conform unei informații publicate de Bloomberg, citată de publicație. Meade ar urma să încheie săptămâna viitoare o carieră de 15 ani la Apple și să se alăture unității de hardware a OpenAI, care lucrează la dispozitive de consum bazate pe AI. De ce contează: OpenAI pare să parieze pe un „telefon AI”, nu pe gadgeturi de nișă Materialul indică o schimbare de accent în planurile OpenAI pentru hardware de consum. Deși au fost vehiculate proiecte precum căști audio cu AI (cu nume de cod „Sweetpea”, posibil sub brandul „Dime”) și un dispozitiv de tip „pix” (nume de cod „Gumdrop”), analistul Ming-Chi Kuo a spus încă din aprilie că OpenAI ar fi „înghețat” temporar gama mai largă de dispozitive, concentrându-se în schimb pe un smartphone cu AI. În această logică, aducerea unui lider cu experiență în inginerie hardware dintr-o divizie de produs majoră a Apple poate fi citită ca o întărire operațională a ambiției OpenAI de a livra un produs de volum, nu doar prototipuri sau dispozitive complementare. Ce se știe despre smartphone-ul OpenAI: asamblare Luxshare și cip MediaTek personalizat Potrivit lui Kuo, citat de Wccftech, Luxshare ar urma să fie asamblorul principal pentru smartphone-ul OpenAI. Tot el susține că OpenAI s-ar fi orientat către o versiune personalizată a viitorului cip MediaTek Dimensity 9600 (SoC – „system-on-chip”, adică procesorul principal care integrează mai multe componente esențiale ale telefonului). Publicația notează și câteva detalii tehnice asociate Dimensity 9600: ar urma să folosească procesul de fabricație TSMC N2P, iar varianta „Pro” este descrisă cu o configurație de nuclee CPU de tip 2+3+3, similară cu cea a unui viitor cip Qualcomm menționat în articol. Aceste informații rămân, însă, la nivel de raportări și așteptări din industrie, nu confirmări oficiale. Context: Vision Pro nu a prins tracțiune, iar proiectele de ochelari ar fi întârziate Wccftech plasează plecarea lui Meade și în contextul performanței slabe a Vision Pro în piața de masă și al calendarului extins pentru ochelarii inteligenți ai Apple: lansare „târziu în 2027”, cu ochelari AR (realitate augmentată) împinși către 2028 sau chiar 2029. În paralel, publicația amintește o serie de plecări recente din Apple către competitori: un executiv important din zona Siri (Stuart Bowers) către Google DeepMind și alte schimbări la nivel de conducere, inclusiv în zona de AI și design de interfață. În plus, este menționat și faptul că Apple ar fi crescut bonusurile anuale pentru membri ai echipei de design iPhone, la un interval de 200.000–400.000 de dolari (aprox. 920.000–1.840.000 lei), în funcție de evoluția acțiunilor companiei, ca măsură de retenție. În lipsa unor anunțuri oficiale despre un „telefon OpenAI”, informațiile rămân, deocamdată, în zona de recrutări și semnale din lanțul de aprovizionare—dar ele sugerează că următoarea bătălie pentru hardware de consum ar putea să se mute dinspre „gadgeturi AI” experimentale către smartphone-ul clasic, cu AI în centru. [...]

Jensen Huang susține că AI nu va tăia locuri de muncă, ci va crește productivitatea , într-un moment în care piața muncii dă semne că automatizarea lovește mai ales rolurile de început de carieră, potrivit TechRadar . Declarația vine de la CEO-ul Nvidia, în cadrul conferinței GTC 2026 , unde Huang a respins ideea că inteligența artificială ar reduce numărul de joburi, numind-o „o prostie completă”. Argumentul său este că firmele productive, care vor să crească, vor folosi AI ca instrument de productivitate, nu ca motiv să reducă personalul, inclusiv în inginerie. De ce contează pentru companii: AI ca investiție operațională, nu ca program de tăieri În viziunea lui Huang, utilizarea AI ar permite companiilor să facă mai mult cu aceleași resurse și să se extindă, în loc să „scale back” (să reducă) echipele. El a indicat și zona de „agentic AI” (sisteme care pot executa sarcini mai autonom), despre care a spus că ar putea necesita echipe mari pentru a fi gestionate, configurate și operate, sugerând un impact operațional care mută cererea de muncă spre roluri de administrare și control al acestor sisteme. Piața muncii: optimismul liderilor vs. datele recente despre rolurile junior Articolul notează că Huang nu este singurul care vede un efect pozitiv pe termen mai lung: Gartner ar sugera că, după o perturbare temporară cauzată de implementarea AI, tehnologia va duce la crearea de noi locuri de muncă. În același timp, TechRadar punctează că „realitatea rece” a pieței muncii de azi este că AI este invocată drept factor principal în spatele pierderilor de joburi, concedierilor și restructurărilor. Ca exemplu, în 2025 ar fi existat o creștere a numărului de posturi pentru ingineri seniori sau specializați, însă rolurile entry-level și junior ar fi fost „decimate”, iar Crunchbase a urmărit dispariția acestor poziții. Ce rămâne de urmărit Din informațiile prezentate, tensiunea principală este între promisiunea de productivitate (și potențială creștere) și efectele imediate din recrutare, unde presiunea pare să se concentreze pe pozițiile de început. Dacă scenariul „mai multe joburi după perturbare” se confirmă, semnalul ar urma să apară în ritmul de creare a rolurilor noi și în cererea pentru competențe de operare și guvernanță a sistemelor AI, nu doar în numărul total de angajați. [...]

OpenAI a lansat în regim de „preview” o nouă suită GPT-5.6 cu prețuri pe token semnificativ mai mici decât ale rivalilor , într-un moment în care compania se află sub presiune politică la Washington privind calendarul și siguranța lansărilor, potrivit The Verge . GPT-5.6 vine în trei variante: Sol (modelul „fanion”), Terra (nivel mediu, pentru „muncă de volum mare”) și Luna (model „rapid și accesibil” pentru utilizare de zi cu zi). OpenAI susține că noua generație este „în mod special” bună la programare, securitate cibernetică și biologie și că își menține mai bine concentrarea în sarcini de tip „agentic” pe orizont lung (adică fluxuri în care modelul execută pași multipli, relativ autonom, pentru a duce la capăt un obiectiv). Prețuri: Sol la 5 dolari input și 30 dolari output per milion de tokeni Publicația notează că GPT-5.6 Sol este tarifat la 5 dolari (aprox. 23 lei) pentru input și 30 dolari (aprox. 138 lei) pentru output per milion de tokeni. În comparație, este menționat Anthropic Claude Fable 5 , cu 10 dolari input și 50 dolari output per milion de tokeni. În aceeași schemă de preț: Terra costă „jumătate” din Sol; Luna costă „mai puțin de jumătate” din Terra. (Articolul nu oferă valorile exacte pentru Terra și Luna, doar relațiile de preț.) Două moduri noi pentru Sol: „max” și „ultra” OpenAI a introdus și două moduri suplimentare pentru Sol: „max” , descris ca fiind pentru „raționament mai profund”; „ultra” , pentru folosirea unor „sub-agenți” (componente care pot împărți sarcina în sub-sarcini). The Verge remarcă faptul că această abordare „evocă OpenClaw” și sugerează că ar putea indica direcția muncii lui Peter Steinberger la OpenAI, însă nu oferă detalii suplimentare verificabile despre implementare. Siguranță și utilizare abuzivă, în prim-plan pe fondul tensiunilor de reglementare În contextul unei „panici” de securitate la Washington, OpenAI și-a concentrat o mare parte din comunicare pe siguranță și riscuri de utilizare abuzivă. Compania afirmă că GPT-5.6 este antrenat să refuze asistența cibernetică interzisă, inclusiv atunci când utilizatorii încearcă să își mascheze intenția sau să „jailbreak”-uiască modelul (adică să ocolească restricțiile). OpenAI mai susține că Sol este mai bun la a ajuta oamenii să găsească și să repare vulnerabilități decât la a executa „cap-coadă” atacuri și că nu depășește pragul „cyber-critical” în cadrul propriului „preparedness framework” (cadru intern de evaluare a riscurilor). Articolul menționează însă că textul original continuă dincolo de fragmentul disponibil, astfel că nu pot fi redate eventuale nuanțe sau condiționări suplimentare. [...]

Administrația Trump cere OpenAI să lanseze etapizat următorul model , într-o mișcare care ar putea institui, în practică, un filtru guvernamental asupra accesului timpuriu la modele de vârf, cu efecte directe asupra vitezei de comercializare și a competiției din piața AI, potrivit The Next Web . Sam Altman le-a spus angajaților, miercuri, că Washingtonul vrea ca următorul model să fie oferit inițial doar unui „scurt” grup de parteneri de încredere, înainte de o distribuție mai largă. În această perioadă de previzualizare, guvernul ar urma să „aprobe accesul client cu client”, conform relatării. Cine cere și de ce contează Solicitarea nu ar veni dintr-un singur birou, ci din discuții cu două structuri: Office of the National Cyber Director și Office of Science and Technology Policy . Îngrijorarea este formulată ca una de securitate cibernetică, nu de concurență sau conținut: un model suficient de capabil ar putea fi folosit abuziv, iar lansarea în trepte ar limita expunerea în fereastra inițială. Miza, dincolo de cazul OpenAI, este mecanismul: dacă „aprobarea client cu client” funcționează așa cum este descrisă, o agenție guvernamentală ar avea un rol direct în a decide cine primește acces timpuriu la un model „frontieră” (de vârf, la limita capabilităților curente). Context: o schimbare de postură a Washingtonului Episodul se înscrie într-o schimbare mai amplă de abordare, notează publicația: vine la circa două săptămâni după ce Anthropic ar fi avut cele mai capabile oferte „retrase de pe piață” în urma unei directive guvernamentale, ceea ce sugerează că autoritățile încep să influențeze proactiv calendarele de lansare ale laboratoarelor, nu doar să reacționeze după apariția produselor. În același timp, situația amintește de lansarea controlată folosită de OpenAI pentru GPT-5.4-Cyber, oferit echipelor de securitate verificate printr-un program de „Trusted Access” (acces de încredere). Impact pentru OpenAI: încetinire comercială, dar și „acoperire” politică Pentru OpenAI, o lansare etapizată poate însemna o frână în a-și pune cel mai nou model în fața clienților plătitori și a dezvoltatorilor, într-o piață în care rivalii se mișcă rapid. Contextul e cu atât mai sensibil cu cât compania a lansat recent GPT-5.5 către segmentul enterprise (companii). Pe de altă parte, implicarea explicită a guvernului poate oferi și protecție politică: dacă apar probleme, responsabilitatea nu mai cade exclusiv pe companie. Ce rămâne neclar O parte importantă a detaliilor se bazează pe relatarea lui Altman către angajați și pe informații din surse, nu pe o declarație oficială a guvernului, iar OpenAI nu a publicat termenii aranjamentului. Inclusiv numele modelului, mecanismul de aprobare „client cu client” și agențiile implicate sunt prezentate ca provenind din aceste relatări. Întrebarea-cheie, în lectura The Next Web, este dacă acest tip de „poartă” guvernamentală devine un șablon pentru lansările viitoare ale modelelor de vârf din SUA. [...]

OpenAI susține că utilizarea Codex de către utilizatorii individuali a crescut de 137 de ori din august 2025 , un semnal că instrumentele de tip „agent” (care pot executa sarcini în mai mulți pași, pe durate mai lungi) ies din zona strict a programatorilor și intră tot mai mult în uzul general, potrivit IT Home . Datele apar într-un raport publicat de OpenAI pe 25 iunie, care urmărește evoluția utilizării Codex începând cu august 2025. Pe lângă creșterea de 137x la utilizatorii individuali non-dezvoltatori, OpenAI indică și o creștere de 189x pentru utilizarea în organizații (tot în rândul non-dezvoltatorilor), respectiv de 12x pentru utilizarea internă în companie. Ce arată cifrele despre adopție: dincolo de programatori În lucrarea „The Shift to Agentic AI: Evidence from Codex”, OpenAI afirmă că în prima jumătate din 2026 numărul utilizatorilor activi care folosesc „ agentic AI ” (IA de tip agent) a crescut de peste cinci ori, iar cea mai rapidă creștere a venit din afara segmentului de dezvoltare software. În interiorul OpenAI, compania spune că 97,9% dintre angajați folosesc Codex , față de aproximativ 40% în august 2025. În mediul extern, rata de utilizare în organizații ar fi urcat la 17,3% . Impact operațional: mai multe sarcini „lungi”, nu doar solicitări punctuale OpenAI mai susține că Codex, ca instrument de tip agent, poate rula sarcini pe perioade mai lungi. Un indicator folosit în raport: ponderea utilizatorilor Codex care au trimis cel puțin o solicitare de sarcină despre care se estimează că unui om cu experiență i-ar lua peste 8 ore să o finalizeze ar fi crescut de aproape zece ori de la începutul lui 2026. Documentul citat de OpenAI este disponibil aici: „THE SHIFT TO AGENTIC AI: EVIDENCE FROM CODEX” (PDF, OpenAI): https://cdn.openai.com/pdf/5d1e1489-21c0-43e4-9d42-f87efdbf0082/the-shift-to-agentic-ai-evidence-from-codex.pdf . [...]