Știri
Știri din categoria Inteligență artificială

Agenții AI mută munca de birou de la „întrebări punctuale” la sarcini delegate pe ore, iar datele interne prezentate de OpenAI arată că instrumentul său Codex a devenit, în mai puțin de un an, principalul mod de lucru cu AI în toate departamentele companiei, inclusiv în zone non-tehnice precum Juridic și Recrutare. Miza operațională este că AI nu mai este folosită doar ca „asistent de conversație”, ci ca executant de sarcini mai lungi, care rulează independent și coordonează instrumente.
OpenAI descrie „agentic AI” (AI agentică) ca o schimbare de unitate a muncii de cunoaștere: de la interacțiuni scurte, autosuficiente, la sarcini delegate pe termen mai lung, în care agenții pot lucra minute sau ore, apelând instrumente și iterând până la soluție. În acest cadru, Codex este prezentat ca exemplu de produs care a accelerat trecerea de la chatbot la agent.
Potrivit analizei, utilizatorii folosesc Codex tot mai mult pentru activități estimate ca durată umană semnificativă. Până în mai 2026, în eșantionul de utilizatori individuali:
OpenAI mai notează că „aproape un sfert” din toate solicitările Codex vizează sarcini care ar lua unei persoane mai mult de o oră.
În paralel, Codex a devenit instrumentul principal de lucru cu AI în interiorul companiei. Dacă până în august 2025 angajatul mediu OpenAI folosea Codex pentru mai puțin de 10% din „tokeni” (unități de text procesate/generate), acum utilizarea Codex depășește 85% din tokenii de ieșire ai angajatului mediu. La nivel agregat intern, OpenAI afirmă că Codex ajunge la 99,8% din tokenii săptămânali de ieșire generați în companie, menționând și că utilizatorii Codex tind să consume mai mulți tokeni decât non-utilizatorii.
Tranziția a început în inginerie, unde, potrivit OpenAI, utilizarea s-a mutat majoritar către Codex până în decembrie 2025, iar „astăzi” inginerul mediu generează 99% din tokenii de ieșire cu Codex, nu cu ChatGPT. Departamentele non-tehnice (Juridic, Financiar, Recrutare) ar fi trecut la Codex ca instrument principal în jurul lunii aprilie 2026, însă „mult mai rapid”, iar un avocat sau recrutor mediu ar genera acum peste 85% din tokenii de ieșire în Codex.
În ultimele șase luni (raportat la perioada analizată), OpenAI indică o intensificare a utilizării interne, măsurată prin creșterea tokenilor de ieșire combinați pe departamente. Exemplele oferite:
Un punct central al materialului este că adoptarea accelerată în rândul non-dezvoltatorilor poate schimba modul în care sunt proiectate fluxurile de lucru. OpenAI susține că agenții reduc costul de a trece între tipuri de sarcini și permit angajaților să execute „muncă adiacentă” care înainte necesita sprijin tehnic specializat.
Ca exemplu intern, OpenAI afirmă că, în funcțiile de business, „peste un sfert” din munca realizată cu Codex ar fi fost inginerie sau programare, ceea ce sugerează o creștere a autonomiei operaționale în departamente care, tradițional, depind de echipe tehnice pentru automatizări, transformări de date, instrumente, depanare sau analiză structurată.
Concluzia OpenAI este că, pe măsură ce instrumentele agentice devin mai capabile și mai accesibile, utilizatorii le vor folosi pentru sarcini mai lungi, mai complexe și mai „transversale” între funcții. Companiile sunt puse, implicit, în fața unei decizii de organizare: dacă tratează AI ca un canal de suport (chat) sau ca o resursă de execuție delegată (agenți) care poate prelua bucăți consistente din munca de cunoaștere.
Recomandate

OpenAI împinge Codex spre rolul de „spațiu de lucru persistent” pentru proiecte care depășesc un singur prompt , într-un material care descrie cum poate fi păstrat contextul și cum pot fi gestionate fluxuri de lucru complexe pe durate mai lungi, potrivit OpenAI . Publicația prezintă un „whitepaper” semnat de Jason Liu, care propune strategii practice pentru folosirea Codex astfel încât munca să poată continua coerent de la o sesiune la alta: păstrarea contextului, organizarea etapelor și susținerea progresului în proiecte de durată. Ce se schimbă operațional: din „prompt” în proces Mesajul central este repoziționarea Codex ca instrument care poate funcționa ca un „workspace” (spațiu de lucru) persistent, nu doar ca un răspuns punctual la o cerere. În această logică, utilizarea recomandată vizează: împărțirea obiectivelor ambițioase în pași verificabili; menținerea continuității între mai multe fire de lucru (workstreams), astfel încât proiectul să nu fie „resetat” la fiecare interacțiune; stabilirea momentelor în care execuția poate fi delegată către Codex și a celor în care supravegherea umană rămâne mai valoroasă. Documentația: ghidul complet este separat OpenAI direcționează cititorii către ghidul integral („Read the guide”), disponibil ca document separat, fără a detalia în pagina de prezentare exemple concrete sau rezultate măsurabile. Materialul este datat 22 iunie 2026 și este încadrat în seria „AI Adoption” (adopția inteligenței artificiale). [...]

Samsung Electronics extinde utilizarea ChatGPT Enterprise și Codex la scară de companie , într-una dintre cele mai mari implementări enterprise ale OpenAI de până acum, cu impact direct asupra modului de lucru în R&D, producție, marketing și funcții corporate, potrivit OpenAI . Conform acordului, ChatGPT și Codex vor fi disponibile pentru toți angajații Samsung Electronics din Coreea de Sud, precum și pentru toți angajații la nivel global din divizia Device eXperience (DX). OpenAI descrie această implementare drept una dintre cele mai ample lansări enterprise ale sale. Samsung spune că va folosi cele două instrumente atât pentru activități tehnice, cât și non-tehnice, în arii precum dezvoltarea software, marketing, dezvoltare de produs și producție, cu obiectivul de a crește productivitatea și capacitatea de rezolvare a problemelor. În acest context, OpenAI notează că Codex a pornit ca instrument pentru dezvoltare software, dar devine tot mai util și pentru alte tipuri de muncă. Ce se schimbă operațional pentru angajați OpenAI indică faptul că, prin ChatGPT, angajații Samsung pot realiza mai eficient sarcini bazate pe cunoaștere, inclusiv: căutarea și analiza informațiilor; redactarea de documente; generarea și dezvoltarea de idei; interpretarea datelor. Pentru mediul enterprise, ChatGPT Enterprise include funcții orientate spre utilizare „sigură și eficientă” în organizații, precum protecția datelor, managementul utilizatorilor și al accesului și controale de securitate, astfel încât utilizarea să se încadreze în politicile interne și cadrul de guvernanță al companiei. În cazul Codex, OpenAI susține că instrumentul poate crește productivitatea dezvoltatorilor (scriere, revizuire și depanare de cod), dar și a echipelor non-tehnice, inclusiv prin transformarea ideilor în software funcțional, instrumente interne, site-uri și fluxuri de lucru automatizate. Context: relația OpenAI–Samsung și adopția în Coreea OpenAI afirmă că are peste 5 milioane de utilizatori săptămânali ai Codex pentru fluxuri de lucru tehnice și non-tehnice, iar numărul utilizatorilor activi săptămânal din Coreea a crescut cu aproape 800% din 1 februarie 2026. „Această implementare istorică pentru OpenAI este deosebit de importantă deoarece Samsung Electronics [...] adoptă AI nu ca un instrument limitat la anumite echipe sau funcții, ci ca o platformă de bază pentru a îmbunătăți modul în care angajații din întreaga lume lucrează și inovează”, a declarat Harrison Kim, General Manager, OpenAI Korea. OpenAI mai precizează că cele două companii colaborau deja pe zona de infrastructură globală pentru AI, Samsung urmând să furnizeze semiconductori de memorie avansați necesari pentru infrastructura AI de generație următoare. Odată cu adoptarea ChatGPT Enterprise, parteneriatul se extinde, potrivit OpenAI, către transformarea forței de muncă și adopția la nivel de companie. În același material, OpenAI oferă și exemple de adopție în Coreea: Seoul National University a început să ofere ChatGPT Edu pentru toți cei 47.000 de membri ai comunității, iar OpenAI a lucrat cu Kakao pentru integrarea întrebărilor către ChatGPT în chat-urile de grup KakaoTalk. OpenAI mai enumeră o serie de companii din Coreea care folosesc ChatGPT Enterprise, API-urile OpenAI și Codex, inclusiv LG Electronics, LG Uplus, LG CNS, GS E&C, Samsung SDS, TVING, Krafton, Toss, MUSINSA, Korea Zinc, Nexen Tire și HanaTour. [...]

OpenAI își mută o parte din „costul AI” în hardware propriu , printr-un cip de inferență (rulare a modelelor, nu antrenare) dezvoltat cu Broadcom , cu promisiunea unei eficiențe energetice semnificativ mai bune decât acceleratoarele de top de azi, potrivit OpenAI . Miza este una operațională și economică: inferența este zona care „atinge” utilizatorii (ChatGPT, Codex, API), iar orice câștig la consum și latență se poate traduce în costuri mai mici și capacitate mai mare în centrele de date. Cipul se numește Jalapeño și este descris ca primul „Intelligence Processor” al OpenAI, un accelerator proiectat de la zero pentru inferența LLM (modele lingvistice mari). Compania spune că Jalapeño este prima piesă dintr-o platformă de calcul pe mai multe generații, construită împreună cu Broadcom, pentru a face AI „mai rapid, mai fiabil și mai accesibil”. Ce promite Jalapeño și ce lipsește încă din date OpenAI afirmă că testele timpurii indică o „performanță pe watt” substanțial mai bună decât „state-of-the-art” (vârful actual al pieței), însă precizează că măsurătorile finale nu sunt încheiate. Un raport tehnic detaliat ar urma să fie prezentat „în lunile următoare”, ceea ce înseamnă că, deocamdată, nu există cifre publice comparabile (de tip throughput, latență, consum) care să cuantifice avantajul. În laborator, mostrele de inginerie rulează sarcini de machine learning la frecvența și puterea-țintă de producție, inclusiv „GPT‑5.3‑Codex‑Spark”, conform sursei. De ce contează pentru costuri și capacitate în centrele de date Unghiul principal al anunțului este eficiența în exploatare: OpenAI leagă direct îmbunătățirile de infrastructură de preț, viteză și disponibilitate pentru produse. Compania susține că arhitectura reduce mișcarea de date și echilibrează resursele de calcul, memorie și rețea pentru a obține o utilizare „mai aproape de vârful teoretic”. În termeni practici, OpenAI indică efecte posibile precum: răspunsuri mai rapide în ChatGPT; sarcini Codex care pot rula mai multe etape cu timpi de așteptare mai mici; costuri mai mici pentru produse bazate pe API; acces mai stabil în perioade de vârf. Cine face ce în proiect și când ar urma să fie implementat OpenAI spune că a proiectat cipul „de la zero” pe baza înțelegerii propriilor modele și sisteme de servire, iar Broadcom și Celestica au contribuit la industrializare: implementare silicon, plăci, integrare în rack-uri, rețelistică de înaltă performanță și sisteme de producție scalabile. Sunt menționate și tehnologii de rețea Broadcom, inclusiv „Tomahawk networking silicon”. Pe calendar, Jalapeño este descris ca primul pas al unei platforme multi-generație, cu „implementare inițială până la finalul lui 2026”. Broadcom afirmă că această colaborare ar permite implementarea unor centre de date „la scară de gigawați” cu Microsoft și alți parteneri, începând din 2026. Dezvoltare accelerată și rolul AI în proiectare Un alt element operațional este viteza: OpenAI afirmă că Jalapeño a ajuns de la design inițial la „manufacturing tape-out” (momentul în care designul este finalizat și trimis spre fabricație) în nouă luni și susține că acesta ar fi cel mai rapid ciclu de dezvoltare ASIC din semiconductori avansați de înaltă performanță. Compania adaugă că a folosit propriile modele pentru a accelera părți din procesul de proiectare și optimizare. Context suplimentar apare și în analiza Ars Technica , care reia ideea că Jalapeño este un ASIC specializat pentru inferență în centre de date și că OpenAI încă nu a publicat măsurători finale, urmând să vină cu un raport tehnic ulterior. În lipsa unor benchmark-uri publice, impactul real va depinde de datele tehnice promise și de ritmul în care OpenAI și partenerii pot duce cipul din laborator în producție și apoi în exploatare la scară mare, până la finalul lui 2026. [...]

OpenAI își atacă costurile de rulare ale modelelor printr-un cip propriu pentru „inference” (executarea modelelor deja antrenate), dezvoltat împreună cu Broadcom, într-o mișcare care poate reduce dependența companiei de plăcile grafice Nvidia și poate îmbunătăți economia serviciilor sale, potrivit TechCrunch . Procesorul, numit Jalapeño , este descris ca primul cip personalizat al OpenAI pentru inferență, proiectat și fabricat în colaborare cu Broadcom. Compania spune că propriile sale modele de inteligență artificială au ajutat la dezvoltarea cipului. Deși Jalapeño este încă în testare, OpenAI afirmă că rezultatele timpurii indică o performanță „semnificativ mai bună per watt” față de alternativele de vârf existente. În practică, o eficiență energetică mai bună poate însemna costuri mai mici pentru a rula modele în timp real, acolo unde cererea este continuă și volumul de solicitări este mare. De ce contează: inferența e o linie majoră de cost OpenAI poziționează Jalapeño ca un cip optimizat pentru inferență, adică pentru răspunsul la comenzi ale utilizatorilor folosind modele deja construite. În anunț, compania a pus accent pe costul redus de operare atunci când rulează modele de programare în timp real. TechCrunch notează că sarcinile mai intensive, precum pre-antrenarea (pre-training), ar urma probabil să rămână pe hardware Nvidia, însă chiar și reduceri mici ale costurilor de inferență pot avea un efect vizibil asupra profitabilității. Context: aceeași direcție ca Google și Amazon Parteneriatul OpenAI–Broadcom fusese anunțat oficial în octombrie, iar planurile OpenAI privind cipuri proprii au fost discutate de mai mult timp ca soluție pentru a reduce dependența de GPU-urile Nvidia. În același timp, Google și Amazon au mers pe o strategie similară, dezvoltând cipuri dedicate pentru accelerarea sarcinilor de învățare automată („acceleratoare AI”) — de exemplu, TPU la Google și Trainium la Amazon. Ce urmează: optimizare „pe tot stack-ul”, dar cipul e încă în testare Președintele OpenAI, Greg Brockman , a explicat într-un episod al podcastului intern al companiei că abordarea pornește de la înțelegerea detaliată a sarcinilor de lucru și de la identificarea zonelor „insuficient deservite”, unde un cip dedicat poate accelera semnificativ execuția. În mesajul companiei, OpenAI își descrie strategia ca o optimizare la nivelul întregii infrastructuri — de la arhitectura cipului și componente software de bază (precum „kernels”, adică rutine optimizate care rulează pe hardware) până la rețelistică, planificarea rulărilor și sistemele de implementare. Totuși, Jalapeño nu este încă un produs confirmat ca fiind în producție la scară largă: deocamdată, OpenAI spune doar că îl testează și că are rezultate preliminare promițătoare. [...]

OpenAI mizează pe standarde comune pentru evaluarea și guvernanța IA avansate , într-un demers care vizează reducerea riscurilor de siguranță și securitate prin criterii de testare comparabile între organizații și jurisdicții, potrivit OpenAI . Ideea centrală: pe măsură ce modelele devin mai capabile, guvernele și piața au nevoie de instituții și practici verificabile care să poată „traduce” standardele în evaluări aplicabile pe întreg lanțul de valoare. OpenAI spune că a contribuit la înființarea Appia Foundation , găzduită de Linux Foundation , care ar urma să dezvolte specificații deschise și modulare. Acestea sunt prezentate ca un mecanism practic de transformare a standardelor internaționale și a cadrelor existente în criterii de evaluare utilizabile, inclusiv pentru situațiile în care modele, infrastructură și aplicații sunt dezvoltate de organizații diferite. De ce contează: „stratul de încredere” pentru evaluări terțe Miza operațională și de reglementare este crearea unui „strat de încredere” prin care terți pot verifica conformitatea cu standarde, producând dovezi mai clare și reutilizabile. În viziunea OpenAI, un astfel de cadru ar facilita: evaluări comparabile între companii și produse, nu doar teste izolate; recunoașterea reciprocă a rezultatelor între instituții naționale și internaționale; o „limbă tehnică” comună care să permită coordonare în caz de incidente. Conectarea la instituții și cooperare internațională Materialul plasează inițiativa în contextul unui „blueprint” anterior al companiei pentru guvernanța democratică a IA de frontieră, care propune, între altele, un cadru durabil în SUA și consolidarea Center for AI Standards and Innovation (CAISI). OpenAI argumentează că riscurile asociate sistemelor de frontieră sunt internaționale și că statele ar trebui să lucreze la cadre compatibile de siguranță, canale de încredere pentru schimbul de constatări și răspunsuri coordonate la incidente. Ce standardizează, concret, evaluările OpenAI face trimitere la un „playbook” pentru evaluări terțe de încredere, unde sunt enumerate tipurile de informații pe care evaluările pentru sisteme de frontieră ar trebui să le dezvăluie mai des, inclusiv: ce sistem a fost testat, accesul la instrumente și „harness”-ul de evaluare (configurația/procedura de testare), metodele folosite pentru a evidenția capabilități, resursele disponibile și verificările pentru validarea rezultatelor. Compania mai afirmă că a aplicat aceste principii în parteneriate de testare cu CAISI (SUA) și UK AISI (Marea Britanie), iar activitatea acestora privind evaluări de capabilități și măsuri împotriva utilizărilor abuzive în zona biologică ar fi dus la îmbunătățiri concrete ale sistemelor OpenAI. Cum se leagă de cadrele interne ale OpenAI Inițiativa este prezentată ca complementară infrastructurii de siguranță a companiei, inclusiv Preparedness Framework (cadru pentru definirea și operaționalizarea gestionării riscurilor majore) și Frontier Governance Framework (document public de guvernanță care include obligații de reglementare precum evaluarea riscurilor, raportarea modelelor, controale de securitate și răspuns la incidente). În acest tablou, Appia ar urmări „următoarea provocare”: interoperabilitatea practicilor între organizații, jurisdicții și pe lanțul de aprovizionare, astfel încât guverne, companii și evaluatori independenți să poată folosi metode tehnice deschise „peste granițe”. [...]

Google își reproiectează acceleratoarele TPU pentru a rula antrenarea și inferența pe același cip , iar pentru generația TPUv9 „Triggerfish” a apelat din nou la MediaTek, potrivit Wccftech . Miza este una operațională: reducerea fragmentării între cipuri dedicate (separat pentru antrenare și pentru inferență) și simplificarea modului în care sunt comutate sarcinile de lucru în aplicații de tip „agentic AI” (modele care execută pași multipli și iau decizii pe parcurs). Ce se schimbă la TPUv9 „Triggerfish” Din informațiile citate de publicație, TPUv9 „Triggerfish” ar urma să combine capabilități de antrenare și inferență într-o singură soluție, cu câteva elemente tehnice orientate direct spre utilizare în centre de date: SRAM mai mare , menționat ca fiind de 2–3 ori față de generația anterioară, pentru a susține fluxuri de lucru mai complexe. Un „CPU tile” (o componentă CPU separată în același pachet) adăugat de MediaTek, care ar avea rolul de a gestiona comutarea sarcinilor între antrenare și inferență. Integrarea CPU-ului și a „compute die”-ului (matrița principală de calcul) în același pachet , pentru a reduce penalizările de comunicare dintre componente. Calendarul estimat și volumele invocate Wccftech, citând un raport FundaAI, notează că seria TPUv9 este așteptată să intre în producție de masă în T3 2027 , cu „Humufish” primul, urmat de „Triggerfish” în T4 2027 , iar ambele ar urma să ajungă la „volume ramp” (creștere accelerată a producției) în 2028 . În același context, publicația menționează o estimare potrivit căreia livrările totale de TPU în 2027 ar putea fi de circa 10–11 milioane de unități . Este o proiecție din surse de analiză, nu o cifră confirmată oficial de Google. Implicații pentru lanțul de aprovizionare: TSMC , Intel și ambalarea avansată Materialul mai indică o posibilă împărțire a rolurilor între producție și ambalare (packaging), într-un moment în care ambalarea avansată a devenit un blocaj pentru industria de cipuri AI: Deși au existat informații că unele TPU ar putea fi fabricate la Intel (cu un ordin de mărime de până la 3 milioane de unități, potrivit unor rapoarte anterioare), analiști citați susțin că fabricarea ar rămâne la TSMC , iar Intel ar putea prelua partea de ambalare . Pentru „Humufish”, Wccftech scrie că ar urma să fie folosit Intel EMIB (o tehnologie de interconectare în pachet), prezentată ca alternativă mai flexibilă și cu costuri mai mici față de CoWoS (o abordare 2,5D folosită pe scară largă în acceleratoarele AI). Publicația menționează și un scenariu în care Google ar putea muta o parte din capacitate către Intel Foundry , pe fondul „bottleneck”-urilor din lanțul de aprovizionare și al încărcării TSMC cu comenzi de la NVIDIA, AMD și Apple. Memorie: HBM4E pentru Triggerfish Pentru partea de memorie, articolul afirmă că: TPUv9 „Triggerfish” ar urma să folosească HBM4E ; TPUv9 „Humufish” ar urma să folosească HBM4 . HBM (High Bandwidth Memory) este memoria cu lățime de bandă foarte mare folosită în acceleratoare AI, iar trecerea la generații noi este relevantă pentru performanță și disponibilitate, în condițiile în care cererea globală rămâne ridicată. De ce contează Dincolo de numele de cod, direcția indicată de aceste informații sugerează că Google încearcă să consolideze antrenarea și inferența într-o singură platformă TPU , reducând dependența de configurații separate și optimizând comutarea sarcinilor în aplicații „agentic AI”. Dacă planul de producție (T3/T4 2027) se confirmă, următoarea etapă de urmărit va fi cum își împarte Google efectiv producția și ambalarea între TSMC și Intel, într-o piață în care capacitatea de packaging avansat a devenit la fel de critică precum fabricarea propriu-zisă. [...]