Știri
Știri din categoria Inteligență artificială

OpenAI își atacă costurile de rulare ale modelelor printr-un cip propriu pentru „inference” (executarea modelelor deja antrenate), dezvoltat împreună cu Broadcom, într-o mișcare care poate reduce dependența companiei de plăcile grafice Nvidia și poate îmbunătăți economia serviciilor sale, potrivit TechCrunch.
Procesorul, numit Jalapeño, este descris ca primul cip personalizat al OpenAI pentru inferență, proiectat și fabricat în colaborare cu Broadcom. Compania spune că propriile sale modele de inteligență artificială au ajutat la dezvoltarea cipului.
Deși Jalapeño este încă în testare, OpenAI afirmă că rezultatele timpurii indică o performanță „semnificativ mai bună per watt” față de alternativele de vârf existente. În practică, o eficiență energetică mai bună poate însemna costuri mai mici pentru a rula modele în timp real, acolo unde cererea este continuă și volumul de solicitări este mare.
OpenAI poziționează Jalapeño ca un cip optimizat pentru inferență, adică pentru răspunsul la comenzi ale utilizatorilor folosind modele deja construite. În anunț, compania a pus accent pe costul redus de operare atunci când rulează modele de programare în timp real.
TechCrunch notează că sarcinile mai intensive, precum pre-antrenarea (pre-training), ar urma probabil să rămână pe hardware Nvidia, însă chiar și reduceri mici ale costurilor de inferență pot avea un efect vizibil asupra profitabilității.
Parteneriatul OpenAI–Broadcom fusese anunțat oficial în octombrie, iar planurile OpenAI privind cipuri proprii au fost discutate de mai mult timp ca soluție pentru a reduce dependența de GPU-urile Nvidia. În același timp, Google și Amazon au mers pe o strategie similară, dezvoltând cipuri dedicate pentru accelerarea sarcinilor de învățare automată („acceleratoare AI”) — de exemplu, TPU la Google și Trainium la Amazon.
Președintele OpenAI, Greg Brockman, a explicat într-un episod al podcastului intern al companiei că abordarea pornește de la înțelegerea detaliată a sarcinilor de lucru și de la identificarea zonelor „insuficient deservite”, unde un cip dedicat poate accelera semnificativ execuția.
În mesajul companiei, OpenAI își descrie strategia ca o optimizare la nivelul întregii infrastructuri — de la arhitectura cipului și componente software de bază (precum „kernels”, adică rutine optimizate care rulează pe hardware) până la rețelistică, planificarea rulărilor și sistemele de implementare. Totuși, Jalapeño nu este încă un produs confirmat ca fiind în producție la scară largă: deocamdată, OpenAI spune doar că îl testează și că are rezultate preliminare promițătoare.
Recomandate

OpenAI mizează pe standarde comune pentru evaluarea și guvernanța IA avansate , într-un demers care vizează reducerea riscurilor de siguranță și securitate prin criterii de testare comparabile între organizații și jurisdicții, potrivit OpenAI . Ideea centrală: pe măsură ce modelele devin mai capabile, guvernele și piața au nevoie de instituții și practici verificabile care să poată „traduce” standardele în evaluări aplicabile pe întreg lanțul de valoare. OpenAI spune că a contribuit la înființarea Appia Foundation , găzduită de Linux Foundation , care ar urma să dezvolte specificații deschise și modulare. Acestea sunt prezentate ca un mecanism practic de transformare a standardelor internaționale și a cadrelor existente în criterii de evaluare utilizabile, inclusiv pentru situațiile în care modele, infrastructură și aplicații sunt dezvoltate de organizații diferite. De ce contează: „stratul de încredere” pentru evaluări terțe Miza operațională și de reglementare este crearea unui „strat de încredere” prin care terți pot verifica conformitatea cu standarde, producând dovezi mai clare și reutilizabile. În viziunea OpenAI, un astfel de cadru ar facilita: evaluări comparabile între companii și produse, nu doar teste izolate; recunoașterea reciprocă a rezultatelor între instituții naționale și internaționale; o „limbă tehnică” comună care să permită coordonare în caz de incidente. Conectarea la instituții și cooperare internațională Materialul plasează inițiativa în contextul unui „blueprint” anterior al companiei pentru guvernanța democratică a IA de frontieră, care propune, între altele, un cadru durabil în SUA și consolidarea Center for AI Standards and Innovation (CAISI). OpenAI argumentează că riscurile asociate sistemelor de frontieră sunt internaționale și că statele ar trebui să lucreze la cadre compatibile de siguranță, canale de încredere pentru schimbul de constatări și răspunsuri coordonate la incidente. Ce standardizează, concret, evaluările OpenAI face trimitere la un „playbook” pentru evaluări terțe de încredere, unde sunt enumerate tipurile de informații pe care evaluările pentru sisteme de frontieră ar trebui să le dezvăluie mai des, inclusiv: ce sistem a fost testat, accesul la instrumente și „harness”-ul de evaluare (configurația/procedura de testare), metodele folosite pentru a evidenția capabilități, resursele disponibile și verificările pentru validarea rezultatelor. Compania mai afirmă că a aplicat aceste principii în parteneriate de testare cu CAISI (SUA) și UK AISI (Marea Britanie), iar activitatea acestora privind evaluări de capabilități și măsuri împotriva utilizărilor abuzive în zona biologică ar fi dus la îmbunătățiri concrete ale sistemelor OpenAI. Cum se leagă de cadrele interne ale OpenAI Inițiativa este prezentată ca complementară infrastructurii de siguranță a companiei, inclusiv Preparedness Framework (cadru pentru definirea și operaționalizarea gestionării riscurilor majore) și Frontier Governance Framework (document public de guvernanță care include obligații de reglementare precum evaluarea riscurilor, raportarea modelelor, controale de securitate și răspuns la incidente). În acest tablou, Appia ar urmări „următoarea provocare”: interoperabilitatea practicilor între organizații, jurisdicții și pe lanțul de aprovizionare, astfel încât guverne, companii și evaluatori independenți să poată folosi metode tehnice deschise „peste granițe”. [...]

OpenAI împinge Codex spre rolul de „spațiu de lucru persistent” pentru proiecte care depășesc un singur prompt , într-un material care descrie cum poate fi păstrat contextul și cum pot fi gestionate fluxuri de lucru complexe pe durate mai lungi, potrivit OpenAI . Publicația prezintă un „whitepaper” semnat de Jason Liu, care propune strategii practice pentru folosirea Codex astfel încât munca să poată continua coerent de la o sesiune la alta: păstrarea contextului, organizarea etapelor și susținerea progresului în proiecte de durată. Ce se schimbă operațional: din „prompt” în proces Mesajul central este repoziționarea Codex ca instrument care poate funcționa ca un „workspace” (spațiu de lucru) persistent, nu doar ca un răspuns punctual la o cerere. În această logică, utilizarea recomandată vizează: împărțirea obiectivelor ambițioase în pași verificabili; menținerea continuității între mai multe fire de lucru (workstreams), astfel încât proiectul să nu fie „resetat” la fiecare interacțiune; stabilirea momentelor în care execuția poate fi delegată către Codex și a celor în care supravegherea umană rămâne mai valoroasă. Documentația: ghidul complet este separat OpenAI direcționează cititorii către ghidul integral („Read the guide”), disponibil ca document separat, fără a detalia în pagina de prezentare exemple concrete sau rezultate măsurabile. Materialul este datat 22 iunie 2026 și este încadrat în seria „AI Adoption” (adopția inteligenței artificiale). [...]

Samsung Electronics extinde utilizarea ChatGPT Enterprise și Codex la scară de companie , într-una dintre cele mai mari implementări enterprise ale OpenAI de până acum, cu impact direct asupra modului de lucru în R&D, producție, marketing și funcții corporate, potrivit OpenAI . Conform acordului, ChatGPT și Codex vor fi disponibile pentru toți angajații Samsung Electronics din Coreea de Sud, precum și pentru toți angajații la nivel global din divizia Device eXperience (DX). OpenAI descrie această implementare drept una dintre cele mai ample lansări enterprise ale sale. Samsung spune că va folosi cele două instrumente atât pentru activități tehnice, cât și non-tehnice, în arii precum dezvoltarea software, marketing, dezvoltare de produs și producție, cu obiectivul de a crește productivitatea și capacitatea de rezolvare a problemelor. În acest context, OpenAI notează că Codex a pornit ca instrument pentru dezvoltare software, dar devine tot mai util și pentru alte tipuri de muncă. Ce se schimbă operațional pentru angajați OpenAI indică faptul că, prin ChatGPT, angajații Samsung pot realiza mai eficient sarcini bazate pe cunoaștere, inclusiv: căutarea și analiza informațiilor; redactarea de documente; generarea și dezvoltarea de idei; interpretarea datelor. Pentru mediul enterprise, ChatGPT Enterprise include funcții orientate spre utilizare „sigură și eficientă” în organizații, precum protecția datelor, managementul utilizatorilor și al accesului și controale de securitate, astfel încât utilizarea să se încadreze în politicile interne și cadrul de guvernanță al companiei. În cazul Codex, OpenAI susține că instrumentul poate crește productivitatea dezvoltatorilor (scriere, revizuire și depanare de cod), dar și a echipelor non-tehnice, inclusiv prin transformarea ideilor în software funcțional, instrumente interne, site-uri și fluxuri de lucru automatizate. Context: relația OpenAI–Samsung și adopția în Coreea OpenAI afirmă că are peste 5 milioane de utilizatori săptămânali ai Codex pentru fluxuri de lucru tehnice și non-tehnice, iar numărul utilizatorilor activi săptămânal din Coreea a crescut cu aproape 800% din 1 februarie 2026. „Această implementare istorică pentru OpenAI este deosebit de importantă deoarece Samsung Electronics [...] adoptă AI nu ca un instrument limitat la anumite echipe sau funcții, ci ca o platformă de bază pentru a îmbunătăți modul în care angajații din întreaga lume lucrează și inovează”, a declarat Harrison Kim, General Manager, OpenAI Korea. OpenAI mai precizează că cele două companii colaborau deja pe zona de infrastructură globală pentru AI, Samsung urmând să furnizeze semiconductori de memorie avansați necesari pentru infrastructura AI de generație următoare. Odată cu adoptarea ChatGPT Enterprise, parteneriatul se extinde, potrivit OpenAI, către transformarea forței de muncă și adopția la nivel de companie. În același material, OpenAI oferă și exemple de adopție în Coreea: Seoul National University a început să ofere ChatGPT Edu pentru toți cei 47.000 de membri ai comunității, iar OpenAI a lucrat cu Kakao pentru integrarea întrebărilor către ChatGPT în chat-urile de grup KakaoTalk. OpenAI mai enumeră o serie de companii din Coreea care folosesc ChatGPT Enterprise, API-urile OpenAI și Codex, inclusiv LG Electronics, LG Uplus, LG CNS, GS E&C, Samsung SDS, TVING, Krafton, Toss, MUSINSA, Korea Zinc, Nexen Tire și HanaTour. [...]

Satya Nadella încearcă să frâneze concentrarea puterii în AI și să împingă piața spre modele mai ieftine și control la client , într-o repoziționare care poate accelera războiul prețurilor și poate schimba cine capturează valoarea economică din inteligența artificială, potrivit The Next Web . Într-un interviu acordat Wall Street Journal, CEO-ul Microsoft a criticat „giganții AI” care, pe de o parte, avertizează că tehnologia va șterge masiv joburi de birou, iar pe de altă parte cer libertate totală pentru a construi infrastructură și modele fără constrângeri. Țintele indicate în material sunt OpenAI și Anthropic, laboratoare care dezvoltă unele dintre cele mai avansate modele proprietare, în timp ce Microsoft încearcă să se poziționeze împotriva lor. „Nu poți să spui: toate joburile de birou dispar și asta ar putea fi chiar o armă, iar noi vom folosi toată energia ca să construim centre de date”, a spus Nadella. Miza: „permisiunea socială” și riscul unei reacții politice Argumentul central al lui Nadella este legat de încredere și acceptare publică: o industrie care promite „golirea” unor sectoare întregi nu poate, în același timp, să se aștepte ca publicul și politicul să îi lase mână liberă. El avertizează că, dacă valoarea economică ajunge să fie acumulată de „doar câteva modele”, „economia politică” nu va tolera situația. Nadella face și o paralelă istorică: reacția ar putea semăna cu furia socială de după globalizare, când comunități întregi au pierdut și nu au mai acceptat explicațiile celor care promiseseră beneficii. Strategia Microsoft: ecosistem de modele, nu un singur „model de vârf” În contrapondere, Nadella descrie o abordare mai „comercială”: AI ca „motor de cunoaștere” care ajută companiile să-și folosească oamenii și datele proprii. În locul unui singur „frontier model” (model de vârf), el vorbește despre un „frontier ecosystem”, în care fiecare organizație își construiește propriul „learning loop” (buclă de învățare) din date private și evaluări proprii. În această logică, clienții ar trebui să poată alege dintr-un spectru de modele, cu prețuri și capabilități diferite, iar modelele să funcționeze „în interiorul unei mașini pe care o controlezi” — adică mai mult control la nivelul companiei care le folosește, nu doar la furnizor. Efectul în piață: presiune pe OpenAI și Anthropic, prețuri în scădere Materialul notează că Microsoft a început să susțină mesajul cu produse: în ultimele săptămâni a lansat o suită de modele cu cost redus, țintind companii afectate de creșterea facturilor pentru AI. În plus, Microsoft analizează dacă să găzduiască o versiune a DeepSeek , un model chinezesc cu cost foarte mic, pe care OpenAI și Anthropic îl acuză că le-ar fi copiat munca. O astfel de decizie ar direcționa mai mult trafic către producătorul chinez și ar pune presiune suplimentară pe OpenAI și Anthropic, pe fondul unui război de prețuri deja prelungit. Context: și alți giganți vor să subțieze dominația „laboratoarelor de vârf” Microsoft nu este singura companie care încearcă să submineze poziția laboratoarelor care conduc cursa modelelor. Amazon, de exemplu, a admis că propriile modele sunt în urma liderilor și vrea să recupereze prin opțiuni mai ieftine, potrivit articolului. Momentul este sensibil pentru OpenAI și Anthropic, descrise ca fiind în marș spre listări bursiere, sprijinite de narațiunea că modelele lor vor remodela economia. De ce contează: Microsoft are interesul să evite un „câștigător unic” The Next Web subliniază și dimensiunea de interes propriu: Microsoft rămâne una dintre cele mai mari concentrări de putere în AI și plănuiește să cheltuiască, potrivit unor informații citate, 190 miliarde dolari (aprox. 874 miliarde lei) anul acesta doar pe centre de date și capacitate. În același timp, compania este în continuare cel mai mare susținător al OpenAI. Repoziționarea are însă o logică economică: Microsoft câștigă dacă nu se formează un monopol de facto al unui singur laborator, iar piața se mută către un model în care valoarea se împarte între mai multe modele și implementări la nivel de client. Pariul lui Nadella, potrivit articolului, este că următorul val de AI va recompensa „lățimea” (adopția și diversitatea) mai mult decât dominația unui singur model. [...]

OpenAI ar putea lansa GPT-5.6 chiar săptămâna viitoare, iar miza pentru companii este o combinație între performanță mai bună la raționament și programare și o posibilă presiune pe prețurile din piața modelelor AI , potrivit Gizmochina . Informațiile rămân neconfirmate oficial de OpenAI și se bazează pe relatări ale testerilor, presupuse scurgeri de informații și speculații din comunitate. Publicația notează că „linia” vehiculată ar include GPT-5.6 Mini, GPT-5.6 Standard și GPT-5.6 Pro. În paralel, mai mulți abonați OpenAI Pro susțin că ar fi primit deja acces la un model mai nou prin GPT-5.5 Pro, alimentând ipoteza unor teste discrete înainte de o lansare publică. De ce contează: presiune pe costuri și pe productivitatea echipelor tehnice Dacă zvonurile se confirmă, upgrade-ul ar putea schimba raportul cost–performanță pentru utilizatorii care folosesc modele AI în fluxuri de lucru de dezvoltare software, analiză și automatizare. În același timp, materialul indică faptul că OpenAI ar putea răspunde competiției nu doar cu îmbunătățiri tehnice, ci și cu o politică de preț mai agresivă, ceea ce ar pune presiune pe restul jucătorilor din piață. În context, Gizmochina menționează competiția în creștere din industrie, inclusiv modele chinezești precum GLM-5.2 și „cele mai recente sisteme” ale Anthropic , care împing înainte capabilitățile de programare și funcțiile de tip „agent” (adică modele care pot executa sarcini în mai mulți pași, cu planificare și verificări intermediare). Ce îmbunătățiri sunt vehiculate Relatările testerilor indică o serie de direcții, cu accent pe calitate, nu pe viteză: raționament și rezolvare de probleme mai bune , inclusiv în instrucțiuni complexe și sarcini în mai mulți pași, cu mai puține erori; performanță mai bună la programare , cu planificare mai solidă și execuție mai fiabilă în sarcini de dezvoltare în mai multe etape; fereastră de context mai mare , de la 1 milion la 1,5 milioane de „tokeni” (unități de text folosite de model), ceea ce ar permite procesarea unor baze de cod și documente mai mari într-o singură sesiune; o posibilă creștere a unui parametru intern de raționament numit „Juice Value”, de la 768 la 960 , potrivit unor informații „scurse”. Materialul mai menționează și îmbunătățiri raportate în generarea de SVG, creație 3D și simulări pentru robotică, precum și rezultate mai bune în unele evaluări de tip „benchmark” pentru programare, deși cu variații în funcție de test. Compromisul raportat: răspunsuri mai lente O parte din feedback-ul timpuriu sugerează că modelul ar „gândi” mai mult înainte de a răspunde, ceea ce ar duce la rezultate mai bune, dar și la timp de generare mai mare . Un exemplu din articol indică o sarcină de generare (un joc 3D în browser, cu simulare fizică și controale de cameră) care ar fi durat peste o oră, însă cu un rezultat considerat superior versiunilor anterioare. Calendar posibil și ce știm sigur Mai multe zvonuri indică 25 iunie ca dată posibilă de lansare, iar unele estimări din piețe de predicție ar vedea o lansare în intervalul 22–28 iunie . Totuși, OpenAI nu a confirmat existența GPT-5.6, specificațiile, prețurile sau calendarul. Până la un anunț oficial, informațiile trebuie tratate ca neconfirmate. Dacă însă upgrade-ul și eventualele ajustări de preț se materializează, efectul imediat ar putea fi o intensificare a competiției pe segmentul enterprise și în rândul dezvoltatorilor, unde costul pe utilizare și calitatea la sarcini complexe sunt criterii decisive. [...]

Marile companii încep să plafoneze folosirea AI în interior, pe fondul unei creșteri rapide a costurilor , iar primele măsuri vizează direct bugetele și consumul de „tokenuri” (unități de calcul folosite la tarifarea interogărilor), potrivit Ziarul Financiar . Amazon, Walmart, Uber, Cisco și Meta sunt printre grupurile care au trecut de la încurajarea adoptării la impunerea de limite și control mai strict al cheltuielilor, pe măsură ce implementarea la scară largă devine tot mai scumpă. Schimbarea vine într-un moment în care companiile trec de la utilizări relativ simple (chatboți și asistenți digitali) la „agenți AI” care pot executa autonom sarcini complexe. Acești agenți cer mai multă putere de calcul și, implicit, cresc factura operațională. Un factor care amplifică presiunea pe bugete este schimbarea modelelor comerciale ale furnizorilor. Potrivit materialului, OpenAI și Anthropic migrează de la abonamente fixe către tarifare bazată pe tokenuri, ceea ce înseamnă că firmele ajung să plătească direct pentru fiecare interogare și pentru fiecare flux automatizat. Sam Altman este citat spunând că, în 2026, costul utilizării AI a devenit una dintre principalele preocupări ale clienților. Plafonări și restricții: primele exemple concrete Ziarul Financiar notează două măsuri punctuale care ilustrează direcția: Uber a introdus un plafon de 1.500 de dolari pe lună (aprox. 6.900 lei) pentru consumul individual de tokenuri AI, după ce și-a epuizat bugetul alocat pentru 2026 încă din aprilie. Walmart a limitat utilizarea agenților AI interni prin restricționarea numărului de tokenuri disponibile angajaților. Mesajul operațional este că AI nu mai este tratată doar ca un instrument „gratuit” de productivitate, ci ca o resursă care trebuie bugetată și guvernată, similar cu alte costuri de infrastructură. De ce cresc costurile: agenții AI pot rula „în paralel” Executivi din industrie avertizează că presiunea se va accentua odată cu răspândirea agenților AI. Spre deosebire de chatboți, un singur angajat poate folosi simultan zeci sau chiar sute de agenți care rulează permanent și consumă resurse de calcul continuu, ceea ce duce la costuri recurente mai mari. În plus, analiștii Goldman Sachs estimează că utilizarea agenților AI va determina o creștere de 24 de ori a consumului de tokenuri până în 2030, ceea ce ar putea agrava deficitul global de cipuri în următoarele 12–18 luni , potrivit articolului. Efecte și pentru companiile mai mici, plus presiune competitivă din China Creșterea facturilor nu este limitată la giganți. Workato, o firmă de software, a raportat că factura sa pentru AI a crescut de șapte ori într-o singură zi după trecerea la tarifarea pe tokenuri introdusă de Anthropic. Pe partea de competiție, datele platformei OpenRouter arată că modelele chinezești au depășit omologii americani în consumul de tokenuri, avantajate de costuri energetice mai mici și modele mai eficiente, care le permit să ofere servicii la prețuri mai reduse. În concluzie, pe măsură ce utilizarea AI se extinde în procesele interne, costul infrastructurii și al consumului devine o problemă strategică pentru companii, comparabilă ca importanță cu alegerea tehnologiei în sine. [...]