OpenAI prezintă Jalapeño, primul său cip personalizat pentru inferență, dezvoltat cu Broadcom - compania vizează reducerea costurilor de rulare și a dependenței de GPU-urile Nvidia

24 iunie 2026, 23:02

Greg Brockman și un reprezentant Broadcom prezintă cipul Jalapeño pentru inferență AI.

TLDRPe scurt:

01OpenAI a dezvoltat cipul Jalapeño pentru a reduce costurile de rulare a modelelor AI.
02Cipul este creat în colaborare cu Broadcom și vizează eficiența energetică superioară.
03Jalapeño promite o performanță mai bună per watt comparativ cu soluțiile existente.
04Reducerea costurilor de inferență poate îmbunătăți semnificativ profitabilitatea OpenAI.

OpenAI își atacă costurile de rulare ale modelelor printr-un cip propriu pentru „inference” (executarea modelelor deja antrenate), dezvoltat împreună cu Broadcom, într-o mișcare care poate reduce dependența companiei de plăcile grafice Nvidia și poate îmbunătăți economia serviciilor sale, potrivit TechCrunch.

Procesorul, numit Jalapeño, este descris ca primul cip personalizat al OpenAI pentru inferență, proiectat și fabricat în colaborare cu Broadcom. Compania spune că propriile sale modele de inteligență artificială au ajutat la dezvoltarea cipului.

Deși Jalapeño este încă în testare, OpenAI afirmă că rezultatele timpurii indică o performanță „semnificativ mai bună per watt” față de alternativele de vârf existente. În practică, o eficiență energetică mai bună poate însemna costuri mai mici pentru a rula modele în timp real, acolo unde cererea este continuă și volumul de solicitări este mare.

De ce contează: inferența e o linie majoră de cost

OpenAI poziționează Jalapeño ca un cip optimizat pentru inferență, adică pentru răspunsul la comenzi ale utilizatorilor folosind modele deja construite. În anunț, compania a pus accent pe costul redus de operare atunci când rulează modele de programare în timp real.

TechCrunch notează că sarcinile mai intensive, precum pre-antrenarea (pre-training), ar urma probabil să rămână pe hardware Nvidia, însă chiar și reduceri mici ale costurilor de inferență pot avea un efect vizibil asupra profitabilității.

Context: aceeași direcție ca Google și Amazon

Parteneriatul OpenAI–Broadcom fusese anunțat oficial în octombrie, iar planurile OpenAI privind cipuri proprii au fost discutate de mai mult timp ca soluție pentru a reduce dependența de GPU-urile Nvidia. În același timp, Google și Amazon au mers pe o strategie similară, dezvoltând cipuri dedicate pentru accelerarea sarcinilor de învățare automată („acceleratoare AI”) — de exemplu, TPU la Google și Trainium la Amazon.

Ce urmează: optimizare „pe tot stack-ul”, dar cipul e încă în testare

Președintele OpenAI, Greg Brockman, a explicat într-un episod al podcastului intern al companiei că abordarea pornește de la înțelegerea detaliată a sarcinilor de lucru și de la identificarea zonelor „insuficient deservite”, unde un cip dedicat poate accelera semnificativ execuția.

În mesajul companiei, OpenAI își descrie strategia ca o optimizare la nivelul întregii infrastructuri — de la arhitectura cipului și componente software de bază (precum „kernels”, adică rutine optimizate care rulează pe hardware) până la rețelistică, planificarea rulărilor și sistemele de implementare. Totuși, Jalapeño nu este încă un produs confirmat ca fiind în producție la scară largă: deocamdată, OpenAI spune doar că îl testează și că are rezultate preliminare promițătoare.

Tag-uri:reducere costuri ai broadcom inferenta ai greg brockman openai cip ai jalapeno

AutorEdi Claw

Sursătechcrunch.com

OpenAI prezintă Jalapeño, primul său cip personalizat pentru inferență, dezvoltat cu Broadcom - compania vizează reducerea costurilor de rulare și a dependenței de GPU-urile Nvidia

De ce contează: inferența e o linie majoră de cost

Context: aceeași direcție ca Google și Amazon

Ce urmează: optimizare „pe tot stack-ul”, dar cipul e încă în testare

Articole pe același subiect

OpenAI sprijină crearea Appia Foundation pentru standarde comune de evaluare a AI avansate - specificații deschise pentru verificări terțe și interoperabilitate între jurisdicții

OpenAI publică un whitepaper despre folosirea Codex ca „spațiu de lucru” persistent - ghid pentru păstrarea contextului și gestionarea proiectelor care depășesc un singur prompt

Samsung Electronics implementează ChatGPT Enterprise și Codex pentru angajați - acces extins în Coreea și în divizia DX la nivel global, una dintre cele mai mari lansări enterprise ale OpenAI

Satya Nadella avertizează că dominația câtorva laboratoare de AI nu este „politic” sustenabilă - Microsoft mizează pe modele mai ieftine și mai mult control pentru clienți

OpenAI ar testa neoficial un model „GPT-5.6” înainte de o posibilă lansare pe 25 iunie - zvonuri despre raționament mai bun și fereastră de context de până la 1,5 milioane de tokeni

Amazon, Walmart și Uber limitează utilizarea AI în companii - Tarifele pe tokenuri și agenții AI împing costurile în sus și forțează controlul bugetelor