Inteligență artificială25 iun. 2026
OpenAI și Broadcom prezintă cipul Jalapeño pentru inferența LLM - promite eficiență energetică mai bună și țintește implementare în centre de date din 2026
OpenAI își mută o parte din „costul AI” în hardware propriu , printr-un cip de inferență (rulare a modelelor, nu antrenare) dezvoltat cu Broadcom , cu promisiunea unei eficiențe energetice semnificativ mai bune decât acceleratoarele de top de azi, potrivit OpenAI . Miza este una operațională și economică: inferența este zona care „atinge” utilizatorii (ChatGPT, Codex, API), iar orice câștig la consum și latență se poate traduce în costuri mai mici și capacitate mai mare în centrele de date. Cipul se numește Jalapeño și este descris ca primul „Intelligence Processor” al OpenAI, un accelerator proiectat de la zero pentru inferența LLM (modele lingvistice mari). Compania spune că Jalapeño este prima piesă dintr-o platformă de calcul pe mai multe generații, construită împreună cu Broadcom, pentru a face AI „mai rapid, mai fiabil și mai accesibil”. Ce promite Jalapeño și ce lipsește încă din date OpenAI afirmă că testele timpurii indică o „performanță pe watt” substanțial mai bună decât „state-of-the-art” (vârful actual al pieței), însă precizează că măsurătorile finale nu sunt încheiate. Un raport tehnic detaliat ar urma să fie prezentat „în lunile următoare”, ceea ce înseamnă că, deocamdată, nu există cifre publice comparabile (de tip throughput, latență, consum) care să cuantifice avantajul. În laborator, mostrele de inginerie rulează sarcini de machine learning la frecvența și puterea-țintă de producție, inclusiv „GPT‑5.3‑Codex‑Spark”, conform sursei. De ce contează pentru costuri și capacitate în centrele de date Unghiul principal al anunțului este eficiența în exploatare: OpenAI leagă direct îmbunătățirile de infrastructură de preț, viteză și disponibilitate pentru produse. Compania susține că arhitectura reduce mișcarea de date și echilibrează resursele de calcul, memorie și rețea pentru a obține o utilizare „mai aproape de vârful teoretic”. În termeni practici, OpenAI indică efecte posibile precum: răspunsuri mai rapide în ChatGPT; sarcini Codex care pot rula mai multe etape cu timpi de așteptare mai mici; costuri mai mici pentru produse bazate pe API; acces mai stabil în perioade de vârf. Cine face ce în proiect și când ar urma să fie implementat OpenAI spune că a proiectat cipul „de la zero” pe baza înțelegerii propriilor modele și sisteme de servire, iar Broadcom și Celestica au contribuit la industrializare: implementare silicon, plăci, integrare în rack-uri, rețelistică de înaltă performanță și sisteme de producție scalabile. Sunt menționate și tehnologii de rețea Broadcom, inclusiv „Tomahawk networking silicon”. Pe calendar, Jalapeño este descris ca primul pas al unei platforme multi-generație, cu „implementare inițială până la finalul lui 2026”. Broadcom afirmă că această colaborare ar permite implementarea unor centre de date „la scară de gigawați” cu Microsoft și alți parteneri, începând din 2026. Dezvoltare accelerată și rolul AI în proiectare Un alt element operațional este viteza: OpenAI afirmă că Jalapeño a ajuns de la design inițial la „manufacturing tape-out” (momentul în care designul este finalizat și trimis spre fabricație) în nouă luni și susține că acesta ar fi cel mai rapid ciclu de dezvoltare ASIC din semiconductori avansați de înaltă performanță. Compania adaugă că a folosit propriile modele pentru a accelera părți din procesul de proiectare și optimizare. Context suplimentar apare și în analiza Ars Technica , care reia ideea că Jalapeño este un ASIC specializat pentru inferență în centre de date și că OpenAI încă nu a publicat măsurători finale, urmând să vină cu un raport tehnic ulterior. În lipsa unor benchmark-uri publice, impactul real va depinde de datele tehnice promise și de ritmul în care OpenAI și partenerii pot duce cipul din laborator în producție și apoi în exploatare la scară mare, până la finalul lui 2026. [...]