Știri
Știri din categoria Inteligență artificială

O acțiune colectivă în California acuză mari operatori de benzinării că au folosit un algoritm cu inteligență artificială pentru a crește coordonat prețurile, într-un posibil ocol al regulilor de concurență, potrivit WinFuture. Procesul vizează inclusiv companii precum Walmart, BP și 7-Eleven și se bazează pe un cadru legal californian relativ nou, care interzice explicit folosirea algoritmilor comuni de stabilire a prețurilor între competitori.
Plângerea a fost depusă luni, la Sacramento, de un grup de șoferi care susțin că operatorii au utilizat intenționat software de stabilire a prețurilor cu inteligență artificială pentru a majora „sistematic și nelegal” prețurile benzinei la nivelul întregului stat. În centrul acuzațiilor este o soluție a furnizorului Kalibrate, despre care reclamanții afirmă că ar procesa în timp real date confidențiale ale concurenților pentru a alinia automat prețurile și a reduce competiția.
Conform informațiilor citate de WinFuture din Bloomberg, în zonele unde software-ul Kalibrate ar fi fost folosit pe scară largă au fost observate majorări de până la 30 de cenți pe galon. (Sursa nu oferă o conversie în litri; un galon american înseamnă aproximativ 3,785 litri.) Aceeași sursă indică faptul că fiecare cent în plus ar costa anual șoferii din California circa 134 milioane de dolari (aprox. 603 milioane lei, la un curs orientativ de 4,5 lei/dolar), potrivit estimărilor menționate.
Miza economică a cazului este dublă: pe de o parte, eventuale despăgubiri pentru consumatori; pe de altă parte, un precedent care poate limita utilizarea „algoritmilor de preț” în retailul de carburanți, într-un moment în care astfel de instrumente sunt promovate ca soluții de optimizare comercială.
Potrivit acțiunii, companiile acuzate operează împreună peste 1.700 de stații de alimentare în California. Reclamanții solicită despăgubiri pentru toți șoferii care ar fi plătit în plus pe o perioadă mai lungă din cauza acestui mecanism. În proces este inclus și Kalibrate, ca furnizor al software-ului.
Până acum, reacțiile publice sunt limitate: Walmart a transmis doar că analizează plângerea și va răspunde în instanță, iar alte companii, inclusiv BP, au refuzat să comenteze sau nu au răspuns solicitărilor presei, conform materialului.
Recomandate

Marile companii încep să plafoneze folosirea AI în interior, pe fondul unei creșteri rapide a costurilor , iar primele măsuri vizează direct bugetele și consumul de „tokenuri” (unități de calcul folosite la tarifarea interogărilor), potrivit Ziarul Financiar . Amazon, Walmart, Uber, Cisco și Meta sunt printre grupurile care au trecut de la încurajarea adoptării la impunerea de limite și control mai strict al cheltuielilor, pe măsură ce implementarea la scară largă devine tot mai scumpă. Schimbarea vine într-un moment în care companiile trec de la utilizări relativ simple (chatboți și asistenți digitali) la „agenți AI” care pot executa autonom sarcini complexe. Acești agenți cer mai multă putere de calcul și, implicit, cresc factura operațională. Un factor care amplifică presiunea pe bugete este schimbarea modelelor comerciale ale furnizorilor. Potrivit materialului, OpenAI și Anthropic migrează de la abonamente fixe către tarifare bazată pe tokenuri, ceea ce înseamnă că firmele ajung să plătească direct pentru fiecare interogare și pentru fiecare flux automatizat. Sam Altman este citat spunând că, în 2026, costul utilizării AI a devenit una dintre principalele preocupări ale clienților. Plafonări și restricții: primele exemple concrete Ziarul Financiar notează două măsuri punctuale care ilustrează direcția: Uber a introdus un plafon de 1.500 de dolari pe lună (aprox. 6.900 lei) pentru consumul individual de tokenuri AI, după ce și-a epuizat bugetul alocat pentru 2026 încă din aprilie. Walmart a limitat utilizarea agenților AI interni prin restricționarea numărului de tokenuri disponibile angajaților. Mesajul operațional este că AI nu mai este tratată doar ca un instrument „gratuit” de productivitate, ci ca o resursă care trebuie bugetată și guvernată, similar cu alte costuri de infrastructură. De ce cresc costurile: agenții AI pot rula „în paralel” Executivi din industrie avertizează că presiunea se va accentua odată cu răspândirea agenților AI. Spre deosebire de chatboți, un singur angajat poate folosi simultan zeci sau chiar sute de agenți care rulează permanent și consumă resurse de calcul continuu, ceea ce duce la costuri recurente mai mari. În plus, analiștii Goldman Sachs estimează că utilizarea agenților AI va determina o creștere de 24 de ori a consumului de tokenuri până în 2030, ceea ce ar putea agrava deficitul global de cipuri în următoarele 12–18 luni , potrivit articolului. Efecte și pentru companiile mai mici, plus presiune competitivă din China Creșterea facturilor nu este limitată la giganți. Workato, o firmă de software, a raportat că factura sa pentru AI a crescut de șapte ori într-o singură zi după trecerea la tarifarea pe tokenuri introdusă de Anthropic. Pe partea de competiție, datele platformei OpenRouter arată că modelele chinezești au depășit omologii americani în consumul de tokenuri, avantajate de costuri energetice mai mici și modele mai eficiente, care le permit să ofere servicii la prețuri mai reduse. În concluzie, pe măsură ce utilizarea AI se extinde în procesele interne, costul infrastructurii și al consumului devine o problemă strategică pentru companii, comparabilă ca importanță cu alegerea tehnologiei în sine. [...]

OpenAI își atacă costurile de rulare ale modelelor printr-un cip propriu pentru „inference” (executarea modelelor deja antrenate), dezvoltat împreună cu Broadcom, într-o mișcare care poate reduce dependența companiei de plăcile grafice Nvidia și poate îmbunătăți economia serviciilor sale, potrivit TechCrunch . Procesorul, numit Jalapeño , este descris ca primul cip personalizat al OpenAI pentru inferență, proiectat și fabricat în colaborare cu Broadcom. Compania spune că propriile sale modele de inteligență artificială au ajutat la dezvoltarea cipului. Deși Jalapeño este încă în testare, OpenAI afirmă că rezultatele timpurii indică o performanță „semnificativ mai bună per watt” față de alternativele de vârf existente. În practică, o eficiență energetică mai bună poate însemna costuri mai mici pentru a rula modele în timp real, acolo unde cererea este continuă și volumul de solicitări este mare. De ce contează: inferența e o linie majoră de cost OpenAI poziționează Jalapeño ca un cip optimizat pentru inferență, adică pentru răspunsul la comenzi ale utilizatorilor folosind modele deja construite. În anunț, compania a pus accent pe costul redus de operare atunci când rulează modele de programare în timp real. TechCrunch notează că sarcinile mai intensive, precum pre-antrenarea (pre-training), ar urma probabil să rămână pe hardware Nvidia, însă chiar și reduceri mici ale costurilor de inferență pot avea un efect vizibil asupra profitabilității. Context: aceeași direcție ca Google și Amazon Parteneriatul OpenAI–Broadcom fusese anunțat oficial în octombrie, iar planurile OpenAI privind cipuri proprii au fost discutate de mai mult timp ca soluție pentru a reduce dependența de GPU-urile Nvidia. În același timp, Google și Amazon au mers pe o strategie similară, dezvoltând cipuri dedicate pentru accelerarea sarcinilor de învățare automată („acceleratoare AI”) — de exemplu, TPU la Google și Trainium la Amazon. Ce urmează: optimizare „pe tot stack-ul”, dar cipul e încă în testare Președintele OpenAI, Greg Brockman , a explicat într-un episod al podcastului intern al companiei că abordarea pornește de la înțelegerea detaliată a sarcinilor de lucru și de la identificarea zonelor „insuficient deservite”, unde un cip dedicat poate accelera semnificativ execuția. În mesajul companiei, OpenAI își descrie strategia ca o optimizare la nivelul întregii infrastructuri — de la arhitectura cipului și componente software de bază (precum „kernels”, adică rutine optimizate care rulează pe hardware) până la rețelistică, planificarea rulărilor și sistemele de implementare. Totuși, Jalapeño nu este încă un produs confirmat ca fiind în producție la scară largă: deocamdată, OpenAI spune doar că îl testează și că are rezultate preliminare promițătoare. [...]

OpenAI mizează pe standarde comune pentru evaluarea și guvernanța IA avansate , într-un demers care vizează reducerea riscurilor de siguranță și securitate prin criterii de testare comparabile între organizații și jurisdicții, potrivit OpenAI . Ideea centrală: pe măsură ce modelele devin mai capabile, guvernele și piața au nevoie de instituții și practici verificabile care să poată „traduce” standardele în evaluări aplicabile pe întreg lanțul de valoare. OpenAI spune că a contribuit la înființarea Appia Foundation , găzduită de Linux Foundation , care ar urma să dezvolte specificații deschise și modulare. Acestea sunt prezentate ca un mecanism practic de transformare a standardelor internaționale și a cadrelor existente în criterii de evaluare utilizabile, inclusiv pentru situațiile în care modele, infrastructură și aplicații sunt dezvoltate de organizații diferite. De ce contează: „stratul de încredere” pentru evaluări terțe Miza operațională și de reglementare este crearea unui „strat de încredere” prin care terți pot verifica conformitatea cu standarde, producând dovezi mai clare și reutilizabile. În viziunea OpenAI, un astfel de cadru ar facilita: evaluări comparabile între companii și produse, nu doar teste izolate; recunoașterea reciprocă a rezultatelor între instituții naționale și internaționale; o „limbă tehnică” comună care să permită coordonare în caz de incidente. Conectarea la instituții și cooperare internațională Materialul plasează inițiativa în contextul unui „blueprint” anterior al companiei pentru guvernanța democratică a IA de frontieră, care propune, între altele, un cadru durabil în SUA și consolidarea Center for AI Standards and Innovation (CAISI). OpenAI argumentează că riscurile asociate sistemelor de frontieră sunt internaționale și că statele ar trebui să lucreze la cadre compatibile de siguranță, canale de încredere pentru schimbul de constatări și răspunsuri coordonate la incidente. Ce standardizează, concret, evaluările OpenAI face trimitere la un „playbook” pentru evaluări terțe de încredere, unde sunt enumerate tipurile de informații pe care evaluările pentru sisteme de frontieră ar trebui să le dezvăluie mai des, inclusiv: ce sistem a fost testat, accesul la instrumente și „harness”-ul de evaluare (configurația/procedura de testare), metodele folosite pentru a evidenția capabilități, resursele disponibile și verificările pentru validarea rezultatelor. Compania mai afirmă că a aplicat aceste principii în parteneriate de testare cu CAISI (SUA) și UK AISI (Marea Britanie), iar activitatea acestora privind evaluări de capabilități și măsuri împotriva utilizărilor abuzive în zona biologică ar fi dus la îmbunătățiri concrete ale sistemelor OpenAI. Cum se leagă de cadrele interne ale OpenAI Inițiativa este prezentată ca complementară infrastructurii de siguranță a companiei, inclusiv Preparedness Framework (cadru pentru definirea și operaționalizarea gestionării riscurilor majore) și Frontier Governance Framework (document public de guvernanță care include obligații de reglementare precum evaluarea riscurilor, raportarea modelelor, controale de securitate și răspuns la incidente). În acest tablou, Appia ar urmări „următoarea provocare”: interoperabilitatea practicilor între organizații, jurisdicții și pe lanțul de aprovizionare, astfel încât guverne, companii și evaluatori independenți să poată folosi metode tehnice deschise „peste granițe”. [...]

Google își reproiectează acceleratoarele TPU pentru a rula antrenarea și inferența pe același cip , iar pentru generația TPUv9 „Triggerfish” a apelat din nou la MediaTek, potrivit Wccftech . Miza este una operațională: reducerea fragmentării între cipuri dedicate (separat pentru antrenare și pentru inferență) și simplificarea modului în care sunt comutate sarcinile de lucru în aplicații de tip „agentic AI” (modele care execută pași multipli și iau decizii pe parcurs). Ce se schimbă la TPUv9 „Triggerfish” Din informațiile citate de publicație, TPUv9 „Triggerfish” ar urma să combine capabilități de antrenare și inferență într-o singură soluție, cu câteva elemente tehnice orientate direct spre utilizare în centre de date: SRAM mai mare , menționat ca fiind de 2–3 ori față de generația anterioară, pentru a susține fluxuri de lucru mai complexe. Un „CPU tile” (o componentă CPU separată în același pachet) adăugat de MediaTek, care ar avea rolul de a gestiona comutarea sarcinilor între antrenare și inferență. Integrarea CPU-ului și a „compute die”-ului (matrița principală de calcul) în același pachet , pentru a reduce penalizările de comunicare dintre componente. Calendarul estimat și volumele invocate Wccftech, citând un raport FundaAI, notează că seria TPUv9 este așteptată să intre în producție de masă în T3 2027 , cu „Humufish” primul, urmat de „Triggerfish” în T4 2027 , iar ambele ar urma să ajungă la „volume ramp” (creștere accelerată a producției) în 2028 . În același context, publicația menționează o estimare potrivit căreia livrările totale de TPU în 2027 ar putea fi de circa 10–11 milioane de unități . Este o proiecție din surse de analiză, nu o cifră confirmată oficial de Google. Implicații pentru lanțul de aprovizionare: TSMC , Intel și ambalarea avansată Materialul mai indică o posibilă împărțire a rolurilor între producție și ambalare (packaging), într-un moment în care ambalarea avansată a devenit un blocaj pentru industria de cipuri AI: Deși au existat informații că unele TPU ar putea fi fabricate la Intel (cu un ordin de mărime de până la 3 milioane de unități, potrivit unor rapoarte anterioare), analiști citați susțin că fabricarea ar rămâne la TSMC , iar Intel ar putea prelua partea de ambalare . Pentru „Humufish”, Wccftech scrie că ar urma să fie folosit Intel EMIB (o tehnologie de interconectare în pachet), prezentată ca alternativă mai flexibilă și cu costuri mai mici față de CoWoS (o abordare 2,5D folosită pe scară largă în acceleratoarele AI). Publicația menționează și un scenariu în care Google ar putea muta o parte din capacitate către Intel Foundry , pe fondul „bottleneck”-urilor din lanțul de aprovizionare și al încărcării TSMC cu comenzi de la NVIDIA, AMD și Apple. Memorie: HBM4E pentru Triggerfish Pentru partea de memorie, articolul afirmă că: TPUv9 „Triggerfish” ar urma să folosească HBM4E ; TPUv9 „Humufish” ar urma să folosească HBM4 . HBM (High Bandwidth Memory) este memoria cu lățime de bandă foarte mare folosită în acceleratoare AI, iar trecerea la generații noi este relevantă pentru performanță și disponibilitate, în condițiile în care cererea globală rămâne ridicată. De ce contează Dincolo de numele de cod, direcția indicată de aceste informații sugerează că Google încearcă să consolideze antrenarea și inferența într-o singură platformă TPU , reducând dependența de configurații separate și optimizând comutarea sarcinilor în aplicații „agentic AI”. Dacă planul de producție (T3/T4 2027) se confirmă, următoarea etapă de urmărit va fi cum își împarte Google efectiv producția și ambalarea între TSMC și Intel, într-o piață în care capacitatea de packaging avansat a devenit la fel de critică precum fabricarea propriu-zisă. [...]

Întreruperea Claude a lovit simultan chat-ul și API-ul, riscând să blocheze fluxuri de lucru în companii , după ce Anthropic a confirmat că „investighează” problema și implementează o remediere, potrivit TechRadar . Problemele au început în jurul orei 10:02 ET (17:02, ora României), când a apărut un vârf de raportări pe Downdetector . La momentul relatării, numărul sesizărilor din SUA depășise 8.000, semn că incidentul a afectat un volum mare de utilizatori. Ce servicii au fost afectate și ce a comunicat Anthropic Pagina oficială Claude Status a indicat „o rată ridicată de erori” la nivelul modelelor și a transmis că „se implementează o remediere”. Ulterior, statusul a fost actualizat cu mesajul că „o remediere a fost implementată și monitorizăm rezultatele”. Din informațiile publicate, întreruperea a fost una extinsă, vizând: toate modelele Claude; atât conturile gratuite, cât și cele plătite; mai multe platforme Claude (interfața de chat, Claude Code, Claude Cowork și API-ul), cu excepția „Claude for Government”, menționat ca neafectat. Utilizatorii au raportat fie blocarea răspunsurilor („gândește” fără să finalizeze), fie mesaje de tipul „acest model nu este disponibil acum”. Evoluția incidentului: semne de revenire, dar cu întârzieri Pe parcursul zilei, raportările de pe Downdetector au început să scadă, însă mii de utilizatori ar fi rămas în continuare cu probleme, inclusiv în redacția TechRadar . Publicația notează că, după aproximativ o oră de la remedierea anunțată de Anthropic, serviciul a revenit pentru mulți utilizatori, deși cu întârzieri în răspunsuri în unele cazuri. TechRadar compară incidentul cu întreruperea semnificativă din 2 iunie, despre care spune că a fost mai mică și legată de modelul Opus 4.6, în timp ce întreruperea din 23 iunie ar fi fost „mai mare” și extinsă la toate modelele și platformele. De ce contează pentru companii Faptul că au fost afectate atât interfața de chat, cât și API-ul sugerează un impact operațional direct: de la utilizarea zilnică a asistentului în echipe până la aplicații și procese interne care depind de integrarea Claude. Anthropic a indicat că monitorizează situația după implementarea remedierii, ceea ce lasă deschisă posibilitatea unor probleme reziduale pe termen scurt. [...]

SpaceX își consolidează pivotul spre afacerea de „închiriere” de putere de calcul , după ce a semnat cu Reflection AI un contract de circa 6,3 miliarde de dolari (aprox. 29 mld. lei) până în 2029, potrivit The Next Web . Acordul adaugă un nou chiriaș major în centrele de date „Colossus” din Memphis și întărește ideea că SpaceX monetizează infrastructura AI ca linie de business separată, nu doar ca suport pentru propriile modele. Reflection AI va plăti 150 milioane de dolari pe lună (aprox. 690 mil. lei) pentru a închiria cipuri Nvidia în „Colossus 2”, cu plăți începând de la 1 iulie 2026 și până în 2029, suma totală ajungând la aproximativ 6,3 miliarde de dolari, conform CNBC (link în sursă). The Information a relatat prima despre tranzacție, iar contractul permite oricăreia dintre părți să renunțe cu un preaviz de 90 de zile după primele trei luni. Puterea de calcul ar rula pe sisteme Nvidia GB300, menționează publicația. Nvidia, furnizor și investitor în același timp Structura tranzacției este relevantă pentru dinamica pieței: Nvidia nu doar furnizează hardware-ul (cipurile), ci este și investitor în Reflection AI. Tech Funding News (link în sursă) scrie că Nvidia ar fi investit circa 800 milioane de dolari (aprox. 3,7 mld. lei) în startup anul trecut, ceea ce pune compania „de ambele părți” ale contractului: vinde tehnologia și sprijină financiar clientul care o închiriază. Cine este Reflection AI și ce urmărește Reflection AI este un startup „open-source” (în sensul că promovează „open weights” – modele cu parametri publicați, spre deosebire de laboratoarele „închise”), fondat în 2024 de Misha Laskin și Ioannis Antonoglou, ambii foști Google DeepMind; Antonoglou a contribuit la dezvoltarea AlphaGo, potrivit articolului. Compania a atras 2 miliarde de dolari (aprox. 9,2 mld. lei) în octombrie, la o evaluare de 8 miliarde de dolari (aprox. 36,8 mld. lei), cu Nvidia, Sequoia și Lightspeed printre investitori. Acum ar strânge din nou capital la o evaluare de 25 miliarde de dolari (aprox. 115 mld. lei), potrivit Bloomberg (link în sursă). The Next Web notează că Reflection nu a lansat încă un „frontier model” public (model de vârf, la limita performanței curente), iar compania are legături cu proiecte ale Departamentului Energiei din SUA și inițiative AI ale Pentagonului. SpaceX, din constructor de infrastructură pentru Grok în „proprietar” de centre de date Miza economică pentru SpaceX este că „Colossus” a devenit, în practică, o afacere de închiriere de capacitate. Publicația afirmă că SpaceX a construit inițial Colossus pentru Grok (modelul xAI), dar ulterior a transformat situl într-un business de tip „compute landlord”, inclusiv pe fondul faptului că nu ar fi reușit să facă centrul de date să funcționeze pentru propriile modele. Reflection intră într-o listă de chiriași care, potrivit articolului, include deja: Anthropic , cu plăți de aproximativ 1,25 miliarde de dolari pe lună (aprox. 5,75 mld. lei); Google, cu 920 milioane de dolari pe lună (aprox. 4,23 mld. lei). Tech Funding News mai susține (link în sursă) că aceste contracte ar duce SpaceX la peste 80 miliarde de dolari (aprox. 368 mld. lei) venituri angajate din compute până în 2029. Context operațional: Colossus 2 și dimensiunea infrastructurii Colossus 2 este campusul mai nou dintre cele două din Memphis. Colossus 1 ar găzdui deja peste 220.000 de GPU-uri Nvidia, iar SpaceX ar viza ca întregul complex să ajungă la o putere de 2 gigawați, ceea ce ar transforma Memphis într-una dintre cele mai mari concentrări de putere de calcul pentru AI, potrivit articolului. De ce contează Deși contractul cu Reflection (150 milioane de dolari/lună) este mult mai mic decât cel cu Anthropic, The Next Web îl tratează ca pe un semnal: infrastructura SpaceX ajunge să finanțeze, prin capacitate disponibilă, și „tabăra” modelelor deschise din cursa AI. În paralel, pentru Nvidia, tranzacția este încă un exemplu de model în care compania „vinde uneltele” și deține participații în „mina” care le folosește. [...]