Știri
Știri din categoria Inteligență artificială

Marile companii încep să plafoneze folosirea AI în interior, pe fondul unei creșteri rapide a costurilor, iar primele măsuri vizează direct bugetele și consumul de „tokenuri” (unități de calcul folosite la tarifarea interogărilor), potrivit Ziarul Financiar. Amazon, Walmart, Uber, Cisco și Meta sunt printre grupurile care au trecut de la încurajarea adoptării la impunerea de limite și control mai strict al cheltuielilor, pe măsură ce implementarea la scară largă devine tot mai scumpă.
Schimbarea vine într-un moment în care companiile trec de la utilizări relativ simple (chatboți și asistenți digitali) la „agenți AI” care pot executa autonom sarcini complexe. Acești agenți cer mai multă putere de calcul și, implicit, cresc factura operațională.
Un factor care amplifică presiunea pe bugete este schimbarea modelelor comerciale ale furnizorilor. Potrivit materialului, OpenAI și Anthropic migrează de la abonamente fixe către tarifare bazată pe tokenuri, ceea ce înseamnă că firmele ajung să plătească direct pentru fiecare interogare și pentru fiecare flux automatizat. Sam Altman este citat spunând că, în 2026, costul utilizării AI a devenit una dintre principalele preocupări ale clienților.
Ziarul Financiar notează două măsuri punctuale care ilustrează direcția:
Mesajul operațional este că AI nu mai este tratată doar ca un instrument „gratuit” de productivitate, ci ca o resursă care trebuie bugetată și guvernată, similar cu alte costuri de infrastructură.
Executivi din industrie avertizează că presiunea se va accentua odată cu răspândirea agenților AI. Spre deosebire de chatboți, un singur angajat poate folosi simultan zeci sau chiar sute de agenți care rulează permanent și consumă resurse de calcul continuu, ceea ce duce la costuri recurente mai mari.
În plus, analiștii Goldman Sachs estimează că utilizarea agenților AI va determina o creștere de 24 de ori a consumului de tokenuri până în 2030, ceea ce ar putea agrava deficitul global de cipuri în următoarele 12–18 luni, potrivit articolului.
Creșterea facturilor nu este limitată la giganți. Workato, o firmă de software, a raportat că factura sa pentru AI a crescut de șapte ori într-o singură zi după trecerea la tarifarea pe tokenuri introdusă de Anthropic.
Pe partea de competiție, datele platformei OpenRouter arată că modelele chinezești au depășit omologii americani în consumul de tokenuri, avantajate de costuri energetice mai mici și modele mai eficiente, care le permit să ofere servicii la prețuri mai reduse.
În concluzie, pe măsură ce utilizarea AI se extinde în procesele interne, costul infrastructurii și al consumului devine o problemă strategică pentru companii, comparabilă ca importanță cu alegerea tehnologiei în sine.
Recomandate

OpenAI își întărește echipa de politică și strategie înainte de listare , aducând în organizație atât un nume-cheie din cercetarea AI, cât și un fost oficial din zona de politici publice, într-o mișcare care sugerează o pregătire mai atentă pentru presiunea de reglementare și pentru evaluarea riscurilor odată cu apropierea unui IPO, potrivit TechCrunch . OpenAI îl recrutează pe Noam Shazeer , descris ca „legendă” a Google DeepMind și co-lider al Gemini, precum și pe Dean Ball, fost oficial în zona de politică AI în administrația Trump. Publicația notează că mutarea se înscrie într-un val mai larg de „rotații” între marile laboratoare de inteligență artificială (Google, OpenAI, Anthropic, Meta), pe fondul competiției pentru talent și influență. De ce contează: IPO-ul aduce în prim-plan guvernanța și riscurile Dincolo de întărirea capacității tehnice, recrutarea lui Ball indică o miză directă pe guvernanță internă și pe poziționarea companiei în raport cu autoritățile, într-un moment în care politicile pentru „modele de frontieră” (cele mai avansate sisteme AI) devin un subiect central pentru investitori și pentru reglementatori. Ball a anunțat că, din 6 iulie, va conduce la OpenAI o echipă nouă, „ Strategic Futures ”, cu mandatul de a ajuta conducerea companiei să modeleze politica publică pentru AI de frontieră. El va raporta direct către Chief Strategy Officer, Jason Kwon. Ce va face noua echipă „Strategic Futures” Într-o postare, Ball a descris echipa drept una „mică” și cu autonomie ridicată, concentrată pe teme precum: risc catastrofal; „auto-îmbunătățire recursivă” (ideea că un sistem AI ar putea contribui la îmbunătățirea propriilor capacități, în buclă); impact asupra pieței muncii; relația dintre laboratoarele de AI de frontieră, guverne (în special guvernul federal al SUA) și societate. Ball a mai spus că echipa va acoperi atât politica publică „la vedere”, cât și guvernanța internă, subliniind că, „aproape prin necesitate”, laboratoarele AI vor ajunge să conducă decizii de guvernanță. Recrutarea lui Shazeer: întărire tehnică, cu potențial de controversă Noam Shazeer a anunțat plecarea de la Google, unde lucrase din 2000, cu o pauză de trei ani în care a cofondat startup-ul Character AI. TechCrunch amintește că Google l-a reangajat în urmă cu doi ani într-o tranzacție de 2,7 miliarde de dolari, care a oferit gigantului acces la tehnologia Character AI. Shazeer este creditat ca unul dintre oamenii de bază ai AI generative moderne, fiind coautor al lucrării din 2017 „Attention Is All You Need”, care a introdus arhitectura Transformer (fundamentul multor modele lingvistice actuale). Publicația menționează și că, potrivit The Information, Shazeer a avut intervenții pe teme politice pe forumuri interne, unele postări fiind șterse de management; rămâne de văzut dacă aceste controverse îl vor urma la noul angajator. Context: presiunea politică asupra rivalilor crește TechCrunch leagă recrutarea lui Ball de un moment în care Anthropic se confruntă din nou cu guvernul SUA: președintele Donald Trump a ordonat recent o interdicție de export pentru cele mai noi modele ale companiei, Fable 5 și Mythos 5, ceea ce ar fi forțat Anthropic să le retragă pentru a evita neconformarea. Publicația precizează că a contactat OpenAI pentru informații suplimentare. [...]

Amazon își bazează recuperarea în AI pe cipuri proprii și pe „pariul” Anthropic, mizând pe venituri din cloud indiferent de câștigător , potrivit The Next Web . Șeful diviziei de AI a companiei, Peter DeSantis , a recunoscut că modelele Amazon „nu au fost chiar în avangardă” pentru cele mai mari și mai solicitante sarcini și spune că speră ca Amazon să fie „în discuția” despre modelele de top „în anul care vine”. Declarația, făcută pentru CNBC (link în sursă), este relevantă pentru piață nu doar ca poziționare tehnologică, ci ca semnal despre cum încearcă Amazon să transforme decalajul față de OpenAI și Anthropic într-un avantaj economic: să monetizeze infrastructura (AWS) și cipurile proprii, chiar și atunci când clienții aleg modele concurente. Strategia „dublă”: marketplace de modele și propriile modele Amazon rulează în paralel două direcții. Pe de o parte, Bedrock – „piața” de modele din AWS – permite clienților să acceseze, printr-un singur serviciu, modele de la OpenAI, Anthropic, Meta și Mistral. În această configurație, Amazon poate genera venituri indiferent ce model devine dominant, pentru că încasează din consumul de cloud. Pe de altă parte, compania își dezvoltă propriile modele. The Next Web notează că Nova2, modelul intern lansat în decembrie, a atras aproximativ 50.000 de clienți, dar nu a egalat capabilitățile Claude (Anthropic) sau GPT-5.5 (OpenAI) pentru cele mai solicitante utilizări din mediul enterprise și cercetare – context care explică „franchețea” lui DeSantis. „Plasa” pentru investitori: expunere la Anthropic și venituri AWS În paralel cu dezvoltarea internă, Amazon și-a consolidat expunerea la Anthropic: a angajat investiții de până la 33 miliarde dolari (aprox. 152 mld. lei), inclusiv un acord de 25 miliarde dolari (aprox. 115 mld. lei) semnat în aprilie, care oferă Anthropic acces la până la cinci gigawați de capacitate de calcul pe cipurile Trainium ale Amazon. În schimb, Anthropic s-a angajat să cheltuiască peste 100 miliarde dolari (aprox. 460 mld. lei) pe AWS în următorul deceniu. Structura arată de ce Amazon poate câștiga financiar chiar dacă modelele sale rămân în urma liderilor: profită atât din participația în Anthropic, cât și din veniturile de cloud generate de consumul Anthropic. Publicația mai arată că rezultatele Amazon din T1 2026 au fost umflate de un câștig de 16,8 miliarde dolari (aprox. 77 mld. lei) legat de Anthropic, în timp ce fluxul de numerar liber a scăzut cu 95%. Planul de recuperare: Trainium, date proprii și scală de inginerie Pentru a reduce decalajul, DeSantis indică trei pârghii: cipuri AI proprii, date de antrenare proprietare (din operațiunile de retail și logistică) și capacitatea de execuție a unei echipe care acoperă modele de frontieră, proiectare de siliciu și cercetare în zona cuantică. The Next Web notează că cipurile Trainium alimentează deja majoritatea sarcinilor de inferență (rulare a modelelor) din Bedrock, iar Trainium3 – așteptat mai târziu în acest an – ar urma să aducă o performanță de patru ori mai mare decât generația anterioară. Rămâne însă o întrebare deschisă, în absența unor repere măsurabile: dacă cipurile proprii și datele interne pot compensa avansul de mai mulți ani al laboratoarelor care au investit miliarde în antrenarea modelelor de frontieră. DeSantis a indicat un orizont de „anul care vine”, dar fără benchmark-uri (teste standardizate) care să permită evaluarea progresului. [...]

ChatGPT a coborât sub 50% cotă de piață, semn că piața asistenților AI intră într-o fază mai competitivă și mai orientată spre monetizare , potrivit HotNews , care citează raportul „State of AI” 2026 al firmei de analiză Sensor Tower . Datele indică o schimbare de dinamică într-un segment care, până recent, părea dominat aproape incontestabil de OpenAI: la începutul anului, ChatGPT era încă peste 50%, dar până la finalul lunii mai a scăzut la 46,4%, pe fondul creșterii rapide a rivalilor. Cine câștigă teren și cum arată împărțirea pieței Conform estimărilor Sensor Tower, avansul vine în special din două direcții: Gemini (Google) : 27,7% cotă de piață, alimentată în mare parte de integrarea în ecosistemul mai larg de instrumente Google; Claude (Anthropic) : 10,3% cotă de piață, cu o reputație puternică pentru sarcini de productivitate și, prin Claude Code, utilizare intensă în rândul programatorilor. Alți asistenți — inclusiv Grok (xAI), Perplexity, DeepSeek și Meta AI — sunt menționați cu sub 5% fiecare. De ce contează pentru business: utilizatorii schimbă mai ușor aplicația, iar banii cresc Raportul „State of AI” 2026, citat de TechCrunch, estimează că între începutul anului și finalul lunii iunie utilizatorii vor descărca aproape 2,3 miliarde de aplicații AI și vor cheltui peste 4,2 miliarde de dolari (aprox. 19,3 miliarde lei) pe acestea. În aceeași perioadă a anului trecut, cheltuielile au fost de 1,83 miliarde de dolari (aprox. 8,4 miliarde lei), ceea ce sugerează o mutare a industriei de la „creștere cu orice preț” către monetizare . În același timp, raportul notează că atât ritmul descărcărilor, cât și cel al cheltuielilor încetinesc, un posibil semn de maturizare a pieței, chiar dacă valorile absolute continuă să urce. Încrederea în brand începe să conteze în utilizare Un alt semnal operațional important: utilizatorii sunt „din ce în ce mai dispuși” să treacă de la un asistent la altul, iar anumite evenimente pot accelera migrarea. Ca exemplu, raportul menționează că acordul încheiat în februarie de OpenAI cu Departamentul Apărării al SUA a declanșat un vârf măsurabil al dezinstalărilor, sugerând că pentru o parte dintre utilizatori contează nu doar funcțiile, ci și încrederea în companie și alinierea la anumite valori. Utilizatori și abonamente: două modele diferite de tracțiune Sensor Tower indică și o diferențiere între popularitate și capacitatea de a transforma utilizarea în venituri recurente: ChatGPT ar fi ajuns la un miliard de utilizatori activi lunar , cu o creștere de 200 de milioane din februarie; Gemini are 662 de milioane de utilizatori activi lunar, iar Claude 245 de milioane . Pe partea de monetizare, Claude iese în evidență: 13% dintre utilizatorii Anthropic plătesc un abonament , o rată de conversie prezentată drept un reper relevant pentru investitori atunci când evaluează cât de sustenabile sunt veniturile companiilor din AI. În paralel, raportul estimează că timpul petrecut în aplicațiile AI va urca de la 17,2 miliarde de ore în prima jumătate din 2025 la aproximativ 36 de miliarde de ore în prima jumătate a acestui an, pe fondul utilizării tot mai frecvente pentru productivitate și al apetitului mai mare pentru funcții premium, în special în SUA. [...]

HyperLight a atras 80 mil. dolari (aprox. 368 mil. lei) într-o rundă condusă de jucători-cheie din lanțul de producție hardware , un semnal că industria începe să parieze pe o alternativă la siliciu pentru interconectările optice necesare clusterelor uriașe de GPU-uri, potrivit The Next Web . Pe măsură ce infrastructura de inteligență artificială se extinde spre sute de mii de GPU-uri, „gâtul de sticlă” se mută de la cipuri la legăturile dintre ele: conexiunile din cupru, folosite pentru a transporta date, ajung la limite de viteză și consum energetic. În acest context, industria încearcă să mute traficul de date pe fibră/optică, adică pe lumină. Pariul HyperLight: niobat de litiu în strat subțire, nu siliciu HyperLight, companie desprinsă din Harvard și cu sediul în Cambridge (Massachusetts), dezvoltă componente pe bază de „thin-film lithium niobate” (TFLN) – niobat de litiu în strat subțire –, un material folosit pentru a converti semnale electrice în semnale optice la viteză mare, cu consum redus și pierderi mici, conform aceleiași surse. Majoritatea competitorilor construiesc optica pe siliciu („silicon photonics”). HyperLight susține că TFLN poate performa mai bine, mai ales pe măsură ce cresc vitezele de interconectare. Compania spune că platforma sa „Chiplet” ar acoperi, într-un design fabricabil, atât legături scurte din centrele de date, cât și conexiuni mai lungi, de tip telecom. În stadiul actual, HyperLight afirmă că: produse la 200G per bandă sunt deja livrate; componente la 400G per bandă sunt în faza de testare la clienți („sampling”). De ce contează: finanțarea vine de la cei care pot fabrica și cumpăra tehnologia Miza rundei nu este doar suma, ci componența investitorilor. Finanțarea a fost condusă de MediaTek , iar printre investitori se află Foxconn și Jabil (producție/assemblare), UMC (turnătorie/„foundry”), EDBI (Singapore), CDIB-TEN Capital (Taiwan) și Qatar Investment Authority. Publicația interpretează această structură ca pe un indiciu de „aliniere de ecosistem”: adică firmele care ar putea produce la scară și integra tehnologia în lanțurile lor de aprovizionare au un interes direct în reușita ei. CEO-ul Mian Zhang este citat astfel: „Această finanțare este despre mai mult decât capital. Este despre alinierea ecosistemului.” Ce urmează și care este limita informațiilor Potrivit articolului, banii vor merge către capacitate de producție , calificarea la clienți (procesul prin care un furnizor este validat pentru utilizare în produse/instalații) și relații mai strânse cu partenerii de tip foundry . În același timp, The Next Web notează explicit o rezervă: afirmațiile tehnice sunt ale companiei , iar o parte dintre investitori ar beneficia direct dacă TFLN devine materialul dominant pentru interconectările optice din infrastructura AI. În final, adoptarea la scară va depinde de piață și de capacitatea de a produce în volum, nu de anunțul de finanțare. [...]

Google își folosește bilanțul pentru a atrage clienți de centre de date către propriile cipuri TPU, replicând mecanismele de finanțare care au alimentat ascensiunea Nvidia , potrivit The Next Web . Miza nu este doar tehnologică, ci financiară: garanții și structuri de tip „finanțare circulară” pot muta cererea de la GPU-urile Nvidia către alternative, dar cresc și dependența industriei de datorie pentru extinderea infrastructurii AI. Garanții de miliarde pentru a împinge TPU-urile în centrele de date Un exemplu central este un cluster de centre de date pentru AI din vestul statului New York, cunoscut ca Lake Mariner . Acolo, Google ar fi oferit o garanție financiară de 3,2 miliarde de dolari (aprox. 14,7 miliarde lei), conform unei investigații The Wall Street Journal citate de publicație. Dezvoltatorii sitului, TeraWulf și furnizorul de cloud FluidStack (susținut de Google), ar urma să închirieze putere de calcul de la mii de unități TPU ale Google către Anthropic . Efectul economic al garanției este reducerea costului finanțării: centrul de date poate atrage datorie mai ieftină, un mecanism pe care Nvidia l-ar fi folosit în mod repetat pentru a stimula cererea pentru propriile cipuri. „Finanțarea circulară”: banii se întorc sub formă de comenzi de cipuri A doua tactică descrisă este „finanțarea circulară”, un aranjament în care o parte din banii investiți de producătorul de cipuri se întorc la acesta sub formă de achiziții ale propriilor produse. În aceeași logică, Google ar susține mai multe proiecte legate de Anthropic, inclusiv: un centru de date de 7 miliarde de dolari (aprox. 32,2 miliarde lei) numit River Bend, lângă Baton Rouge; încă 1,4 miliarde de dolari (aprox. 6,4 miliarde lei) în garanții pentru un contract de închiriere de capacitate de calcul în Colorado City, Texas. Aceste inițiative se suprapun peste un acord amplu de capacitate de calcul între Google și Broadcom (menționat de publicație) și peste un aranjament de credit privat de circa 35 miliarde de dolari (aprox. 161 miliarde lei), intermediat de Apollo și Blackstone, care cumpără TPU-uri Google și le închiriază către Anthropic. De ce contează: presiune reală pe „șanțul” Nvidia, dar și risc mai mare pe datorie Google nu mai păstrează TPU-urile doar pentru uz intern. Publicația notează că, în mai, compania a spus că va începe să vândă TPU-uri direct clienților și a prezentat primul cip construit special pentru „inferință” (rularea interogărilor AI, nu antrenarea modelelor). Totodată, Google a anunțat un acord de 5 miliarde de dolari (aprox. 23 miliarde lei) cu Blackstone pentru lansarea unei companii de cloud care vizează furnizori susținuți de Nvidia, precum CoreWeave și Nebius, și a indicat luna aceasta că ar urma să strângă 85 miliarde de dolari (aprox. 391 miliarde lei) capital propriu, în mare parte pentru infrastructură AI. Pe partea operațională, argumentul de cost începe să apară: Citadel Securities, un utilizator timpuriu, spune că rulează unele sarcini cu costuri cu 30% mai mici și cu viteze de până la patru ori mai mari pe TPU-uri. Nvidia, care deține „peste 90%” din piața cipurilor pentru AI, își apără poziția prin ecosistemul software CUDA și hardware-ul ușor de integrat. Jensen Huang a minimalizat amenințarea, susținând că Anthropic ar fi singurul client extern important pentru TPU-uri și provocând Google să demonstreze că cipurile sunt mai ieftine. Pentru piață, testul real este dacă Google poate transforma avantajul de bilanț într-o schimbare de comportament la nivelul centrelor de date. Dacă modelul prinde, competiția pe cipuri AI se mută parțial din laborator în zona de finanțare — cu un efect secundar: extinderea AI devine și mai dependentă de structuri alimentate de datorie și de mecanisme „circulare”, care pot amplifica riscul în cazul unei încetiniri a cererii. [...]

Comisia Europeană își automatizează o parte din munca de extindere cu un instrument intern de inteligență artificială , folosit pentru a verifica dacă legislația țărilor candidate este aliniată la regulile UE, pe fondul accelerării dosarelor de aderare și al presiunii pe resursele administrative, potrivit Digi24 , care citează Politico. Instrumentul, descris de doi funcționari implicați în extindere, este o creație proprie a Comisiei Europene. Executivul UE a lansat în 2024 GPT@EC, un instrument de inteligență artificială generativă destinat personalului, invocând temeri de confidențialitate și securitate legate de utilizarea unor servicii americane precum ChatGPT și Claude. Miza este una operațională: mai multe țări avansează simultan în procesul de aderare, ceea ce pune presiune pe Direcția Generală pentru Extindere și Vecinătatea de Est (DG ENEST) , structura care gestionează dosarele de aderare. În acest context, Ucraina și Republica Moldova au intrat luni în prima fază a procesului de aderare, iar Muntenegru a închis încă două capitole de aderare în această săptămână, ajungând la 16 din 33. În paralel, Albania ar înregistra progrese, în timp ce cererile Serbiei, Bosniei și Herțegovinei, Kosovo, Macedoniei de Nord și Georgiei au avansat lent sau s-au blocat. Totodată, Islanda urmează să organizeze în august un referendum pentru a decide dacă își relansează demersul de aderare, pe fondul unui context geopolitic care a crescut urgența extinderii, după invazia Rusiei în Ucraina și amenințările președintelui american Donald Trump privind anexarea Groenlandei. Comisarul pentru extindere, Marta Kos, a indicat ritmul accelerat al activității din ultimul an și jumătate: „În ultimele 16, 17 luni, am realizat mai mult decât în cei 15 ani anteriori.” Rezerve din partea țărilor candidate: AI, util mai ales la sarcini simple Potrivit Politico, există scepticism în rândul unor reprezentanți ai țărilor candidate privind utilizarea inteligenței artificiale pentru evaluări complexe. Doi funcționari din două țări candidate diferite au spus că instrumentul ar trebui folosit mai degrabă pentru traduceri și sarcini simple, nu pentru chestiuni cu grad ridicat de complexitate, invocând riscul de erori. Cadru de utilizare în instituțiile UE Articolul mai notează că și alte departamente ale Comisiei folosesc instrumente de inteligență artificială. În același timp, toate cele trei instituții principale ale UE au interzis personalului să utilizeze videoclipuri și imagini generate artificial în comunicările oficiale. [...]