Știri
Știri din categoria Inteligență artificială

Consumul intern de „tokeni” la OpenAI a ajuns la niveluri care pun presiune pe costuri, în condițiile în care unii angajați ar folosi lunar aproximativ 100 de miliarde de tokeni, potrivit declarațiilor CEO-ului Sam Altman, citate de iThome.
Altman a spus, într-un eveniment dedicat clienților corporate (marți, ora locală), că „campionul” consumului de tokeni din interiorul companiei ajunge la circa 100 de miliarde pe lună. Prin comparație, în urmă cu șase ani și jumătate, cel mai mare consumator intern folosea aproximativ 100.000 de tokeni lunar — un nivel pe care Altman l-a descris drept aproape cel mai ridicat la nivel global la acel moment. Acum, același ordin de mărime ar fi ajuns „aproape” la nivelul mediu global de utilizare, potrivit lui.
Deși consumul intern este foarte mare, Altman a precizat că nu ar fi cel mai ridicat din lume: OpenAI ar fi identificat un utilizator extern cu un consum și mai mare, situație pe care CEO-ul a spus că a găsit-o „jenantă” în plan personal.
În material se menționează că folosirea intensă a tokenilor ar fi devenit o „modă” internă: OpenAI ar avea un clasament al consumului, iar unii angajați ar publica pe X capturi cu utilizarea lor ridicată. Contextul e relevant economic deoarece tokenii sunt unitatea de măsură folosită la facturarea utilizării modelelor (pe scurt, fragmente de text procesate), iar OpenAI este și vânzătorul acestor servicii.
Sursa mai indică exemple de consum extrem, atribuite unor terți:
În timp ce OpenAI ar tolera consumul intern ridicat, alte companii ar fi trecut la măsuri de control al costurilor, potrivit aceleiași surse:
Altman a mai spus că OpenAI lucrează la optimizarea modelelor proprii și caută soluții de reducere a costurilor, cu obiectivul de a „crea valoare mai mare la costuri mai mici”. El a susținut și că problema costurilor AI a devenit vizibilă brusc: la începutul lui 2026 „nimănui nu-i păsa” de cheltuieli, însă acum costul utilizării AI a devenit o problemă majoră care trebuie rezolvată.
Recomandate

OpenAI își extinde accesul „trusted-access” la GPT‑Rosalind , un model pentru cercetare în științele vieții, mizând pe o combinație de capabilități avansate de lucru cu instrumente și pe evaluări specializate care promit eficiență mai bună în fluxuri de analiză și laborator. Potrivit OpenAI , actualizarea din seria GPT‑Rosalind este construită pentru cercetare la scară „enterprise” (organizații mari) și este disponibilă în „research preview” (acces limitat, de test) pentru organizații eligibile la nivel global. Modelul combină capabilități de „agentic coding” și utilizare de instrumente (adică poate planifica și executa pași de lucru cu ajutorul unor unelte software) cu o inteligență mai puternică în domenii-cheie pentru descoperirea de medicamente, precum chimia medicinală și genomica. OpenAI susține că, în evaluările interne, versiunea actualizată arată câștiguri de performanță pe sarcini de cercetare, inclusiv întrebări complexe de chimie medicinală, biologie cantitativă și depanare de proceduri de laborator („wet lab”). De ce contează: acces controlat și integrare în fluxuri de lucru, nu doar „răspunsuri” mai bune Unghiul principal al actualizării este operațional: OpenAI împinge GPT‑Rosalind către utilizare în organizații, în condiții de acces controlat și cu integrare în fluxuri repetabile, auditate. Publicația spune că extinde disponibilitatea globală printr-o structură de implementare „trusted-access”, destinată organizațiilor care desfășoară cercetare legitimă cu beneficiu public, au guvernanță și supraveghere de siguranță și pot asigura acces controlat cu securitate de nivel „enterprise”. În paralel, OpenAI anunță și un „managed workspace” (spațiu de lucru administrat de OpenAI) pentru organizațiile calificate care nu au un cont Enterprise. Cum își măsoară OpenAI progresul: LifeSciBench, MedChemBench, GeneBench și LabWorkBench Pentru a urmări impactul în sarcini „valoroase științific”, OpenAI spune că a construit LifeSciBench, un set de evaluare judecat de experți externi, care acoperă șase zone de flux de lucru: gestionarea dovezilor, analiză, proiectare și optimizare, raționament științific, validare și operațiuni, respectiv traducere și comunicare. Pe lângă acesta, compania descrie alte evaluări și rezultate comparative cu GPT‑5.5: MedChemBench (chimie medicinală): GPT‑Rosalind depășește GPT‑5.5 la scor (27,5% vs. 25,1%) și folosește cu 7,2% mai puțini „tokeni” (unități de text procesate, relevante pentru cost și timp de rulare). GeneBench (genomică și biologie cantitativă, evaluare „agentică” pe sarcini de durată): GPT‑Rosalind folosește cu 31% mai puțini tokeni și are acuratețe mai mare (21,6% vs. 20,4%). LabWorkBench (asistență pe protocoale reale de laborator): GPT‑Rosalind obține 63,2% vs. 55,8% pentru GPT‑5.5, cu 5,3% mai puțini tokeni; datele folosite sunt descrise ca proprietare, pentru a evita contaminarea. Stratul de execuție: pluginuri pentru dovezi și analiză NGS, plus vizualizatoare de fișiere biologice OpenAI leagă actualizarea de un set de instrumente care duc modelul din zona de raționament în cea de execuție a fluxurilor de lucru. Compania indică două pluginuri: Life Sciences Research (recuperare de dovezi cu surse și interpretare biologică) Life Sciences NGS Analysis (execuție bioinformatică pentru analize NGS – „next-generation sequencing”, adică secvențiere de nouă generație) Ambele sunt accesibile prin Codex, iar utilizatorii enterprise calificați pot folosi GPT‑Rosalind pentru a le alimenta. OpenAI mai spune că a adăugat vizualizatoare interactive pentru tipuri de fișiere „native” în biologie (secvențe, alinieri, structuri), astfel încât cercetătorii să poată rămâne „aproape de dovezi” în timpul analizei și să poată pune întrebări în contextul vizualizării active. Parteneriatul cu Novo Nordisk și ce urmează În contextul extinderii accesului, OpenAI menționează că Novo Nordisk folosește capabilități de inteligență artificială avansată pentru a ajuta cercetătorii să analizeze seturi de date complexe, să identifice tipare și să testeze ipoteze mai rapid. În material este inclusă o declarație a lui Mishal Patel (Group Vice President, AI & Digital Innovation, R&D – Novo Nordisk) despre nevoia ca modelele avansate să fie ancorate în date de încredere, conectate la instrumente validate și integrate în fluxurile reale de lucru. În continuare, OpenAI afirmă că va îmbunătăți raționamentul biologic al modelului, va extinde suportul pentru fluxuri de lucru „tool-heavy” (cu multe instrumente) și de durată și va evalua impactul în utilizare reală, inclusiv în proiecte cu beneficiu public precum descoperirea de medicamente, sănătate publică, pregătire și biodefense, în linie cu inițiativa Rosalind Biodefense . [...]

Codex depășește zona de programare și intră în munca de birou , iar această schimbare se vede deja în utilizare: potrivit OpenAI , instrumentul are peste 5 milioane de utilizatori activi săptămânal, de peste șase ori mai mulți față de momentul lansării aplicației desktop în februarie, iar „knowledge workers” (angajați care lucrează preponderent cu informație și documente) ajung la circa 20% din baza de utilizatori și cresc de peste trei ori mai repede decât restul. Datele vin dintr-un raport nou, „ The Next Era of Knowledge Work ”, care descrie cum Codex este folosit tot mai mult pentru automatizarea sarcinilor repetitive și reducerea blocajelor operaționale din activitățile de tip office. Deși dezvoltatorii rămân cel mai mare grup de utilizatori, dinamica de creștere indică o extindere rapidă către roluri non-tehnice. Ce fac, concret, utilizatorii non-tehnici cu Codex În zona de „knowledge work”, Codex este folosit în principal pentru livrabile standard, pe care multe echipe le produc recurent: rapoarte, foi de calcul și prezentări; contracte și alte documente de lucru; cercetare și sinteză de informații; analiză de date; automatizarea fluxurilor de lucru; construirea de instrumente simple („lightweight tools”) care înainte necesitau suport de la echipe de inginerie. OpenAI notează că cele mai rapide creșteri, ca tip de activitate, sunt la analiza de date, cercetare și crearea de „artefacte de cunoaștere” (documente și materiale care codifică informația pentru utilizare internă). Impact operațional: lucru în paralel și viteză mai mare de execuție Un element important din raport este creșterea utilizării în paralel: tot mai mulți utilizatori rulează mai multe sarcini Codex simultan, astfel încât pot investiga date, redacta materiale și automatiza fluxuri în același timp. În logica operațională a companiilor, asta înseamnă potențial mai puține timpi morți între etape și o capacitate mai mare de a împinge proiecte prin ciclurile de revizuire și aprobare. OpenAI sugerează că această „viteză” ar putea schimba pe termen lung impactul inteligenței artificiale asupra muncii: oamenii ar putea aborda proiecte mai ambițioase, cu o extindere a responsabilităților și, posibil, accelerarea progresului în carieră. Unde se vede utilitatea, indiferent de industrie Modelul de utilizare este descris ca fiind similar în mai multe industrii: Codex ar reduce „fricțiunea” muncii moderne prin faptul că ajută la găsirea informațiilor împrăștiate în sisteme diferite, coordonarea muncii între instrumente și echipe, producerea de livrabile de calitate și avansarea proiectelor prin procese interne. Raportul nu oferă, în fragmentul publicat, o defalcare pe industrii sau exemple cantitative de economii de timp, dar indică o schimbare de poziționare: Codex este împins tot mai mult ca instrument general de productivitate, nu doar ca unealtă pentru scriere de cod. [...]

Arm își mută centrul de greutate din „vânzare de IP” către livrarea de siliciu , pe fondul cererii accelerate de capacitate de calcul pentru inteligență artificială și al presiunii de a scala producția, lanțul de aprovizionare și testarea la nivel de produs finit, nu doar de proiect. Într-un episod special al podcastului Arm Viewpoints, înregistrat live la evenimentul Arm Everywhere pe 24 martie 2026, compania descrie tranziția „de la IP la siliciu” în jurul a ceea ce numește „AGI CPU”, cu accent pe operațiuni și industrializare, potrivit Arm . Discuția reunește patru executivi implicați în proiect: Will Abbey (Chief Commercial Officer), Dermot O’Driscoll (VP Product Solutions, Cloud AI), Steve Halter (Solutions Engineering) și Eric Hayes (EVP Operations). Mesajul central: pentru a răspunde cererii „explozive” de calcul pentru AI, nu mai este suficientă livrarea de nuclee și blocuri de proprietate intelectuală (IP), ci este nevoie de integrare, validare și execuție industrială – de la proiectare la fabricație. De ce contează: AI împinge Arm spre un model mai „productizat” În conversație, conducerea Arm descrie evoluția companiei dintr-un furnizor consacrat de IP pentru mobil către o prezență mai directă în zona de infrastructură și centre de date, unde criterii precum „performanță per watt” (eficiență energetică raportată la performanță), scalarea și certitudinea lanțului de aprovizionare devin decisive. Will Abbey plasează momentul în contextul unei schimbări de scară pentru Arm: compania vorbește despre „350 de miliarde” de cipuri livrate cumulativ și despre faptul că pune „la dispoziție” un „AGI chip”, pe care îl descrie drept o premieră istorică pentru Arm. În același timp, el susține că „sistemele tradiționale” nu mai țin pasul cu cererea din ultimul an și jumătate, ceea ce împinge industria spre noi arhitecturi și noi modele de livrare. Cum a început pivotul către centrele de date și ce rol au avut partenerii Dermot O’Driscoll indică perioada 2012–2013 ca început al intrării Arm în piața de „infrastructure/data center”, într-un moment în care compania era puternic orientată spre mobil și nu înțelegea suficient cerințele specifice serverelor. În primii ani, Arm a mers mai ales pe licențe de arhitectură, lăsând partenerii să construiască propriile procesoare și sisteme pe cip (SoC). Ulterior, cerințele clienților s-au schimbat: aceștia au cerut suport mai bun pentru virtualizare și interconectări care să permită SoC-uri cu multe nuclee. O’Driscoll plasează un punct de inflexiune în intervalul 2017–2018, când Arm începe să contureze o linie de produse și o „branduire” separată pentru zona de centre de date, pe măsură ce înțelege mai bine sarcinile de lucru (workload-urile) și criteriile de achiziție. Un element important în narațiune este Amazon , descris ca partener „far” („lighthouse partner”). O’Driscoll spune că Amazon a fost un client care a acceptat să contribuie la construirea ecosistemului software (inclusiv Java și profiluri de utilizare), reducând una dintre barierele invocate anterior de alți clienți: lipsa maturității ecosistemului. De la IP la „ compute subsystems ” și apoi la cip Steve Halter explică tranziția Arm către livrarea de componente mai integrate, pe fondul cererii clienților pentru soluții „pre-integrate”. În acest context apare conceptul de CSS (compute subsystems) – subsisteme de calcul integrate, care includ nu doar nucleul CPU, ci și componentele de sistem necesare pentru a funcționa performant într-o implementare reală (de exemplu interconectări, componente legate de memorie și virtualizare). Halter afirmă că CSS a fost „fundația” designului pentru AGI CPU și că abordarea Arm nu se oprește la nivel de IP, ci urmărește proiectarea „la nivel de sistem”. El mai spune că această bază a accelerat dezvoltarea („jumpstart”), permițând companiei să construiască în jurul ei și să adapteze configurația pentru produsul final. În paralel, el descrie schimbarea de competențe necesare: pentru a livra siliciu, Arm a avut nevoie să completeze expertiza tradițională de IP cu zone precum ambalare (packaging), activități „back-end” și integrarea unor interfețe și componente tipice SoC-urilor (menționează, între altele, DDR, PCIe și die-to-die). Operațiunile devin un diferențiator: lanț de aprovizionare, fabricație, testare Eric Hayes, responsabil de operațiuni, enumeră aria sa: lanț de aprovizionare, planificare, logistică, fabricație, management de produs, calitate și testare, plus management de programe cross-funcțional. El subliniază că trecerea de la „ciclul de viață al IP-ului” la un model orientat spre producție și livrare de volum presupune procese și oameni cu experiență în companii de semiconductori și hyperscaleri, cu accent pe achiziție și livrare de produse la scară mare. Textul sursă este întrerupt (trunchiat) exact când Hayes începe să detalieze migrarea operațională, astfel că nu sunt disponibile, în acest extras, elemente concrete despre capacități de producție, furnizori, volume sau termene. Ce urmează și care este limita informațiilor disponibile Arm leagă proiectul de „valul” de agentic AI (AI capabilă să execute sarcini în mod autonom, pe baza unor obiective), sugerând că cerințele viitoare vor pune și mai multă presiune pe eficiență energetică, scalare și colaborare în ecosistem. Totuși, în materialul disponibil nu apar specificații tehnice ale „AGI CPU”, detalii despre disponibilitate comercială, clienți confirmați (în afară de referințele la Amazon ca partener) sau indicatori financiari care să permită cuantificarea impactului economic. [...]

Anthropic își pregătește IPO-ul cu Morgan Stanley și Goldman Sachs, dar miza reală este factura de infrastructură dezvăluită indirect: un acord de calcul cu SpaceX de 1,25 miliarde de dolari pe lună (aprox. 5,8 miliarde lei), potrivit The Next Web . Alegerea băncilor și calendarul vizat (octombrie) conturează o listare care ar putea deveni una dintre cele mai mari din tehnologie, însă costurile recurente pentru capacitate de calcul ridică întrebări despre marje și riscuri operaționale înainte de intrarea pe bursă. Anthropic a selectat Morgan Stanley și Goldman Sachs pentru a conduce oferta publică inițială (IPO), cu JPMorgan Chase implicată în tranzacție, după ce compania a depus confidențial documentele pentru listare. Conform informațiilor citate de publicație dintr-un material Bloomberg , echipa de bănci ar putea fi extinsă, iar parametrii ofertei se pot modifica. Contractul SpaceX: 325.000 de cipuri Nvidia și 1,25 miliarde dolari pe lună Detaliul cu cel mai mare impact economic nu vine din comunicările Anthropic, ci din documentația de listare a SpaceX (S-1), care arată că SpaceX furnizează către Anthropic capacitate de calcul pentru inteligență artificială, inclusiv aproximativ 325.000 de cipuri Nvidia, la un cost de 1,25 miliarde de dolari pe lună (aprox. 5,8 miliarde lei). Acordul se întinde până în mai 2029 și poate fi reziliat de oricare dintre părți cu un preaviz de 90 de zile, după o perioadă inițială de trei luni. Publicația notează că această relație face din SpaceX simultan furnizor pentru Anthropic, competitor (prin chatbotul Grok) și, în același timp, candidat la propria listare. La nivel anualizat, contractul ar echivala cu 15 miliarde de dolari (aprox. 69 miliarde lei) doar pentru calcul, ceea ce pune în perspectivă dimensiunea dependenței de infrastructură și presiunea pe profitabilitate. Ce poate deveni „material” în prospectul de listare The Next Web subliniază că, odată ce documentul S-1 al Anthropic va fi public, compania ar trebui să prezinte acest acord ca o relație relevantă pentru investitori, în contextul suprapunerii competitive dintre părți. În practică, astfel de aranjamente sunt urmărite atent pentru riscuri de continuitate a serviciului, putere de negociere și potențiale conflicte de interese. În paralel, Anthropic intră într-o „aglomerare” de listări mari în tehnologie, cu SpaceX și OpenAI menționate ca alte nume care se pregătesc pentru piața publică, ceea ce poate intensifica competiția pentru capital și poate influența evaluările. Context: creștere accelerată, dar și un risc de reglementare Pe lângă componenta de infrastructură, un alt element de risc menționat este desemnarea de către Pentagon a Anthropic ca risc pe lanțul de aprovizionare , după ce compania ar fi refuzat acces nerestricționat la modele pentru zona militară; Anthropic a spus că situația ar putea pune în pericol miliarde de dolari în venituri. Modul în care acest risc va fi descris și cuantificat în documentația de listare este prezentat ca un punct sensibil pentru investitorii de pe piețele publice. În acest cadru, IPO-ul Anthropic devine mai mult decât o simplă alegere de bănci: este un test despre cât de mult sunt dispuși investitorii să plătească pentru creștere în AI atunci când costul de bază — calculul — poate ajunge la niveluri de ordinul zecilor de miliarde de dolari anual. [...]

Microsoft își mută centrul de greutate în AI către modele proprii, cu efect direct asupra costurilor din Azure , într-o încercare de a reduce dependența de furnizori externi precum OpenAI și Anthropic, potrivit Antena 3 . Compania a prezentat la conferința Build 2026 o familie de șapte modele dezvoltate intern, semnalând o schimbare operațională importantă pentru ecosistemul său de produse și pentru clienții care consumă AI prin Azure. Microsoft a anunțat modelele la Build, evenimentul anual organizat la San Francisco, iar mesajul central este că vrea să se bazeze „mai puțin” pe OpenAI și alte companii în care a investit masiv. În același timp, compania indică faptul că rularea modelelor proprii pe infrastructura Azure ar reduce costurile plătite până acum către furnizori externi și că economiile ar urma să ajungă și la dezvoltatori. Ce modele a prezentat Microsoft și unde le poziționează Lansarea principală este MAI-Thinking-1 , descris ca primul model de tip „reasoning” (raționament) al Microsoft, antrenat de la zero pe date „curate”, licențiate comercial, fără distilare din alte sisteme AI. Conform informațiilor din articol, modelul are: 35 de miliarde de parametri activi (indicator al dimensiunii modelului); fereastră de context de 256.000 de tokeni (cantitatea de text pe care o poate „ține minte” într-o sesiune); utilizare țintită pentru sarcini complexe, raționament pe mai mulți pași, texte lungi și generare de cod. Separat, Microsoft a lansat MAI-Code-1-Flash , un model specializat pe programare, care transformă descrieri în limbaj natural în cod pentru aplicații și site-uri. Acesta este deja integrat în GitHub Copilot și Visual Studio Code , ceea ce sugerează o direcție de implementare rapidă în instrumentele folosite de dezvoltatori. Miza operațională: costuri mai mici și control mai mare în Azure Șeful diviziei Microsoft AI, Mustafa Suleyman, a afirmat că, după ajustări făcute pentru firma de consultanță McKinsey, modelele companiei ar fi depășit GPT-5.5 la capitolul calitate și ar fi „de până la zece ori” mai eficiente din punct de vedere al costurilor, pe baza unor date publice de prețuri raportate la scară. Articolul nu detaliază metodologia completă a comparației, dincolo de referirea la date publice și la ajustarea pentru un client. În plus, Microsoft spune că, în evaluări „oarbe” realizate de Surge (partener independent de testare), MAI-Thinking-1 a fost preferat în fața lui Claude Sonnet 4.6 de la Anthropic și ar egala Claude Opus 4.6 la teste de coding. „Credem că a venit momentul ca fiecare companie să treacă de la simpla utilizare a unui model de vârf la participarea directă la acest nivel”, a declarat CEO-ul Satya Nadella în cadrul conferinței. Context: investițiile în OpenAI și Anthropic rămân, dar dependența se reduce Mișcarea vine într-un moment în care companiile în care Microsoft a investit se pregătesc pentru posibile listări la bursă, potrivit articolului. Antena 3 notează că Microsoft a investit 13 miliarde de dolari (aprox. 59,8 miliarde lei) în OpenAI și până la 5 miliarde de dolari (aprox. 23 miliarde lei) în Anthropic, iar modelele ambelor companii sunt în continuare disponibile prin Azure. În același timp, articolul menționează că Anthropic a depus confidențial actele pentru un IPO pe 1 iunie, după o rundă de finanțare care ar fi ridicat evaluarea companiei, iar OpenAI s-ar afla, la rândul său, în pregătiri pentru un proces similar de listare. Ce urmează să se vadă în piață Din informațiile prezentate, efectul imediat urmărit de Microsoft este reducerea costurilor și creșterea controlului asupra lanțului tehnologic (model AI + infrastructură Azure + integrare în produse precum Copilot și Visual Studio Code). Rămâne de văzut în ce măsură promisiunea de economii „care vor ajunge și la dezvoltatori” se va reflecta în prețuri și condiții comerciale concrete, detalii care nu apar în material. [...]

DeepSeek își consolidează evaluarea la aproape 60 mld. dolari prin prima rundă externă de finanțare, într-un moment în care competiția pentru capital și talente în inteligența artificială se intensifică în China, potrivit South China Morning Post . Start-up-ul ar finaliza o rundă de peste 50 miliarde yuani (7,4 miliarde dolari, aprox. 34 miliarde lei), la o evaluare „puțin sub” 60 miliarde dolari (aprox. 276 miliarde lei), de circa șase ori peste nivelul de 10 miliarde dolari din aprilie. Mutarea marchează o schimbare de strategie pentru DeepSeek, care ar fi respins anterior capitalul extern. Sursele citate de publicație indică faptul că firma urmărește să „fixeze” o evaluare oficială într-o piață hipercompetitivă și să își apere echipa, oferind un reper de evaluare a participațiilor (equity) pentru angajați, pe fondul tentativelor rivalilor de a atrage specialiști de top. Cine intră în rundă și ce sume sunt vehiculate Investitori orientați spre piață și giganți tech chinezi ar fi angajat circa 30 miliarde yuani, conform uneia dintre surse. Printre participanții așteptați: Tencent Holdings: 10 miliarde yuani NetEase: aprox. 3 miliarde yuani JD.com: aprox. 3 miliarde yuani Contemporary Amperex Technology Limited (CATL): aprox. 5 miliarde yuani Fonduri de venture capital: IDG Capital, Monolith, Loyal Valley Capital și Shixiang Tech (fără sume detaliate) Fondatorul și CEO-ul Liang Wenfeng ar urma să contribuie cu aproximativ 20 miliarde yuani din capital propriu, potrivit informațiilor din articol. Separat, fonduri susținute de stat ar avea și ele un rol, însă termenii finali – inclusiv vehiculele prin care ar veni banii – nu ar fi încă stabiliți, conform unei alte surse. Indicii că tranzacția a trecut de faza de discuții Deși termenii rămân „sub rezerva schimbării”, documente locale și înregistrări corporative sugerează că tranzacția a avansat. Publicația notează că, potrivit serviciului de registru corporativ QCC.com, mai multe vehicule investiționale (special purpose vehicles) legate de potențialii finanțatori au fost înființate la mijlocul și spre finalul lunii mai. Un exemplu menționat este entitatea Hangzhou Chengce Business Consultation, înființată pe 19 mai, care ar împărți adresa înregistrată a DeepSeek, cu Liang indicat drept „controlor efectiv”. Context: presiune pe costuri și integrare cu hardware local DeepSeek a atras atenția globală anul trecut cu modele open-source precum V3 și R1, susținând că poate dezvolta AI avansată la costuri mult mai mici decât rivali americani precum OpenAI și Anthropic. Compania continuă strategia de eficiență a costurilor cu modelul V4, despre care afirmă că egalează performanța unor modele americane „închise” (closed-source) în zone-cheie. În mai, DeepSeek a anunțat o reducere permanentă de 75% a prețului pentru V4 Pro și a indicat tarife de până la 0,0036 dolari per 1 milion de tokeni de intrare „în cache” și 0,87 dolari per 1 milion de tokeni de ieșire. Compania a mai spus că prețurile ar urma să scadă semnificativ în a doua jumătate a anului, pe măsură ce supernodurile Huawei Ascend 950PR „se livrează la scară”, deși platforma ar fi avut întreruperi intermitente de serviciu după lansarea V4. În paralel, V4 ar fi declanșat o cursă între producătorii chinezi de cipuri pentru optimizarea hardware-ului, iar Huawei ar fi anunțat adaptarea completă a V4 la platforma Ascend 950PR, alături de adaptări din partea Cambricon și MetaX. [...]