Știri
Știri din categoria Inteligență artificială

Anthropic își apără prețul în fața rivalilor printr-un salt de productivitate la același cost: noul Claude Opus 4.7 ridică semnificativ performanța în codare și în sarcini „agentice” (fluxuri de lucru cu mai mulți pași și folosire de instrumente), fără scumpiri, potrivit The Next Web.
Modelul este poziționat ca „cel mai capabil” Claude disponibil pe scară largă și vine într-un moment în care miza comercială pentru Anthropic este ridicată: publicația notează că firma rulează la o rată anualizată de venituri de 30 de miliarde de dolari (aprox. 138 miliarde lei), ar fi primit oferte de investiții la o evaluare de circa 800 de miliarde de dolari (aprox. 3.680 miliarde lei) și ar fi în discuții incipiente pentru o listare (IPO). În acest context, Opus 4.7 trebuie să convingă companiile să construiască pe platforma Claude, nu doar să bifeze scoruri în teste.
Câștigul principal este în inginerie software, unde Opus 4.7 urcă pe SWE-bench Pro la 64,3% (de la 53,4% la Opus 4.6) și depășește GPT-5.4 (57,7%) și Gemini 3.1 Pro (54,2%). Pe SWE-bench Verified, scorul ajunge la 87,6% (față de 80,8% la predecesor), în timp ce Gemini 3.1 Pro este la 80,6%.
În paralel, CursorBench (un indicator pentru codare autonomă în editorul Cursor) arată 70%, de la 58% la Opus 4.6. The Next Web leagă această evoluție de utilizarea practică: Claude este deja o alegere implicită în Cursor și Claude Code, iar Claude Code ar fi atins în februarie o rată anualizată de venituri de 2,5 miliarde de dolari (aprox. 11,5 miliarde lei).
Diferențierea se mută însă dinspre „raționament pur” spre execuție în fluxuri complexe. Pe GPQA Diamond (raționament la nivel de studii avansate), scorurile sunt aproape egale: Opus 4.7 are 94,2%, GPT-5.4 Pro 94,4%, iar Gemini 3.1 Pro 94,3% — diferențe pe care publicația le descrie ca fiind în marja de variație.
Anthropic susține că Opus 4.7 aduce o îmbunătățire de 14% față de Opus 4.6 pe fluxuri de lucru complexe, multi-pas, folosind mai puțini „tokeni” (unități de text folosite la calculul costurilor) și generând o treime din erorile de instrumente. Compania mai spune că este primul model Claude care trece „teste de nevoie implicită”, adică situații în care modelul trebuie să deducă singur ce instrumente sau acțiuni sunt necesare.
O noutate importantă este coordonarea multi-agent: capacitatea de a orchestra mai multe „fire” de lucru AI în paralel, în loc de procesare strict secvențială. Pentru utilizări de tip enterprise (revizie de cod, analiză de documente, procesare de date în același timp), aceasta se traduce în debit mai mare de lucru. Anthropic afirmă și că modelul își poate menține „focusul” pe fluxuri de lucru de ordinul orelor, dar aceasta rămâne o afirmație de producător care depinde de validarea în utilizare reală.
Publicația mai notează accentul pe reziliență: Opus 4.7 ar continua execuția chiar și când apar eșecuri ale instrumentelor, în loc să se oprească — relevant pentru automatizări unde o singură eroare poate bloca un întreg lanț.
Pe partea de imagini, Opus 4.7 poate procesa rezoluții de până la 2.576 pixeli pe latura lungă, de peste trei ori față de modelele Claude anterioare. Ținta declarată este analiza de documente în companii (contracte scanate, desene tehnice, situații financiare), unde detaliile fine pot fi ratate la rezoluții mai mici.
Fereastra de context rămâne la un milion de tokeni (jumătate din cei două milioane ai Gemini 3.1 Pro), iar pe benchmark-uri de cercetare cu context lung, Opus 4.7 ar fi la egalitate pe primul loc la scorul total 0,715 pe șase module, cu o consistență ridicată.
Anthropic mai spune că modelul urmează instrucțiunile mai „literal” decât înainte, ceea ce poate cere ajustarea prompturilor existente: mai puțină ambiguitate și comportament „off-task”, dar și mai puține rezultate „creative” neașteptate.
Opus 4.7 este disponibil pe planurile Claude Pro, Max, Team și Enterprise și prin API la 5 dolari (aprox. 23 lei) per milion de tokeni de intrare și 25 de dolari (aprox. 115 lei) per milion de tokeni de ieșire — același nivel ca Opus 4.6. Există și mecanisme de reducere: „prompt caching” cu economii de până la 90% și Batch API cu discount de 50% la intrare și ieșire.
Modelul poate fi accesat și prin Amazon Bedrock, Google Cloud Vertex AI și Microsoft Foundry. The Next Web notează că Gemini 3.1 Pro este mai ieftin (2 dolari și 12 dolari per milion de tokeni pentru intrare/ieșire), însă avantajul Opus 4.7 pe SWE-bench și pe raționament „agentic” ar putea justifica prima de preț pentru companiile care au nevoie de capabilitate maximă.
În plus, Anthropic a adăugat măsuri automate de protecție cibernetică pentru a detecta și bloca solicitări interzise sau cu risc ridicat, pe fondul preocupărilor legate de utilizări cu dublu scop (civil și malițios). Publicația leagă această abordare de restricțiile anterioare aplicate modelului Mythos, disponibil doar pentru 11 organizații în cadrul Project Glasswing.
În esență, Opus 4.7 nu schimbă paradigma, dar mută raportul cost/performanță în favoarea Anthropic exact în zona care contează economic: codare și automatizare de fluxuri complexe, la același preț pe token.
Recomandate

Anthropic ar urma să permită ENISA să testeze modelul Mythos înainte de lansarea la scară largă , într-o mișcare care poate seta un precedent de „audit” instituțional pentru modelele de inteligență artificială cu potențial ofensiv în securitate cibernetică, potrivit IT Home , care citează Bloomberg. Informația vizează includerea Agenției Uniunii Europene pentru Securitate Cibernetică (ENISA) în programul „Project Glasswing”, prin care instituții considerate „critice” ar primi acces la Mythos pentru testare înainte ca modelul să fie disponibil pe scară largă. Subiectul este urmărit îndeaproape deoarece, potrivit sursei, există îngrijorări în rândul unor oficiali că sistemul ar putea fi folosit de actori rău intenționați ca instrument pentru exploatarea vulnerabilităților. De ce contează: un model de acces controlat pentru IA cu risc de abuz Anthropic ar fi ales o deschidere graduală a accesului la Mythos, tocmai din cauza capacității modelului de a identifica vulnerabilități de securitate cibernetică, pe care compania o descrisese anterior ca fiind neobișnuit de puternică și, implicit, cu risc ridicat. În această logică, testarea de către guverne și companii ar avea rolul de a evalua mai întâi: securitatea propriilor sisteme; rezistența la atacuri (capacitatea de a face față tentativelor de compromitere). Dacă această abordare se confirmă, ea indică o direcție operațională relevantă pentru piață: accesul la modele avansate cu utilizări duale (defensive și ofensive) poate deveni condiționat de evaluări și programe de testare, nu doar de disponibilitate comercială. Ce știm despre calendar și discuțiile cu UE Potrivit informațiilor citate, Anthropic ar fi informat Comisia Europeană despre decizie în weekendul trecut. Discuțiile nu ar fi publice, iar persoanele citate de Bloomberg au cerut anonimat. De la lansarea Mythos la finalul lunii aprilie, oficiali din UE și din state europene ar fi încercat să obțină acces la model. Sursa mai arată că, săptămâna trecută, oficiali ai Comisiei Europene au mers la San Francisco pentru discuții cu conducerea Anthropic, în încercarea de a obține drept de utilizare. Reacții: Comisia Europeană avertizează că vor urma modele și mai puternice Purtătorul de cuvânt al Comisiei Europene, Thomas Regnier, a declarat că Mythos nu este un caz singular și că vor apărea modele mai puternice, iar UE discută cu parteneri „cu viziuni similare”, inclusiv SUA, pentru a aborda provocările. Regnier nu a oferit detalii despre momentul în care ENISA ar putea primi acces, iar Anthropic nu a comentat, conform sursei. [...]

NVIDIA își extinde ofensiva în centrele de date cu Vera, un CPU „pentru agenți” care promite să crească veniturile din tokeni. Potrivit NVIDIA News , noul procesor Vera este deja în producție și este poziționat ca o piesă-cheie pentru „fabricile de AI” (infrastructuri care rulează antrenare, inferență și execuție de agenți), într-un moment în care economia acestor sisteme se mută de la „nuclee per dolar” la „tokeni per dolar” — adică la câți pași de calcul utili pot livra pentru fiecare unitate de cost. NVIDIA susține că Vera finalizează sarcini cu 1,8 ori mai repede decât procesoarele x86, pe o plajă de utilizări care include AI „agentic” (modele care nu doar răspund, ci execută acțiuni, rulează cod și folosesc instrumente), învățare prin recompensă (reinforcement learning) și procesare de date. Miza economică invocată de companie este directă: mai multă performanță CPU pe fluxurile critice din centrele de date ar însemna mai mult „token revenue” (venituri asociate volumului de tokeni procesați în servicii AI). De ce contează: CPU-ul devine din nou o constrângere în „fabricile de AI” În arhitecturile moderne pentru AI, acceleratoarele (GPU) fac partea grea de calcul, dar multe etape rămân limitate de CPU: rularea mediilor Python, compilări, execuție de cod în sandbox (medii izolate), logică de orchestrare și conducte de analiză. NVIDIA își construiește argumentul pe ideea că agenții AI cresc masiv cererea pentru astfel de sarcini, iar un CPU mai rapid și mai eficient energetic crește „debitul” (throughput) de agenți și interactivitatea. Jensen Huang , fondator și CEO al NVIDIA, afirmă: „Agenții AI vor fi cei mai mari utilizatori de calcul. Vera este primul CPU proiectat pentru acel viitor — construit pentru a rula AI agentic la scară hyperscale cu performanță, eficiență și programabilitate extraordinare.” Ce aduce Vera: arhitectură proprie și integrare strânsă cu platformele NVIDIA Vera este bazat pe „Olympus”, un nucleu CPU personalizat NVIDIA, și include 88 de nuclee Olympus , „Spatial Multithreading” (o tehnică de execuție paralelă pentru a crește utilizarea resurselor) și memorie LPDDR5X cu până la 1,2 TB/s lățime de bandă. Pe partea de integrare în platformele companiei, Vera este prezentat ca: CPU pentru servere Vera „standalone” (configurații dedicate CPU), CPU gazdă pentru platformele NVIDIA Vera Rubin , prin interconectarea NVLink-C2C de generația a doua, cu până la 1,8 TB/s lățime de bandă coerentă între CPU și GPU, componentă pentru platforme de stocare AI, prin NVIDIA Vera BlueField-4 STX , care combină CPU-ul cu rețelistică, accelerare de stocare și securitate „în siliciu”. NVIDIA mai spune că Vera extinde „Confidential Computing” (mecanisme hardware/software care protejează datele în utilizare) la nivel de rack, pentru a proteja sarcini agentice. Cine îl adoptă și cine îl produce: ecosistem de cloud și OEM Compania indică drept potențiali utilizatori sau evaluatori ai Vera atât laboratoare AI, cât și operatori mari de cloud și infrastructură. Sunt menționate, între altele, Anthropic, OpenAI și SpaceXAI, precum și ByteDance, CoreWeave și Oracle Cloud Infrastructure (OCI). În zona enterprise, NVIDIA indică și NYSE ca utilizator care explorează platforma. Pe partea de producție și integrare hardware, NVIDIA spune că sisteme Vera vor fi construite la scară de producători precum Dell Technologies, HPE, Lenovo și Supermicro, alături de ASUS, Compal, Foxconn, GIGABYTE, Pegatron, Quanta Cloud Technology (QCT), Wistron și Wiwynn, între alții. Publicația notează că marii OEM ar urma să ofere Vera în configurații de server CPU „standalone”, ca „prima opțiune standard de CPU dincolo de x86”. Performanță: benchmark-uri invocate și un exemplu de utilizare NVIDIA citează Phoronix (publicație de benchmark-uri open-source) spunând că Vera a livrat „cea mai rapidă performanță generală” pe sarcini agentice precum compilare de cod, Python, Java și procesare de baze de date — exact tipuri de încărcări care apar pe traseul critic al execuției agenților (utilizare de instrumente și execuție în sandbox). Într-un exemplu operațional, NYSE Group leagă adopția de obiective de latență și capacitate. Lynn Martin, președinte NYSE Group, spune: „NYSE procesează peste 1,1 trilioane de mesaje pe zi și, în colaborare cu Redpanda și HPE, folosind CPU-urile NVIDIA Vera, ne vom extinde capacitatea, optimizând în continuare latența pentru a susține o infrastructură de piață performantă, rezilientă și pregătită pentru AI.” Disponibilitate: când ajunge pe piață NVIDIA afirmă că sistemele Vera vor fi disponibile de la integratori și parteneri cloud din această toamnă . Compania nu oferă în material detalii despre prețuri sau despre configurații comerciale concrete pentru fiecare segment, astfel că impactul financiar imediat rămâne de evaluat în funcție de ritmul de adoptare în cloud și în centrele de date enterprise. [...]

TSMC își integrează inteligența artificială NVIDIA în fabrici pentru a accelera proiectarea și producția de cipuri , într-o mișcare cu impact operațional direct asupra randamentului și timpilor de livrare din lanțul global de semiconductori, potrivit Android Headlines . Colaborarea vizează folosirea platformelor și instrumentelor NVIDIA pentru a automatiza și optimiza etape critice din fluxul de fabricație, într-un moment în care cererea pentru cipuri avansate (în special pentru aplicații de inteligență artificială) pune presiune pe capacitățile de producție și pe eficiența uzinelor. Ce se schimbă în operarea fabricilor TSMC Din informațiile prezentate, direcția principală este integrarea de soluții bazate pe IA în procesele de producție, cu scopul de a îmbunătăți modul în care sunt proiectate, testate și fabricate noile generații de siliciu. În termeni practici, asta înseamnă mai multă analiză automată a datelor din fabrică și decizii mai rapide în controlul proceselor. Pentru TSMC, miza este reducerea pierderilor și creșterea randamentului (proporția de cipuri conforme obținute dintr-un lot), dar și scurtarea ciclurilor de dezvoltare, într-o industrie în care fiecare lună câștigată poate însemna avantaj competitiv pentru clienți. De ce contează: capacitate, costuri și termene într-o piață tensionată Integrarea IA în fabrici nu este doar un exercițiu tehnologic, ci o încercare de a crește eficiența într-un sector cu investiții masive și cu constrângeri structurale: echipamente scumpe, procese extrem de complexe și cerere volatilă, dar ridicată pe segmentul de cipuri pentru centre de date și acceleratoare IA. Dacă abordarea funcționează la scară, efectul se poate vedea în: timpi mai buni de producție și livrare pentru cipuri avansate; utilizare mai eficientă a capacităților existente; presiune mai mică pe costurile asociate rebuturilor și recalibrărilor din fabricație. Ce urmează Materialul indică o direcție de consolidare a parteneriatelor dintre furnizorii de tehnologie IA și marii producători de semiconductori, pe fondul competiției pentru „următoarea generație” de cipuri. Detalii despre calendar, amploarea implementării sau rezultate măsurabile nu sunt prezentate în informațiile disponibile în sursă. [...]

Nvidia susține că și-a asigurat capacitatea de producție pentru a alimenta creșterea cererii de cipuri pentru inteligență artificială, chiar dacă blocajele de aprovizionare nu au dispărut , potrivit Reuters . Mesajul vine într-un moment în care compania este tratată de piață drept un barometru al sănătății sectorului AI, deoarece procesoarele sale sunt folosite în aproape toate marile centre de date. Jensen Huang , CEO-ul Nvidia, a declarat la o conferință de presă organizată în timpul săptămânii Computex , la Taipei, că firma „a securizat” suficientă ofertă pentru o „creștere foarte robustă” atât la procesoare centrale (CPU), cât și la procesoare grafice (GPU). În același timp, el a admis că Nvidia rămâne „constrânsă de ofertă”, semnalând că presiunea cererii depășește încă ritmul la care poate fi livrată producția. De ce contează: semnal pentru piața AI și pentru clienții de centre de date Nvidia este considerată un indicator pentru piața AI, iar orice nuanță legată de disponibilitatea cipului are implicații directe pentru ritmul investițiilor în infrastructura de calcul. Declarațiile lui Huang sugerează că Nvidia încearcă să reducă riscul ca lipsa de capacitate să frâneze extinderea centrelor de date, dar și că tensiunile din lanțul de aprovizionare rămân un factor de incertitudine. Cererea pentru GPU-urile Nvidia destinate AI a generat „zeci de miliarde de dolari” în venituri, notează Reuters , și a contribuit la poziționarea companiei drept cea mai valoroasă din lume. CPU-urile „Vera”, prezentate ca următorul motor de creștere Huang a indicat că procesoarele de centru de date „Vera” ar putea deveni chiar mai populare decât GPU-urile, argumentând că rolul CPU-urilor în „procesarea informației” este esențial. Nvidia concurează aici cu AMD și Intel, iar CEO-ul a descris Vera drept un viitor „motor major de creștere” pentru companie. Extinderea către PC-uri cu AI și competiția directă cu AMD, Intel și Apple Declarațiile au venit la o zi după ce Nvidia a prezentat un cip nou care aduce capabilități AI direct pe PC-uri. Cipul RTX Spark ar urma să fie lansat în toamnă și va concura cu produse ale AMD, Intel și Apple. Huang a spus că RTX Spark face parte din eforturile Nvidia împreună cu Microsoft de a „reinventa PC-ul” pentru era AI. Taiwan, pivot în lanțul de aprovizionare și în strategia de reziliență Născut în Tainan, Huang a reiterat importanța Taiwanului în strategia Nvidia, afirmând că insula este un partener strategic pentru SUA și invocând investițiile Taiwanului în producția din SUA. Nvidia intenționează să continue investițiile în Taiwan și să își facă lanțul de aprovizionare „cât mai rezilient posibil”, Huang adăugând că firma este „cel mai mare cumpărător” din ecosistemul Taiwanului. În lipsa unor detalii suplimentare despre volume sau termene de livrare, mesajul central rămâne unul de echilibru: Nvidia spune că și-a asigurat capacitatea pentru creștere, dar recunoaște că presiunea cererii menține compania într-o zonă de constrângeri de ofertă. [...]

Modelele „frontier” ale OpenAI și Codex devin disponibile direct în AWS , ceea ce poate reduce semnificativ fricțiunile operaționale care încetinesc adopția inteligenței artificiale în companii, potrivit OpenAI . Miza pentru clienții enterprise este integrarea în fluxuri existente de securitate, conformitate, achiziții, facturare și guvernanță, fără a mai „ocoli” platforma pe care își rulează deja infrastructura. Disponibilitatea generală („generally available”) pe AWS deschide accesul pentru milioane de clienți AWS care pot construi cu tehnologiile OpenAI în mediul pe care îl folosesc deja pentru operațiunile lor. OpenAI susține că această cale scurtează drumul de la evaluare la implementare în producție, tocmai prin folosirea controalelor și proceselor deja aprobate intern în organizații. Cum ajung capabilitățile OpenAI în AWS OpenAI spune că oferă acces la capabilități „frontier” în AWS, păstrând un model operațional familiar pentru utilizatorii AWS și un traseu mai rapid către producție. În material sunt menționate două modalități de disponibilitate, dintre care una este detaliată explicit: Codex on Amazon Bedrock aduce în AWS agentul OpenAI pentru inginerie software, folosit de „peste 5 milioane de oameni în fiecare săptămână”, pentru sarcini precum scriere, revizuire, depanare și modernizare de cod în mediile în care echipele dezvoltă și livrează deja. OpenAI mai precizează că aceste oferte sunt disponibile atât în regiunile „Commercial”, cât și în „ GovCloud ” (zona AWS destinată în principal organizațiilor cu cerințe guvernamentale și de conformitate specifice). De ce contează pentru companii: mai puțin timp pe „blocaje”, mai mult pe livrare Unghiul principal al anunțului este operațional: mutarea capabilităților OpenAI în interiorul AWS ar reduce fricțiunile legate de achiziție, revizuiri de securitate și pregătirea pentru producție. În logica prezentată de OpenAI, organizațiile pot petrece mai puțin timp cu barierele administrative și mai mult timp construind și implementând efectiv. Ce urmează: extindere și „Daybreak” pentru zona de securitate cibernetică OpenAI descrie „OpenAI on AWS” ca începutul unei extinderi a capabilităților disponibile prin AWS. În acest context, compania indică o disponibilitate viitoare pentru „Daybreak”, viziunea OpenAI pentru schimbarea modului în care software-ul este construit și apărat, care ar include „modele de securitate cibernetică” și „Codex Security”. Potrivit descrierii din sursă, Daybreak ar viza integrarea în ciclul de dezvoltare a unor funcții precum revizuire de cod sigură, modelare de amenințări, validare de patch-uri, analiză a riscului din dependențe, detecție și ghidaj de remediere. OpenAI notează că, pe măsură ce astfel de capabilități specializate devin disponibile, AWS poate fi o cale importantă de adopție pentru echipele de securitate, prin cadrele de guvernanță și operațiuni pe care le folosesc deja. [...]

NVIDIA pregătește intrarea în producție de masă cu „Vera”, un CPU proiectat special pentru agenți AI , o mișcare care poate schimba arhitectura standard a serverelor pentru inteligență artificială și, implicit, costurile și performanța infrastructurii din centrele de date, potrivit Android Headlines . Din informațiile prezentate, „Vera” este un procesor (CPU) gândit „de la zero” pentru a lucra cu sarcini specifice agenților AI – adică sisteme care nu doar răspund la comenzi, ci pot planifica și executa pași multipli pentru a atinge un obiectiv. Miza operațională este reducerea blocajelor dintre CPU și acceleratoarele AI (de regulă GPU), într-un moment în care companiile caută să scoată mai multă eficiență din fiecare rack de servere. De ce contează: NVIDIA vrea să controleze mai mult din „stiva” hardware pentru AI Până acum, în multe configurații de server, CPU-ul este furnizat de jucători consacrați, iar NVIDIA domină partea de accelerare cu GPU-uri. Un CPU proprietar orientat către agenți AI ar însemna o integrare mai strânsă între componente și o optimizare pentru fluxuri de lucru care devin tot mai frecvente în aplicațiile enterprise. În termeni practici, direcția indicată de această inițiativă este una de standardizare a platformelor AI în jurul ecosistemului NVIDIA, cu efecte potențiale asupra: modului în care sunt proiectate serverele pentru AI (alegeri de platformă, compatibilități); costului total de operare (prin eficiență mai bună sau, dimpotrivă, prin dependență mai mare de un singur furnizor); puterii de negociere în lanțul de aprovizionare pentru centrele de date. Ce se știe și ce rămâne neclar Materialul indică faptul că „Vera” ar urma să ajungă în producție de masă, însă detaliile tehnice și calendarul exact nu sunt prezentate în fragmentul de text disponibil în input. În lipsa acestor informații, rămâne de văzut: când începe efectiv producția și în ce volume; în ce sisteme va fi integrat CPU-ul și pentru ce clienți; ce câștiguri de performanță sau eficiență sunt vizate, comparativ cu platformele actuale. Pentru piață, semnalul principal este că NVIDIA își extinde ambiția dincolo de acceleratoare și încearcă să optimizeze „cap-coadă” hardware-ul pentru generația de aplicații bazate pe agenți AI, unde latența, coordonarea între componente și eficiența energetică devin criterii de diferențiere. [...]