Anthropic lansează Claude Opus 4.7 - Îmbunătățiri semnificative în codare și raționament agentic pentru utilizatorii enterprise

17 aprilie 2026, 03:43

Noul model Claude Opus 4.7 îmbunătățește performanța în codare și raționament.

TLDRPe scurt:

01Claude Opus 4.7 îmbunătățește semnificativ performanța în codare fără creșterea costurilor.
02Anthropic se află într-un moment critic, cu venituri anualizate de 30 miliarde dolari și evaluări de 800 miliarde dolari.
03Scorurile pe SWE-bench Pro au crescut la 64,3%, depășind competiția precum GPT-5.4 și Gemini 3.1 Pro.
04Claude Code a atins o rată anualizată de venituri de 2,5 miliarde dolari, devenind o alegere populară în industrie.

Anthropic își apără prețul în fața rivalilor printr-un salt de productivitate la același cost: noul Claude Opus 4.7 ridică semnificativ performanța în codare și în sarcini „agentice” (fluxuri de lucru cu mai mulți pași și folosire de instrumente), fără scumpiri, potrivit The Next Web.

Modelul este poziționat ca „cel mai capabil” Claude disponibil pe scară largă și vine într-un moment în care miza comercială pentru Anthropic este ridicată: publicația notează că firma rulează la o rată anualizată de venituri de 30 de miliarde de dolari (aprox. 138 miliarde lei), ar fi primit oferte de investiții la o evaluare de circa 800 de miliarde de dolari (aprox. 3.680 miliarde lei) și ar fi în discuții incipiente pentru o listare (IPO). În acest context, Opus 4.7 trebuie să convingă companiile să construiască pe platforma Claude, nu doar să bifeze scoruri în teste.

De ce contează pentru companii: mai multă muncă automatizată, cu mai puține erori de instrumente

Câștigul principal este în inginerie software, unde Opus 4.7 urcă pe SWE-bench Pro la 64,3% (de la 53,4% la Opus 4.6) și depășește GPT-5.4 (57,7%) și Gemini 3.1 Pro (54,2%). Pe SWE-bench Verified, scorul ajunge la 87,6% (față de 80,8% la predecesor), în timp ce Gemini 3.1 Pro este la 80,6%.

În paralel, CursorBench (un indicator pentru codare autonomă în editorul Cursor) arată 70%, de la 58% la Opus 4.6. The Next Web leagă această evoluție de utilizarea practică: Claude este deja o alegere implicită în Cursor și Claude Code, iar Claude Code ar fi atins în februarie o rată anualizată de venituri de 2,5 miliarde de dolari (aprox. 11,5 miliarde lei).

Diferențierea se mută însă dinspre „raționament pur” spre execuție în fluxuri complexe. Pe GPQA Diamond (raționament la nivel de studii avansate), scorurile sunt aproape egale: Opus 4.7 are 94,2%, GPT-5.4 Pro 94,4%, iar Gemini 3.1 Pro 94,3% — diferențe pe care publicația le descrie ca fiind în marja de variație.

„Agentic”: coordonare multi-agent și robustețe în fluxuri lungi

Anthropic susține că Opus 4.7 aduce o îmbunătățire de 14% față de Opus 4.6 pe fluxuri de lucru complexe, multi-pas, folosind mai puțini „tokeni” (unități de text folosite la calculul costurilor) și generând o treime din erorile de instrumente. Compania mai spune că este primul model Claude care trece „teste de nevoie implicită”, adică situații în care modelul trebuie să deducă singur ce instrumente sau acțiuni sunt necesare.

O noutate importantă este coordonarea multi-agent: capacitatea de a orchestra mai multe „fire” de lucru AI în paralel, în loc de procesare strict secvențială. Pentru utilizări de tip enterprise (revizie de cod, analiză de documente, procesare de date în același timp), aceasta se traduce în debit mai mare de lucru. Anthropic afirmă și că modelul își poate menține „focusul” pe fluxuri de lucru de ordinul orelor, dar aceasta rămâne o afirmație de producător care depinde de validarea în utilizare reală.

Publicația mai notează accentul pe reziliență: Opus 4.7 ar continua execuția chiar și când apar eșecuri ale instrumentelor, în loc să se oprească — relevant pentru automatizări unde o singură eroare poate bloca un întreg lanț.

Viziune și context: rezoluție mai mare pentru documente, fereastră de context neschimbată

Pe partea de imagini, Opus 4.7 poate procesa rezoluții de până la 2.576 pixeli pe latura lungă, de peste trei ori față de modelele Claude anterioare. Ținta declarată este analiza de documente în companii (contracte scanate, desene tehnice, situații financiare), unde detaliile fine pot fi ratate la rezoluții mai mici.

Fereastra de context rămâne la un milion de tokeni (jumătate din cei două milioane ai Gemini 3.1 Pro), iar pe benchmark-uri de cercetare cu context lung, Opus 4.7 ar fi la egalitate pe primul loc la scorul total 0,715 pe șase module, cu o consistență ridicată.

Anthropic mai spune că modelul urmează instrucțiunile mai „literal” decât înainte, ceea ce poate cere ajustarea prompturilor existente: mai puțină ambiguitate și comportament „off-task”, dar și mai puține rezultate „creative” neașteptate.

Preț și disponibilitate: performanță mai bună, fără scumpire

Opus 4.7 este disponibil pe planurile Claude Pro, Max, Team și Enterprise și prin API la 5 dolari (aprox. 23 lei) per milion de tokeni de intrare și 25 de dolari (aprox. 115 lei) per milion de tokeni de ieșire — același nivel ca Opus 4.6. Există și mecanisme de reducere: „prompt caching” cu economii de până la 90% și Batch API cu discount de 50% la intrare și ieșire.

Modelul poate fi accesat și prin Amazon Bedrock, Google Cloud Vertex AI și Microsoft Foundry. The Next Web notează că Gemini 3.1 Pro este mai ieftin (2 dolari și 12 dolari per milion de tokeni pentru intrare/ieșire), însă avantajul Opus 4.7 pe SWE-bench și pe raționament „agentic” ar putea justifica prima de preț pentru companiile care au nevoie de capabilitate maximă.

În plus, Anthropic a adăugat măsuri automate de protecție cibernetică pentru a detecta și bloca solicitări interzise sau cu risc ridicat, pe fondul preocupărilor legate de utilizări cu dublu scop (civil și malițios). Publicația leagă această abordare de restricțiile anterioare aplicate modelului Mythos, disponibil doar pentru 11 organizații în cadrul Project Glasswing.

În esență, Opus 4.7 nu schimbă paradigma, dar mută raportul cost/performanță în favoarea Anthropic exact în zona care contează economic: codare și automatizare de fluxuri complexe, la același preț pe token.

Tag-uri:codare automata swe-bench pro protectie cibernetica project glasswing claude opus 4.7 anthropic fluxuri multi-agent

AutorEdi Claw

Sursăthenextweb.com

Anthropic lansează Claude Opus 4.7 - Îmbunătățiri semnificative în codare și raționament agentic pentru utilizatorii enterprise

De ce contează pentru companii: mai multă muncă automatizată, cu mai puține erori de instrumente

„Agentic”: coordonare multi-agent și robustețe în fluxuri lungi

Viziune și context: rezoluție mai mare pentru documente, fereastră de context neschimbată

Preț și disponibilitate: performanță mai bună, fără scumpire

Articole pe același subiect

Meta discută cu Anthropic un acord de circa 10 miliarde de dolari pentru închirierea de putere de calcul AI - cererea de infrastructură crește pe fondul deficitului de cipuri Nvidia

Google DeepMind lansează Gemini 3.6 Flash, 3.5 Flash-Lite și 3.5 Flash Cyber - mizează pe modele mai ieftine și eficiente, în timp ce Gemini 3.5 Pro rămâne în testare

IMM România: România are un index de 52,5/100 la pregătirea pieței muncii pentru inteligența artificială - decalajul față de UE persistă, pe fondul competențelor digitale scăzute și al inovării slabe

Honor păstrează butonul fizic de AI pe seria Magic 9 - poziția ar putea fi schimbată după plângeri privind apăsările accidentale

Apple ar fi angajat echipa inițială din Alibaba care a dezvoltat versiunea open-source a modelului Qwen - mișcare legată de îmbunătățirea Siri și Apple Intelligence în China

Runkor JN a prezentat la WAIC 2026, în Shanghai, un robot „centaur” pentru inspecții și intervenții de urgență - platformă roată-picior cu sarcină medie 100–120 kg și maxim static 210 kg