Inteligență artificială01 iul. 2026
Anthropic reduce costul rulării agenților AI cu Claude Sonnet 5 - preț promoțional 2/10 dolari per milion de tokeni până la 31 august, apoi 3/15
Anthropic coboară costul pentru „agenți” AI prin lansarea Claude Sonnet 5 , un model poziționat aproape de performanța vârfului de gamă Opus 4.8 , dar la tarife semnificativ mai mici, potrivit TechCrunch . Miza este una economică: pe măsură ce tot mai multe companii încearcă să automatizeze procese cu agenți (modele care planifică și execută sarcini cu instrumente), diferențiatorul devine prețul și fiabilitatea, nu doar „inteligența” brută. Claude Sonnet 5 este descris de Anthropic ca fiind capabil să facă planuri, să folosească instrumente precum browserul și terminalul și să ruleze autonom, la un nivel care „în urmă cu doar câteva luni” ar fi cerut modele mai mari și mai scumpe. În această logică, Sonnet 5 este prezentat ca noul „standard” pentru capabilități agentice la un nivel de preț mediu. Preț: promoție până la 31 august, apoi scumpire La lansare, Sonnet 5 costă 2 dolari per milion de tokeni de intrare și 10 dolari per milion de tokeni de ieșire (aprox. 9 lei, respectiv 45 lei), până la 31 august , după care tarifele urcă la 3 dolari și 15 dolari (aprox. 14 lei și 69 lei). TechCrunch notează că, la aceste niveluri, Sonnet 5 este mai ieftin decât Opus 4.8, precum și decât OpenAI GPT-5.5 și Google Gemini 3.1 Pro, dar rămâne mai scump decât Gemini 3.5 Flash. Din perspectiva distribuției, începând de marți, Sonnet 5 devine modelul implicit pentru planurile Free și Pro și este disponibil în toate abonamentele. Performanță: aproape de Opus 4.8, peste Sonnet 4.6 Anthropic susține că Sonnet 5 aduce îmbunătățiri importante față de Sonnet 4.6 (lansat în februarie) pe zone relevante pentru agenți: raționament, utilizarea instrumentelor, programare și „muncă de cunoaștere” (sarcini de analiză și redactare). Un exemplu de benchmark citat: „agentic coding”: 63,2% pentru Sonnet 5, față de 69,2% pentru Opus 4.8 și 58,1% pentru Sonnet 4.6. Pe un benchmark de „knowledge work”, Sonnet 5 ar depăși ușor Opus 4.8, deși Anthropic spune că Opus rămâne alegerea pentru acuratețe mai mare pe aceste sarcini. Compania descrie și posibilitatea de a ajusta „nivelul de efort” pentru a găsi un echilibru cost–performanță între Sonnet 5 și Opus 4.8. Ce spun testerii și ce înseamnă operațional Potrivit testerilor citați de Anthropic, Sonnet 5 ar fi mai bun la finalizarea sarcinilor complexe, unde versiunile anterioare se opreau „la jumătate”, și își verifică rezultatele fără a i se cere explicit. Un exemplu vine de la Zapier, printr-o declarație a unui inginer senior: „I-am dat lui Claude Sonnet 5 o sarcină în două părți — să actualizeze nivelurile conturilor în Salesforce și să trimită un anunț de lansare către contacte enterprise — și a dus-o la capăt, de la un capăt la altul.” Siguranță: mai puține comportamente nedorite, dar sub Opus Pe zona de siguranță, Anthropic afirmă că Sonnet 5 are o rată mai mică de „comportamente nedorite” (inclusiv cooperarea cu abuzuri și înșelăciunea) decât Sonnet 4.6, refuză mai bine cererile malițioase și se descurcă mai bine în fața tentativelor de „prompt injection” (atacuri care încearcă să deturneze instrucțiunile unui agent). Totodată, compania spune că Sonnet 5 halucinează și manifestă comportament lingușitor („sycophantic”) mai rar decât Sonnet 4.6. În același timp, Anthropic precizează că modelul nu atinge nivelul Opus 4.8 și al Claude Mythos Preview la capitolul comportament „nealiniat” și că evaluările arată o capacitate mai redusă de a executa sarcini periculoase de securitate cibernetică decât modelele Opus. De ce contează pentru piață Mesajul central al lansării este că agenții AI devin o funcție „de bază” , iar competiția se mută către costul de rulare și fiabilitatea fără supraveghere umană . Pentru companii, asta înseamnă că proiectele de automatizare cu agenți – care consumă multe resurse prin bucle, apeluri de instrumente și execuții mai lungi – pot deveni mai ușor de justificat economic dacă performanța se apropie de modelele premium, dar la tarife mai joase. [...]