Tag: ai security institute

Știri despre „ai security institute”

Un bărbat cu ochelari discută despre securitatea cibernetică.

Inteligență artificială15 apr. 2026

Claude Mythos de la Anthropic poate fi cel mai bun model AI pentru securitatea cibernetică - Modele mai ieftine oferă rezultate similare, ridicând întrebări despre costuri și fiabilitate

Claude Mythos riscă să fie greu de monetizat în securitate cibernetică din cauza costurilor de rulare și a disponibilității sub nivel „enterprise”, chiar dacă performanța tehnică este ridicată, potrivit unei analize Tom's Hardware . Modelul AI al Anthropic a atras atenția după ce compania a sugerat că Mythos ar putea identifica vulnerabilități de tip „zero-day” (breșe necunoscute public și necorectate) în browsere și sisteme de operare, ceea ce a dus la inițiativa „Project Glasswing” – o colaborare cu companii mari de tehnologie pentru remedierea problemelor înainte ca modelul (aflat încă în versiune „preview”) să fie lansat pe scară mai largă. Publicația notează însă că, dincolo de mesajul ambițios, capabilitățile nu sunt „spectaculoase” în sensul prezentat inițial. Modele mai ieftine pot ajunge „aproape” la același rezultat Un punct cheie pentru companii este că o parte din vulnerabilitățile prezentate drept „de referință” pentru Mythos pot fi detectate și de modele mai accesibile, inclusiv modele cu greutăți deschise (open-weight), conform unei analize publicate de Aisle. În exemplele citate: GPT-OSS-120b ar fi identificat o vulnerabilitate de analiză „Sack” în OpenBSD; Qwen3 32B ar fi găsit o eroare de detecție în FreeBSD NFS; Kimi K2 (open-weight) ar fi identificat, de asemenea, vulnerabilitățile care au generat titluri. Concluzia de business sugerată de această comparație: dacă diferența de performanță nu este mare, unele organizații pot prefera variante mai ieftine de rulat (inclusiv local), în locul unui model de vârf cu costuri mai ridicate. „Securitatea cibernetică” nu e un singur task, iar costul pe succes devine metrică Analiza Aisle mai susține că Anthropic tratează securitatea cibernetică drept un instrument unitar care acoperă mai multe etape (descoperire, verificare, exploatare, remediere), deși în practică acestea sunt pași diferiți, cu cerințe diferite. În acest context, unele modele mai „ușoare” pot performa bine pe anumite segmente. Aisle descrie evaluarea ca o combinație de factori – „inteligență per token”, „tokeni per dolar”, „tokeni pe secundă” și expertiza de securitate integrată în „scaffold” (structura de instrumente și procese care orchestrează modelul). Chiar dacă Mythos ar maximiza „inteligența per token”, celelalte variabile pot cântări la fel de mult în utilizarea reală. Separat, Irregular propune ca eficiența să fie judecată și prin „costul așteptat per succes” – adică nu doar dacă modelul poate reuși, ci cât costă, în medie, să ajungi la un rezultat util în practică. Benchmark-urile AISI: Mythos conduce la sarcini complexe, dar cu buget mare de tokeni O altă evaluare, realizată de AI Security Institute (AISI) din Marea Britanie, indică faptul că Mythos este cel mai capabil model în benchmark-urile proprii de securitate cibernetică ale institutului. Diferențele față de alte modele nu ar fi „dramatice” pe toate sarcinile, însă la descoperiri și exploatări mai complexe Mythos ar ieși în față. Un element important este dependența de „context lung” (intrări mari) și de bugete ridicate de tokeni. AISI spune că a testat Mythos până la un buget de 100 de milioane de tokeni și că performanța a continuat să crească până la acel prag, sugerând că ar putea scala și mai departe cu mai mult „inference compute” (putere de calcul pentru rularea modelului). Disponibilitatea serviciului: 98,4% uptime, sub standardul cerut de clienții mari Dincolo de performanță și cost, apare o problemă operațională: capacitatea Anthropic de a livra serviciul la nivel „enterprise”. Tom’s Hardware notează că modelele Anthropic au avut o rată de disponibilitate (uptime) de 98,4% în ultimele 90 de zile, la momentul redactării. Prin comparație, 99,99% este considerat standard „enterprise-grade” – iar diferența se traduce în aproape 12 ore de indisponibilitate pe lună, un nivel slab pentru servicii cloud. În același material se menționează că API-ul OpenAI oferă 99,99% uptime, ceea ce contează direct într-un model de afaceri bazat pe vânzarea de tokeni. În acest cadru, Mythos – descris ca probabil mai „greu” computațional – ar putea pune presiune suplimentară pe infrastructura Anthropic, care ar avea nevoie de mai multă capacitate de calcul (publicația amintește și un acord recent cu Broadcom , în acest sens). Ce înseamnă pentru piață Pentru companiile care cumpără servicii de securitate cibernetică sau rulează intern astfel de capabilități, mesajul este pragmatic: Mythos poate fi printre cele mai bune modele, dar nu neapărat cea mai eficientă opțiune „end-to-end”, dacă alternativele mai ieftine ating rezultate apropiate pe o parte din sarcini. Pentru Anthropic, miza devine dublă: să justifice economic un model de vârf (în condițiile în care prețul final nu este prezentat) și să ridice fiabilitatea livrării la nivelul așteptat de clienții mari din zona SaaS și securitate cibernetică. [...]