Știri
Tag: claude mythos preview

Microsoft își extinde instrumentele interne de securitate cu modele AI ale Anthropic , într-o mișcare care mută inteligența artificială mai aproape de „linia de producție” a software-ului, acolo unde sunt depistate și corectate vulnerabilitățile înainte ca produsele să ajungă la utilizatori, potrivit Profit . Compania a anunțat că va integra modele avansate de inteligență artificială, inclusiv Claude Mythos Preview , dezvoltat de Anthropic, în propriul program de dezvoltare securizată a software-ului. Ce se schimbă operațional: AI intră în Security Development Lifecycle Modelele vor fi incluse în Security Development Lifecycle (SDL) – sistemul intern al Microsoft folosit pentru identificarea vulnerabilităților și remedierea lor încă din fazele incipiente ale dezvoltării produselor. În practică, integrarea vizează întărirea proceselor de securitate „din proiectare”, nu doar reacția după apariția incidentelor. Profit nu oferă detalii suplimentare despre calendarul implementării, aria exactă de produse vizată sau modul în care vor fi folosite modelele în fluxurile de lucru ale echipelor de dezvoltare. [...]

Anthropic păstrează prețul, dar ridică miza pe utilizarea „în producție” a lui Claude Opus 4.7 , cu îmbunătățiri de fiabilitate pentru sarcini lungi și un upgrade de vedere care vizează direct fluxurile de lucru din inginerie software și analiză de imagini, potrivit Interesting Engineering . Modelul, prezentat drept noul vârf de gamă al companiei, este poziționat ca mai potrivit pentru activități complexe, de durată, unde dezvoltatorii s-au plâns frecvent de rezultate inconsecvente pe lanțuri lungi de instrucțiuni. Publicația notează că utilizatori timpurii spun că au mai multă încredere să „delege” sarcini de programare dificile, care anterior necesitau supraveghere umană mai strânsă. Ce se schimbă operațional: codare mai stabilă și respectare mai strictă a instrucțiunilor În zona de programare, Opus 4.7 pune accent pe calitatea execuției și pe consistență în fluxuri extinse de lucru. Conform articolului, modelul își verifică mai bine propriile rezultate înainte de a răspunde, tocmai pentru a reduce erorile care apar pe secvențe lungi de pași. O schimbare cu impact practic este „urmarea instrucțiunilor” (instruction following) mai strictă decât la versiunile anterioare. Asta poate obliga echipele să-și ajusteze modul de scriere a solicitărilor (prompts): instrucțiuni pe care modelele mai vechi le tratau „mai lejer” pot produce acum rezultate neașteptate, dar corecte tehnic. În testările interne menționate, Anthropic indică rezultate mai bune și pe sarcini legate de finanțe, inclusiv analiză structurată și calitatea prezentării. Upgrade pe „vision”: imagini mai mari, utile pentru capturi de ecran și diagrame Pe componenta vizuală, Opus 4.7 poate procesa imagini cu rezoluție mai mare, până la 2.576 pixeli pe latura lungă. Creșterea este prezentată ca un avantaj pentru interpretarea capturilor de ecran dense și a diagramelor detaliate, cu utilizări precum citirea tablourilor de bord, extragerea de date structurate și sprijin pentru „agenți” care folosesc computerul (sisteme care execută pași în interfețe software). Modelul primește și îmbunătățiri legate de „memorie” între sesiuni: poate reține informații-cheie stocate în fișiere și le poate reutiliza ulterior, reducând nevoia de a repeta contextul — un element care, în practică, poate scurta fluxurile de lucru și limita consumul de resurse. Poziționare și control al riscurilor: între performanță și utilizare responsabilă Anthropic trasează o diferență între Opus 4.7 și un sistem experimental mai avansat, Claude Mythos Preview, sugerând că noua versiune urmărește mai degrabă stabilitatea și „pregătirea pentru implementare” decât maximizarea capabilităților brute. Compania afirmă: „Deși este mai puțin capabil în sens larg decât cel mai puternic model al nostru, Claude Mythos Preview, arată rezultate mai bune decât Opus 4.6 pe o gamă de benchmark-uri.” Pe securitate, compania spune că introduce măsuri care detectează și blochează solicitările cu risc ridicat în zona de securitate cibernetică: „Lansăm Opus 4.7 cu măsuri de protecție care detectează și blochează automat solicitările care indică utilizări interzise sau cu risc ridicat în securitatea cibernetică.” În paralel, Anthropic lansează un „Cyber Verification Program”, prin care cercetători verificați pot accesa modelul pentru activități precum testarea de penetrare și analiza vulnerabilităților. Disponibilitate și preț: neschimbate, dar pe mai multe platforme Opus 4.7 este disponibil prin API-ul Anthropic și prin platforme de cloud: Amazon Bedrock , Google Cloud Vertex AI și Microsoft Foundry. Prețurile rămân la 5 dolari (aprox. 23 lei) pe milion de tokeni de intrare și 25 dolari (aprox. 115 lei) pe milion de tokeni de ieșire. Pentru companii, combinația dintre preț neschimbat și accentul pe fiabilitate în sarcini lungi sugerează o încercare de a reduce costurile operaționale ascunse ale utilizării modelelor (timp de verificare, reluări, corecții), fără a cere un buget mai mare per unitate de consum. Limitarea este că articolul nu oferă detalii despre metodologia completă a benchmark-urilor sau rezultate numerice comparabile, dincolo de afirmațiile de poziționare și exemplele de utilizare. [...]