Știri
Știri din categoria Inteligență artificială

Anthropic păstrează prețul, dar ridică miza pe utilizarea „în producție” a lui Claude Opus 4.7, cu îmbunătățiri de fiabilitate pentru sarcini lungi și un upgrade de vedere care vizează direct fluxurile de lucru din inginerie software și analiză de imagini, potrivit Interesting Engineering.
Modelul, prezentat drept noul vârf de gamă al companiei, este poziționat ca mai potrivit pentru activități complexe, de durată, unde dezvoltatorii s-au plâns frecvent de rezultate inconsecvente pe lanțuri lungi de instrucțiuni. Publicația notează că utilizatori timpurii spun că au mai multă încredere să „delege” sarcini de programare dificile, care anterior necesitau supraveghere umană mai strânsă.
În zona de programare, Opus 4.7 pune accent pe calitatea execuției și pe consistență în fluxuri extinse de lucru. Conform articolului, modelul își verifică mai bine propriile rezultate înainte de a răspunde, tocmai pentru a reduce erorile care apar pe secvențe lungi de pași.
O schimbare cu impact practic este „urmarea instrucțiunilor” (instruction following) mai strictă decât la versiunile anterioare. Asta poate obliga echipele să-și ajusteze modul de scriere a solicitărilor (prompts): instrucțiuni pe care modelele mai vechi le tratau „mai lejer” pot produce acum rezultate neașteptate, dar corecte tehnic.
În testările interne menționate, Anthropic indică rezultate mai bune și pe sarcini legate de finanțe, inclusiv analiză structurată și calitatea prezentării.
Pe componenta vizuală, Opus 4.7 poate procesa imagini cu rezoluție mai mare, până la 2.576 pixeli pe latura lungă. Creșterea este prezentată ca un avantaj pentru interpretarea capturilor de ecran dense și a diagramelor detaliate, cu utilizări precum citirea tablourilor de bord, extragerea de date structurate și sprijin pentru „agenți” care folosesc computerul (sisteme care execută pași în interfețe software).
Modelul primește și îmbunătățiri legate de „memorie” între sesiuni: poate reține informații-cheie stocate în fișiere și le poate reutiliza ulterior, reducând nevoia de a repeta contextul — un element care, în practică, poate scurta fluxurile de lucru și limita consumul de resurse.
Anthropic trasează o diferență între Opus 4.7 și un sistem experimental mai avansat, Claude Mythos Preview, sugerând că noua versiune urmărește mai degrabă stabilitatea și „pregătirea pentru implementare” decât maximizarea capabilităților brute. Compania afirmă:
„Deși este mai puțin capabil în sens larg decât cel mai puternic model al nostru, Claude Mythos Preview, arată rezultate mai bune decât Opus 4.6 pe o gamă de benchmark-uri.”
Pe securitate, compania spune că introduce măsuri care detectează și blochează solicitările cu risc ridicat în zona de securitate cibernetică:
„Lansăm Opus 4.7 cu măsuri de protecție care detectează și blochează automat solicitările care indică utilizări interzise sau cu risc ridicat în securitatea cibernetică.”
În paralel, Anthropic lansează un „Cyber Verification Program”, prin care cercetători verificați pot accesa modelul pentru activități precum testarea de penetrare și analiza vulnerabilităților.
Opus 4.7 este disponibil prin API-ul Anthropic și prin platforme de cloud: Amazon Bedrock, Google Cloud Vertex AI și Microsoft Foundry. Prețurile rămân la 5 dolari (aprox. 23 lei) pe milion de tokeni de intrare și 25 dolari (aprox. 115 lei) pe milion de tokeni de ieșire.
Pentru companii, combinația dintre preț neschimbat și accentul pe fiabilitate în sarcini lungi sugerează o încercare de a reduce costurile operaționale ascunse ale utilizării modelelor (timp de verificare, reluări, corecții), fără a cere un buget mai mare per unitate de consum. Limitarea este că articolul nu oferă detalii despre metodologia completă a benchmark-urilor sau rezultate numerice comparabile, dincolo de afirmațiile de poziționare și exemplele de utilizare.
Recomandate

Modelele „frontier” ale OpenAI și Codex devin disponibile direct în AWS , ceea ce poate reduce semnificativ fricțiunile operaționale care încetinesc adopția inteligenței artificiale în companii, potrivit OpenAI . Miza pentru clienții enterprise este integrarea în fluxuri existente de securitate, conformitate, achiziții, facturare și guvernanță, fără a mai „ocoli” platforma pe care își rulează deja infrastructura. Disponibilitatea generală („generally available”) pe AWS deschide accesul pentru milioane de clienți AWS care pot construi cu tehnologiile OpenAI în mediul pe care îl folosesc deja pentru operațiunile lor. OpenAI susține că această cale scurtează drumul de la evaluare la implementare în producție, tocmai prin folosirea controalelor și proceselor deja aprobate intern în organizații. Cum ajung capabilitățile OpenAI în AWS OpenAI spune că oferă acces la capabilități „frontier” în AWS, păstrând un model operațional familiar pentru utilizatorii AWS și un traseu mai rapid către producție. În material sunt menționate două modalități de disponibilitate, dintre care una este detaliată explicit: Codex on Amazon Bedrock aduce în AWS agentul OpenAI pentru inginerie software, folosit de „peste 5 milioane de oameni în fiecare săptămână”, pentru sarcini precum scriere, revizuire, depanare și modernizare de cod în mediile în care echipele dezvoltă și livrează deja. OpenAI mai precizează că aceste oferte sunt disponibile atât în regiunile „Commercial”, cât și în „ GovCloud ” (zona AWS destinată în principal organizațiilor cu cerințe guvernamentale și de conformitate specifice). De ce contează pentru companii: mai puțin timp pe „blocaje”, mai mult pe livrare Unghiul principal al anunțului este operațional: mutarea capabilităților OpenAI în interiorul AWS ar reduce fricțiunile legate de achiziție, revizuiri de securitate și pregătirea pentru producție. În logica prezentată de OpenAI, organizațiile pot petrece mai puțin timp cu barierele administrative și mai mult timp construind și implementând efectiv. Ce urmează: extindere și „Daybreak” pentru zona de securitate cibernetică OpenAI descrie „OpenAI on AWS” ca începutul unei extinderi a capabilităților disponibile prin AWS. În acest context, compania indică o disponibilitate viitoare pentru „Daybreak”, viziunea OpenAI pentru schimbarea modului în care software-ul este construit și apărat, care ar include „modele de securitate cibernetică” și „Codex Security”. Potrivit descrierii din sursă, Daybreak ar viza integrarea în ciclul de dezvoltare a unor funcții precum revizuire de cod sigură, modelare de amenințări, validare de patch-uri, analiză a riscului din dependențe, detecție și ghidaj de remediere. OpenAI notează că, pe măsură ce astfel de capabilități specializate devin disponibile, AWS poate fi o cale importantă de adopție pentru echipele de securitate, prin cadrele de guvernanță și operațiuni pe care le folosesc deja. [...]

Anthropic ar urma să permită ENISA să testeze modelul Mythos înainte de lansarea la scară largă , într-o mișcare care poate seta un precedent de „audit” instituțional pentru modelele de inteligență artificială cu potențial ofensiv în securitate cibernetică, potrivit IT Home , care citează Bloomberg. Informația vizează includerea Agenției Uniunii Europene pentru Securitate Cibernetică (ENISA) în programul „Project Glasswing”, prin care instituții considerate „critice” ar primi acces la Mythos pentru testare înainte ca modelul să fie disponibil pe scară largă. Subiectul este urmărit îndeaproape deoarece, potrivit sursei, există îngrijorări în rândul unor oficiali că sistemul ar putea fi folosit de actori rău intenționați ca instrument pentru exploatarea vulnerabilităților. De ce contează: un model de acces controlat pentru IA cu risc de abuz Anthropic ar fi ales o deschidere graduală a accesului la Mythos, tocmai din cauza capacității modelului de a identifica vulnerabilități de securitate cibernetică, pe care compania o descrisese anterior ca fiind neobișnuit de puternică și, implicit, cu risc ridicat. În această logică, testarea de către guverne și companii ar avea rolul de a evalua mai întâi: securitatea propriilor sisteme; rezistența la atacuri (capacitatea de a face față tentativelor de compromitere). Dacă această abordare se confirmă, ea indică o direcție operațională relevantă pentru piață: accesul la modele avansate cu utilizări duale (defensive și ofensive) poate deveni condiționat de evaluări și programe de testare, nu doar de disponibilitate comercială. Ce știm despre calendar și discuțiile cu UE Potrivit informațiilor citate, Anthropic ar fi informat Comisia Europeană despre decizie în weekendul trecut. Discuțiile nu ar fi publice, iar persoanele citate de Bloomberg au cerut anonimat. De la lansarea Mythos la finalul lunii aprilie, oficiali din UE și din state europene ar fi încercat să obțină acces la model. Sursa mai arată că, săptămâna trecută, oficiali ai Comisiei Europene au mers la San Francisco pentru discuții cu conducerea Anthropic, în încercarea de a obține drept de utilizare. Reacții: Comisia Europeană avertizează că vor urma modele și mai puternice Purtătorul de cuvânt al Comisiei Europene, Thomas Regnier, a declarat că Mythos nu este un caz singular și că vor apărea modele mai puternice, iar UE discută cu parteneri „cu viziuni similare”, inclusiv SUA, pentru a aborda provocările. Regnier nu a oferit detalii despre momentul în care ENISA ar putea primi acces, iar Anthropic nu a comentat, conform sursei. [...]

NVIDIA își extinde ofensiva în centrele de date cu Vera, un CPU „pentru agenți” care promite să crească veniturile din tokeni. Potrivit NVIDIA News , noul procesor Vera este deja în producție și este poziționat ca o piesă-cheie pentru „fabricile de AI” (infrastructuri care rulează antrenare, inferență și execuție de agenți), într-un moment în care economia acestor sisteme se mută de la „nuclee per dolar” la „tokeni per dolar” — adică la câți pași de calcul utili pot livra pentru fiecare unitate de cost. NVIDIA susține că Vera finalizează sarcini cu 1,8 ori mai repede decât procesoarele x86, pe o plajă de utilizări care include AI „agentic” (modele care nu doar răspund, ci execută acțiuni, rulează cod și folosesc instrumente), învățare prin recompensă (reinforcement learning) și procesare de date. Miza economică invocată de companie este directă: mai multă performanță CPU pe fluxurile critice din centrele de date ar însemna mai mult „token revenue” (venituri asociate volumului de tokeni procesați în servicii AI). De ce contează: CPU-ul devine din nou o constrângere în „fabricile de AI” În arhitecturile moderne pentru AI, acceleratoarele (GPU) fac partea grea de calcul, dar multe etape rămân limitate de CPU: rularea mediilor Python, compilări, execuție de cod în sandbox (medii izolate), logică de orchestrare și conducte de analiză. NVIDIA își construiește argumentul pe ideea că agenții AI cresc masiv cererea pentru astfel de sarcini, iar un CPU mai rapid și mai eficient energetic crește „debitul” (throughput) de agenți și interactivitatea. Jensen Huang , fondator și CEO al NVIDIA, afirmă: „Agenții AI vor fi cei mai mari utilizatori de calcul. Vera este primul CPU proiectat pentru acel viitor — construit pentru a rula AI agentic la scară hyperscale cu performanță, eficiență și programabilitate extraordinare.” Ce aduce Vera: arhitectură proprie și integrare strânsă cu platformele NVIDIA Vera este bazat pe „Olympus”, un nucleu CPU personalizat NVIDIA, și include 88 de nuclee Olympus , „Spatial Multithreading” (o tehnică de execuție paralelă pentru a crește utilizarea resurselor) și memorie LPDDR5X cu până la 1,2 TB/s lățime de bandă. Pe partea de integrare în platformele companiei, Vera este prezentat ca: CPU pentru servere Vera „standalone” (configurații dedicate CPU), CPU gazdă pentru platformele NVIDIA Vera Rubin , prin interconectarea NVLink-C2C de generația a doua, cu până la 1,8 TB/s lățime de bandă coerentă între CPU și GPU, componentă pentru platforme de stocare AI, prin NVIDIA Vera BlueField-4 STX , care combină CPU-ul cu rețelistică, accelerare de stocare și securitate „în siliciu”. NVIDIA mai spune că Vera extinde „Confidential Computing” (mecanisme hardware/software care protejează datele în utilizare) la nivel de rack, pentru a proteja sarcini agentice. Cine îl adoptă și cine îl produce: ecosistem de cloud și OEM Compania indică drept potențiali utilizatori sau evaluatori ai Vera atât laboratoare AI, cât și operatori mari de cloud și infrastructură. Sunt menționate, între altele, Anthropic, OpenAI și SpaceXAI, precum și ByteDance, CoreWeave și Oracle Cloud Infrastructure (OCI). În zona enterprise, NVIDIA indică și NYSE ca utilizator care explorează platforma. Pe partea de producție și integrare hardware, NVIDIA spune că sisteme Vera vor fi construite la scară de producători precum Dell Technologies, HPE, Lenovo și Supermicro, alături de ASUS, Compal, Foxconn, GIGABYTE, Pegatron, Quanta Cloud Technology (QCT), Wistron și Wiwynn, între alții. Publicația notează că marii OEM ar urma să ofere Vera în configurații de server CPU „standalone”, ca „prima opțiune standard de CPU dincolo de x86”. Performanță: benchmark-uri invocate și un exemplu de utilizare NVIDIA citează Phoronix (publicație de benchmark-uri open-source) spunând că Vera a livrat „cea mai rapidă performanță generală” pe sarcini agentice precum compilare de cod, Python, Java și procesare de baze de date — exact tipuri de încărcări care apar pe traseul critic al execuției agenților (utilizare de instrumente și execuție în sandbox). Într-un exemplu operațional, NYSE Group leagă adopția de obiective de latență și capacitate. Lynn Martin, președinte NYSE Group, spune: „NYSE procesează peste 1,1 trilioane de mesaje pe zi și, în colaborare cu Redpanda și HPE, folosind CPU-urile NVIDIA Vera, ne vom extinde capacitatea, optimizând în continuare latența pentru a susține o infrastructură de piață performantă, rezilientă și pregătită pentru AI.” Disponibilitate: când ajunge pe piață NVIDIA afirmă că sistemele Vera vor fi disponibile de la integratori și parteneri cloud din această toamnă . Compania nu oferă în material detalii despre prețuri sau despre configurații comerciale concrete pentru fiecare segment, astfel că impactul financiar imediat rămâne de evaluat în funcție de ritmul de adoptare în cloud și în centrele de date enterprise. [...]

Nvidia susține că și-a asigurat capacitatea de producție pentru a alimenta creșterea cererii de cipuri pentru inteligență artificială, chiar dacă blocajele de aprovizionare nu au dispărut , potrivit Reuters . Mesajul vine într-un moment în care compania este tratată de piață drept un barometru al sănătății sectorului AI, deoarece procesoarele sale sunt folosite în aproape toate marile centre de date. Jensen Huang , CEO-ul Nvidia, a declarat la o conferință de presă organizată în timpul săptămânii Computex , la Taipei, că firma „a securizat” suficientă ofertă pentru o „creștere foarte robustă” atât la procesoare centrale (CPU), cât și la procesoare grafice (GPU). În același timp, el a admis că Nvidia rămâne „constrânsă de ofertă”, semnalând că presiunea cererii depășește încă ritmul la care poate fi livrată producția. De ce contează: semnal pentru piața AI și pentru clienții de centre de date Nvidia este considerată un indicator pentru piața AI, iar orice nuanță legată de disponibilitatea cipului are implicații directe pentru ritmul investițiilor în infrastructura de calcul. Declarațiile lui Huang sugerează că Nvidia încearcă să reducă riscul ca lipsa de capacitate să frâneze extinderea centrelor de date, dar și că tensiunile din lanțul de aprovizionare rămân un factor de incertitudine. Cererea pentru GPU-urile Nvidia destinate AI a generat „zeci de miliarde de dolari” în venituri, notează Reuters , și a contribuit la poziționarea companiei drept cea mai valoroasă din lume. CPU-urile „Vera”, prezentate ca următorul motor de creștere Huang a indicat că procesoarele de centru de date „Vera” ar putea deveni chiar mai populare decât GPU-urile, argumentând că rolul CPU-urilor în „procesarea informației” este esențial. Nvidia concurează aici cu AMD și Intel, iar CEO-ul a descris Vera drept un viitor „motor major de creștere” pentru companie. Extinderea către PC-uri cu AI și competiția directă cu AMD, Intel și Apple Declarațiile au venit la o zi după ce Nvidia a prezentat un cip nou care aduce capabilități AI direct pe PC-uri. Cipul RTX Spark ar urma să fie lansat în toamnă și va concura cu produse ale AMD, Intel și Apple. Huang a spus că RTX Spark face parte din eforturile Nvidia împreună cu Microsoft de a „reinventa PC-ul” pentru era AI. Taiwan, pivot în lanțul de aprovizionare și în strategia de reziliență Născut în Tainan, Huang a reiterat importanța Taiwanului în strategia Nvidia, afirmând că insula este un partener strategic pentru SUA și invocând investițiile Taiwanului în producția din SUA. Nvidia intenționează să continue investițiile în Taiwan și să își facă lanțul de aprovizionare „cât mai rezilient posibil”, Huang adăugând că firma este „cel mai mare cumpărător” din ecosistemul Taiwanului. În lipsa unor detalii suplimentare despre volume sau termene de livrare, mesajul central rămâne unul de echilibru: Nvidia spune că și-a asigurat capacitatea pentru creștere, dar recunoaște că presiunea cererii menține compania într-o zonă de constrângeri de ofertă. [...]

NVIDIA pregătește intrarea în producție de masă cu „Vera”, un CPU proiectat special pentru agenți AI , o mișcare care poate schimba arhitectura standard a serverelor pentru inteligență artificială și, implicit, costurile și performanța infrastructurii din centrele de date, potrivit Android Headlines . Din informațiile prezentate, „Vera” este un procesor (CPU) gândit „de la zero” pentru a lucra cu sarcini specifice agenților AI – adică sisteme care nu doar răspund la comenzi, ci pot planifica și executa pași multipli pentru a atinge un obiectiv. Miza operațională este reducerea blocajelor dintre CPU și acceleratoarele AI (de regulă GPU), într-un moment în care companiile caută să scoată mai multă eficiență din fiecare rack de servere. De ce contează: NVIDIA vrea să controleze mai mult din „stiva” hardware pentru AI Până acum, în multe configurații de server, CPU-ul este furnizat de jucători consacrați, iar NVIDIA domină partea de accelerare cu GPU-uri. Un CPU proprietar orientat către agenți AI ar însemna o integrare mai strânsă între componente și o optimizare pentru fluxuri de lucru care devin tot mai frecvente în aplicațiile enterprise. În termeni practici, direcția indicată de această inițiativă este una de standardizare a platformelor AI în jurul ecosistemului NVIDIA, cu efecte potențiale asupra: modului în care sunt proiectate serverele pentru AI (alegeri de platformă, compatibilități); costului total de operare (prin eficiență mai bună sau, dimpotrivă, prin dependență mai mare de un singur furnizor); puterii de negociere în lanțul de aprovizionare pentru centrele de date. Ce se știe și ce rămâne neclar Materialul indică faptul că „Vera” ar urma să ajungă în producție de masă, însă detaliile tehnice și calendarul exact nu sunt prezentate în fragmentul de text disponibil în input. În lipsa acestor informații, rămâne de văzut: când începe efectiv producția și în ce volume; în ce sisteme va fi integrat CPU-ul și pentru ce clienți; ce câștiguri de performanță sau eficiență sunt vizate, comparativ cu platformele actuale. Pentru piață, semnalul principal este că NVIDIA își extinde ambiția dincolo de acceleratoare și încearcă să optimizeze „cap-coadă” hardware-ul pentru generația de aplicații bazate pe agenți AI, unde latența, coordonarea între componente și eficiența energetică devin criterii de diferențiere. [...]

SoftBank pariază pe Europa cu un proiect de infrastructură AI de 75 mld. euro (aprox. 375 mld. lei), mizând pe Franța ca viitor hub regional, potrivit G4Media . Planul, prezentat la Paris de CEO-ul Masayoshi Son, ar urma să ducă la construirea unor centre de date dedicate inteligenței artificiale, într-un moment în care cererea globală de putere de calcul crește accelerat. Investiția este descrisă drept cel mai mare angajament al SoftBank în domeniul infrastructurii AI în Europa. Son a făcut declarațiile într-un interviu pentru CNBC, la o zi după anunțul proiectului din Franța. Ce presupune proiectul din Franța Conform informațiilor citate, SoftBank vizează dezvoltarea unei capacități totale de 3,1 GW pentru centre de date AI în regiunea Hauts-de-France , până în 2031. Sunt menționate trei locații: Dunkerque, Bosquel și Bouchain. În cadrul unei conferințe de presă alături de președintele Franței, Emmanuel Macron, Son a indicat că grupul își extinde rapid operațiunile și că vrea să poziționeze Franța drept „centrul Europei” în AI. Parteneriat industrial: Schneider Electric , implicată în Dunkerque În proiect este implicată și Schneider Electric, care ar urma să colaboreze cu SoftBank pentru dezvoltarea unui centru industrial de producție la scară mare în Dunkerque, ca parte a infrastructurii pentru centrele de date. De ce contează: cursa pentru „puterea de calcul” mută investițiile în infrastructură Miza economică a proiectului este legată de infrastructura fizică necesară pentru AI – în special centrele de date și energia aferentă – pe fondul competiției dintre marile companii de tehnologie pentru capacitate de procesare. În acest context, Son a susținut că „revoluția” AI ar fi „de 50 de ori mai mare” decât boom-ul dotcom, argumentând că, deși perioada începutului de ani 2000 a inclus o bulă speculativă, efectele de durată au remodelat economia globală, iar AI ar urma o traiectorie similară, la o scară mai mare, cu impact asupra infrastructurii, industriei și economiei. [...]