Știri
Știri din categoria Inteligență artificială

Claude Sonnet 4.6, cel mai recent model de inteligență artificială dezvoltat de Anthropic, aduce o serie de îmbunătățiri semnificative față de versiunile anterioare, inclusiv o fereastră de context de 1 milion de tokeni, aflată în faza beta. Potrivit Anthropic, modelul este acum disponibil pentru utilizatorii planurilor Free și Pro, fără a modifica prețurile față de versiunea anterioară, Sonnet 4.5.
Sonnet 4.6 se remarcă prin capacitățile sale avansate de utilizare a computerului, fiind capabil să interacționeze cu software-ul așa cum ar face-o un utilizator uman. Acest lucru elimină necesitatea dezvoltării de conectori personalizați pentru software-uri vechi, care nu dispun de interfețe moderne API. Modelul a demonstrat progrese notabile în teste precum OSWorld, unde a reușit să îndeplinească sarcini complexe pe software-uri reale, cum ar fi Chrome și LibreOffice.
Un aspect esențial al modelului Sonnet 4.6 este rezistența sporită la atacuri de tip prompt injection, o vulnerabilitate prin care un actor malițios poate încerca să deturneze modelul prin ascunderea de instrucțiuni în pagini web. Evaluările de siguranță realizate de Anthropic arată că Sonnet 4.6 prezintă îmbunătățiri semnificative în comparație cu Sonnet 4.5 și performează la nivel similar cu modelul Opus 4.6 în ceea ce privește siguranța.
„Sonnet 4.6 are un caracter cald, onest, prosocial și uneori amuzant, cu comportamente de siguranță foarte puternice și fără semne de preocupări majore legate de forme de nealiniere cu mize mari.”
Sonnet 4.6 nu doar că îmbunătățește performanțele în utilizarea computerului, dar oferă și un avantaj semnificativ în sarcinile de planificare pe termen lung și în rezolvarea problemelor complexe. Modelul a demonstrat capacitatea de a gestiona cu succes sarcini economice valoroase, cum ar fi analiza financiară și dezvoltarea de coduri front-end, cu rezultate mai finisate și mai puține iterații necesare pentru a ajunge la calitatea de producție.
Utilizatorii timpurii ai modelului Sonnet 4.6 au raportat îmbunătățiri semnificative în ceea ce privește capacitatea modelului de a urma instrucțiuni și de a evita supra-ingineria. De asemenea, modelul a fost preferat în comparație cu modele anterioare, cum ar fi Opus 4.5, în 59% din cazuri, datorită capacității sale de a gestiona sarcini complexe fără a crește costurile.
Sonnet 4.6 reprezintă un pas important în evoluția modelelor de inteligență artificială, oferind performanțe de nivel frontieră într-un format mai compact și mai rentabil. Acest model este disponibil pe toate platformele Claude, inclusiv Claude Cowork și Claude Code, și este deja integrat în planurile gratuite și plătite ale utilizatorilor.
Recomandate

Un agent AI pus să conducă un magazin cu un buget de 100.000 de dolari (aprox. 460.000 lei) a dat rapid rateuri operaționale, iar echipa umană a fost nevoită să intervină ca să evite blocaje , arată Libertatea , care relatează despre un experiment al startup-ului Andon Labs din San Francisco. Andon Labs a creat un agent AI numit Luna și i-a dat misiunea să deschidă și să administreze un magazin fizic, cu acces la internet și un card de credit, după ce cofondatorii Lukas Petersson și Axel Backlund au închiriat un spațiu comercial pentru trei ani. Obiectivul era ca agentul să construiască „de la zero” un magazin profitabil, gestionând inclusiv designul, aprovizionarea și angajarea personalului, cu intervenție umană minimă. Potrivit relatării, Luna a fost construită folosind Claude Sonnet 4.6 de la Anthropic. Unde s-a rupt lanțul: execuție slabă în managementul de zi cu zi Luna a ales un format de boutique, „Andon Market”, cu produse diverse – de la cărți și lumânări la jocuri și articole promoționale personalizate. Însă problemele au apărut imediat în zona de operare, acolo unde retailul depinde de proceduri și coordonare. Concret, experimentul a scos în evidență mai multe vulnerabilități: recrutare superficială : interviuri telefonice scurte, de 5–15 minute; transparență inconsistentă : agentul nu le spunea mereu candidaților că este o inteligență artificială, decât dacă era întrebat direct; planificare defectuoasă : în ziua deschiderii, Luna nu a reușit să organizeze eficient programul angajaților, iar cofondatorul Lukas Petersson spune că a fost nevoie de intervenția echipei pentru a asigura prezența personalului; inconsistență de brand : logo-ul creat de agent (o față zâmbitoare generică) apărea diferit pe materiale promoționale; decizii discutabile la angajare : Luna a refuzat candidați considerați promițători (de exemplu, studenți la informatică) pe motiv că nu aveau experiență în retail, decizie criticată în material ca semn al lipsei de „judecată umană”. De ce contează pentru companii: „agentul AI” nu înlocuiește încă funcțiile critice Dincolo de componenta spectaculoasă a testului, concluzia practică este că, în forma actuală, un agent AI poate gestiona unele sarcini, dar se poate bloca în activități aparent banale, cu impact direct în costuri și continuitatea operațiunilor (programarea oamenilor, comunicarea cu candidații, coerența execuției). Andon Labs a precizat că experimentul este controlat și că persoanele care lucrează în magazin sunt angajate oficial de companie, cu salariu garantat și protecții legale. Petersson a spus că obiectivul principal este evaluarea capabilităților modelelor actuale de inteligență artificială și identificarea limitelor lor. În același context, Libertatea notează că un studiu realizat de cercetători de la Carnegie Mellon a indicat dificultăți ale agenților AI în sarcini simple, precum gestionarea unei interfețe sau interpretarea corectă a conversațiilor colegilor. [...]

Anthropic își împinge AI-ul în zona de securitate cibernetică, cu un model oferit controlat către giganți din tech , într-o mișcare care poate schimba viteza cu care sunt găsite și reparate vulnerabilitățile din sisteme precum iOS și macOS, potrivit mobilissimo.ro . Inițiativa se numește Project Glasswing și se bazează pe un nou model de inteligență artificială, Mythos Preview, pe care Anthropic îl poziționează ca instrument defensiv pentru identificarea și remedierea problemelor de securitate din sisteme de operare și browsere web. Compania susține că modelul a descoperit deja „mii” de vulnerabilități de tip „zero-day” (breșe necunoscute public și neacoperite prin actualizări la momentul descoperirii). Acces restricționat și parteneri selectați Mythos Preview nu va fi disponibil publicului larg. Anthropic spune că accesul este limitat la organizații selectate, între care sunt menționate: Apple Microsoft Google Amazon Pentru Apple, utilizarea ar viza întărirea securității iOS, macOS și a browserului Safari, prin identificarea mai rapidă a vulnerabilităților și corectarea lor înainte de a fi exploatate. De ce contează: AI-ul ca accelerator, dar și ca risc Anthropic argumentează că AI-ul aplicat în programare poate depăși, în anumite scenarii, chiar și specialiștii foarte experimentați în securitate. În același timp, compania avertizează că astfel de capabilități pot fi folosite și în scopuri malițioase, motiv pentru care Glasswing este prezentat ca un cadru de utilizare „defensivă”. Modelul economic: credite inițiale, apoi plată Anthropic anunță că va oferi până la 100 de milioane de dolari (aprox. 460 milioane lei) sub formă de credite pentru utilizarea inițială a modelului, urmând ca partenerii să plătească ulterior pentru acces. Ce nu este precizat în material: condițiile comerciale exacte după perioada de credite și cum va fi măsurată, contractual, eficiența modelului în reducerea riscului de securitate. [...]

Apple își expune la CHI 2026 cercetarea din spatele AirPods Pro 3, un semnal că funcțiile bazate pe inteligență artificială devin tot mai mult un diferențiator de produs . Potrivit neowin.net , compania va prezenta la conferința CHI 2026 (una dintre cele mai importante întâlniri din zona interacțiunii om–calculator) lucrări de cercetare legate de AirPods Pro 3, alături de alte proiecte din aria AI. Miza, dincolo de componenta academică, este una operațională și de produs: Apple indică faptul că își fundamentează noile funcții (inclusiv cele din audio) pe cercetare publicabilă, ceea ce poate accelera adoptarea unor tehnologii în ecosistemul său și poate influența ritmul în care astfel de capabilități ajung în produse comerciale. Ce va prezenta Apple și unde se încadrează AirPods Pro 3 Conform materialului, Apple va folosi CHI 2026 ca platformă pentru a „prezenta cercetările” din spatele AirPods Pro 3 și pentru a expune „alte lucrări AI”. Sursa nu detaliază în fragmentul disponibil titlurile lucrărilor, autorii sau rezultatele tehnice, astfel că nu este posibil de stabilit din acest text ce funcții concrete sau ce metodologii sunt vizate. De ce contează pentru piață Prezența la CHI 2026 sugerează o direcție: competiția pe dispozitive personale (precum căștile) se mută tot mai mult spre algoritmi și modele de învățare automată, nu doar spre hardware. Pentru utilizatori și pentru industrie, asta poate însemna: mai multă diferențiere prin software (funcții care se îmbunătățesc în timp); presiune crescută pe integrarea AI „pe dispozitiv” (procesare locală), acolo unde este posibil; un ciclu mai rapid de transfer din cercetare în produse, dacă rezultatele sunt suficient de mature. Ce urmează Următorul reper este conferința CHI 2026, unde Apple ar urma să își prezinte lucrările. Până atunci, din informațiile furnizate de sursă nu reiese un calendar de lansare pentru AirPods Pro 3 și nici ce elemente din cercetare vor ajunge efectiv în produs. [...]

OpenAI introduce un nou prag de preț la ChatGPT, cu un abonament Pro de 100 dolari/lună (aprox. 460 lei), mizând pe utilizarea intensivă a instrumentului de programare Codex și pe o poziționare directă împotriva ofertei similare a rivalului Anthropic, potrivit Vietnam.vn . Noul plan vine să umple un gol între Plus (20 dolari/lună) și pachetul Pro de top, de 200 dolari/lună, pe care compania spune că îl menține disponibil, chiar dacă nu mai apare pe pagina principală. Unghiul economic este relevant pentru piața de abonamente AI: OpenAI își segmentează mai fin clienții care folosesc ChatGPT în muncă, în special dezvoltatorii, și încearcă să capteze bugete recurente la un nivel unde concurența are deja un reper de preț. Compania afirmă că planul de 100 dolari este construit în jurul Codex (instrument de programare integrat în ChatGPT), oferind de cinci ori mai multă utilizare decât planul Plus. Ce primește utilizatorul și de ce contează pentru costuri Noul Pro de 100 dolari/lună este prezentat ca o opțiune pentru „sesiuni de lucru intense”, unde limitările de utilizare (așa-numitele limite de viteză) devin problema principală. Un reprezentant OpenAI susține că, raportat la Claude Code (oferta Anthropic), Codex ar oferi „mai multe capacități de programare per dolar” în abonamentele plătite. „Noul abonament Pro de 100 USD este conceput pentru a oferi dezvoltatorilor capacități de programare mai practice pentru banii cheltuiți, în special în sesiunile de lucru intense, unde limitările sunt cea mai importantă problemă.” Limite, „nelimitat” și perioada promoțională OpenAI aplică o limită Codex mai mare pentru planul de 100 dolari până la 31 mai, dar avertismentul implicit este că utilizarea „nelimitată” fără notificări privind limitarea ar putea să nu fie permanentă. Publicația notează că, în practică, niciun plan OpenAI nu oferă utilizare complet nelimitată. Pentru utilizatorii cu cerințe foarte mari, pachetul de 200 dolari/lună (aprox. 920 lei) rămâne opțiunea de vârf, cu limite de 20 de ori mai mari decât Plus, conform informațiilor din articol. Context: creșterea Codex și presiunea concurențială Lansarea are loc pe fondul creșterii accelerate a Codex: OpenAI spune că peste 3 milioane de persoane folosesc instrumentul săptămânal la nivel global, de cinci ori mai mult decât în urmă cu trei luni, iar utilizarea ar crește cu peste 70% lunar. În acest context, diferențele de limite de viteză între planuri sunt prezentate ca factorul decisiv în alegerea abonamentului, mai ales pentru cei care folosesc ChatGPT ca unealtă de lucru, nu ocazional. Ce urmează: pentru utilizatorii care vor să testeze noul prag de 100 dolari, fereastra până la 31 mai este importantă, deoarece condițiile de utilizare (în special limitele) pot fi ajustate ulterior. [...]

xAI a suspendat pe termen nelimitat uzina de reciclare a apei pentru răcirea supercomputerului Colossus , ceea ce redeschide riscul ca proiectul din Memphis (Tennessee) să ajungă să folosească apă potabilă din acviferul local, cu potențial impact asupra alimentării comunităților, potrivit Antena 3 . Decizia de oprire a construcției instalației de reciclare a fost relatată de Fox 13, care citează un inginer xAI vorbind pentru The Daily Memphian despre un proiect „suspendat pe termen nelimitat”. Inițial, xAI promisese că va folosi o uzină proprie de reciclare a apelor uzate pentru răcirea supercomputerului, astfel încât să nu mai fie nevoie de extragerea de apă proaspătă din acviferul din Memphis, potrivit publicației The Cool Down. Ce se schimbă operațional: de la apă reciclată la apă potabilă Miza este sursa de apă folosită la răcirea infrastructurii de calcul (centre de date și supercomputere au nevoie de răcire constantă, iar apa este una dintre soluțiile utilizate). The Daily Memphian a relatat că, fără finalizarea uzinei, xAI, împreună cu furnizorul local de energie, ar putea extrage „miliarde de galoane” de apă potabilă din acvifer, ceea ce ar putea afecta alimentarea cu apă a comunităților locale. În material nu este precizat volumul efectiv care ar urma să fie consumat, nici un calendar de reluare a proiectului de reciclare. Reacția companiei și presiunea publică xAI a transmis, într-un comunicat citat de Fox 13, că rămâne „dedicată” construirii unei uzine de reciclare a apei „de ultimă generație” în Memphis și că aceasta ar urma să „protejeze miliarde de galoane de apă în fiecare an”, însă a adăugat că echipa prioritizează „alte proiecte mai urgente la fața locului”. Totodată, îngrijorările locale au atras atenția oficialilor asupra tehnologiei și construcțiilor asociate supercomputerului, descrise ca fiind consumatoare de resurse semnificative. Antena 3 notează și un context mai larg: opoziția comunităților față de centrele de date este în creștere, pe fondul vizibilității tot mai mari a consumului de apă necesar pentru răcire, iar preocupări similare au fost exprimate inclusiv de investitori în companii precum Google, Amazon și Microsoft. Platforma More Perfect Union a reacționat pe X, semnalând opoziția localnicilor și reluând ideea că uzina ar fi trebuit să permită folosirea apei reciclate în locul apei potabile din acviferul regiunii. [...]

Apple își pregătește propriul cip pentru servere AI, o mișcare care ar putea reduce dependența de NVIDIA , potrivit Gizmochina . Proiectul, cu numele intern „Baltra”, ar urma să fie folosit în infrastructura de cloud a companiei pentru procesare de date și sarcini AI „din spate” (backend), semnalând o extindere dincolo de hardware-ul de consum către calcul AI la scară mare. Cipul ar urma să fie fabricat de TSMC pe procesul său de 3 nanometri, generația a doua (N3E), care vizează performanță și eficiență mai bune față de nodurile anterioare. În paralel, Apple ar investi în tehnologia avansată de ambalare SoIC (System on Integrated Chips) a TSMC, care permite „stivuirea” verticală a mai multor componente pentru viteză mai mare și consum mai mic. Ce știe piața despre „Baltra” și cum ar fi construit Informațiile din articol indică faptul că Baltra ar putea folosi o arhitectură „chiplet” (mai multe cipuri specializate într-un singur pachet), abordare care ajută la scalare și la optimizarea sarcinilor AI. Publicația mai notează că Apple ar lucra și cu parteneri pentru tehnologii de interconectare, în timp ce încearcă treptat să aducă mai multe capabilități de proiectare „în casă”. De ce contează: controlul „stivei” AI și capacitatea la TSMC Dincolo de detaliile tehnice, miza este una operațională: Apple ar urmări să controleze cât mai mult din „stiva” AI – de la siliciu și ambalare până la infrastructura de cloud – și să reducă dependența de furnizori externi de cipuri, inclusiv NVIDIA, în zona de accelerare AI. În acest context, Gizmochina scrie că Apple ar fi rezervat capacitate de producție semnificativă la TSMC pentru anii următori, iar o parte importantă ar urma să fie alocată cipurilor de server AI precum Baltra, ceea ce ar indica o investiție pe termen lung. Articolul nu oferă însă un calendar de lansare sau volume de producție, astfel că amploarea exactă a proiectului rămâne, deocamdată, neclară. [...]