Știri
Știri din categoria Inteligență artificială

Anthropic analizează adăugarea unei a patra surse de putere de calcul pentru AI, prin integrarea unor cipuri de inferență de la startup-ul britanic Fractile, într-o mișcare care ar putea reduce dependența de platformele dominante și ar diversifica opțiunile de infrastructură până în 2027, potrivit IT之家.
Informația este atribuită de publicație unui material The Information și indică faptul că discuțiile sunt încă într-un stadiu incipient. Planul vizat ar fi ca Fractile să devină „a patra” categorie de resurse de calcul pentru Anthropic, pe lângă NVIDIA GPU, Amazon Trainium și Google TPU, cu un obiectiv de implementare în 2027.
Pentru companiile care dezvoltă modele de inteligență artificială, accesul la capacitate de inferență (rularea efectivă a modelelor în producție) este un factor operațional și de cost major. Dacă Anthropic reușește să introducă o alternativă viabilă la GPU-urile NVIDIA și la cipurile proprietare ale marilor furnizori cloud, ar putea obține mai multă flexibilitate în aprovizionare și în negocierea costurilor de calcul.
IT之家 notează că Fractile folosește o arhitectură diferită de acceleratoarele AI uzuale (XPU), bazată pe „calcul analogic în memorie” (o abordare în care anumite operații sunt realizate direct în memorie, pentru a reduce transferurile de date). Compania susține că, la rularea „modelelor de top”, ar putea obține:
Aceste performanțe sunt prezentate ca afirmații ale companiei, fără detalii suplimentare în material privind metodologia sau condițiile de testare.
Fractile este descrisă ca un startup britanic de cipuri, iar IT之家 menționează că a primit anterior o investiție de la Pat Gelsinger, fost director general al Intel.
În acest moment, singura certitudine din informațiile disponibile este intenția exploratorie: negocierile sunt „la început”, iar ținta de implementare este 2027, ceea ce lasă loc pentru schimbări de plan, întârzieri sau renunțarea la proiect.
Recomandate

Google își folosește bilanțul pentru a atrage clienți de centre de date către propriile cipuri TPU, replicând mecanismele de finanțare care au alimentat ascensiunea Nvidia , potrivit The Next Web . Miza nu este doar tehnologică, ci financiară: garanții și structuri de tip „finanțare circulară” pot muta cererea de la GPU-urile Nvidia către alternative, dar cresc și dependența industriei de datorie pentru extinderea infrastructurii AI. Garanții de miliarde pentru a împinge TPU-urile în centrele de date Un exemplu central este un cluster de centre de date pentru AI din vestul statului New York, cunoscut ca Lake Mariner . Acolo, Google ar fi oferit o garanție financiară de 3,2 miliarde de dolari (aprox. 14,7 miliarde lei), conform unei investigații The Wall Street Journal citate de publicație. Dezvoltatorii sitului, TeraWulf și furnizorul de cloud FluidStack (susținut de Google), ar urma să închirieze putere de calcul de la mii de unități TPU ale Google către Anthropic . Efectul economic al garanției este reducerea costului finanțării: centrul de date poate atrage datorie mai ieftină, un mecanism pe care Nvidia l-ar fi folosit în mod repetat pentru a stimula cererea pentru propriile cipuri. „Finanțarea circulară”: banii se întorc sub formă de comenzi de cipuri A doua tactică descrisă este „finanțarea circulară”, un aranjament în care o parte din banii investiți de producătorul de cipuri se întorc la acesta sub formă de achiziții ale propriilor produse. În aceeași logică, Google ar susține mai multe proiecte legate de Anthropic, inclusiv: un centru de date de 7 miliarde de dolari (aprox. 32,2 miliarde lei) numit River Bend, lângă Baton Rouge; încă 1,4 miliarde de dolari (aprox. 6,4 miliarde lei) în garanții pentru un contract de închiriere de capacitate de calcul în Colorado City, Texas. Aceste inițiative se suprapun peste un acord amplu de capacitate de calcul între Google și Broadcom (menționat de publicație) și peste un aranjament de credit privat de circa 35 miliarde de dolari (aprox. 161 miliarde lei), intermediat de Apollo și Blackstone, care cumpără TPU-uri Google și le închiriază către Anthropic. De ce contează: presiune reală pe „șanțul” Nvidia, dar și risc mai mare pe datorie Google nu mai păstrează TPU-urile doar pentru uz intern. Publicația notează că, în mai, compania a spus că va începe să vândă TPU-uri direct clienților și a prezentat primul cip construit special pentru „inferință” (rularea interogărilor AI, nu antrenarea modelelor). Totodată, Google a anunțat un acord de 5 miliarde de dolari (aprox. 23 miliarde lei) cu Blackstone pentru lansarea unei companii de cloud care vizează furnizori susținuți de Nvidia, precum CoreWeave și Nebius, și a indicat luna aceasta că ar urma să strângă 85 miliarde de dolari (aprox. 391 miliarde lei) capital propriu, în mare parte pentru infrastructură AI. Pe partea operațională, argumentul de cost începe să apară: Citadel Securities, un utilizator timpuriu, spune că rulează unele sarcini cu costuri cu 30% mai mici și cu viteze de până la patru ori mai mari pe TPU-uri. Nvidia, care deține „peste 90%” din piața cipurilor pentru AI, își apără poziția prin ecosistemul software CUDA și hardware-ul ușor de integrat. Jensen Huang a minimalizat amenințarea, susținând că Anthropic ar fi singurul client extern important pentru TPU-uri și provocând Google să demonstreze că cipurile sunt mai ieftine. Pentru piață, testul real este dacă Google poate transforma avantajul de bilanț într-o schimbare de comportament la nivelul centrelor de date. Dacă modelul prinde, competiția pe cipuri AI se mută parțial din laborator în zona de finanțare — cu un efect secundar: extinderea AI devine și mai dependentă de structuri alimentate de datorie și de mecanisme „circulare”, care pot amplifica riscul în cazul unei încetiniri a cererii. [...]

Amazon își bazează recuperarea în AI pe cipuri proprii și pe „pariul” Anthropic, mizând pe venituri din cloud indiferent de câștigător , potrivit The Next Web . Șeful diviziei de AI a companiei, Peter DeSantis , a recunoscut că modelele Amazon „nu au fost chiar în avangardă” pentru cele mai mari și mai solicitante sarcini și spune că speră ca Amazon să fie „în discuția” despre modelele de top „în anul care vine”. Declarația, făcută pentru CNBC (link în sursă), este relevantă pentru piață nu doar ca poziționare tehnologică, ci ca semnal despre cum încearcă Amazon să transforme decalajul față de OpenAI și Anthropic într-un avantaj economic: să monetizeze infrastructura (AWS) și cipurile proprii, chiar și atunci când clienții aleg modele concurente. Strategia „dublă”: marketplace de modele și propriile modele Amazon rulează în paralel două direcții. Pe de o parte, Bedrock – „piața” de modele din AWS – permite clienților să acceseze, printr-un singur serviciu, modele de la OpenAI, Anthropic, Meta și Mistral. În această configurație, Amazon poate genera venituri indiferent ce model devine dominant, pentru că încasează din consumul de cloud. Pe de altă parte, compania își dezvoltă propriile modele. The Next Web notează că Nova2, modelul intern lansat în decembrie, a atras aproximativ 50.000 de clienți, dar nu a egalat capabilitățile Claude (Anthropic) sau GPT-5.5 (OpenAI) pentru cele mai solicitante utilizări din mediul enterprise și cercetare – context care explică „franchețea” lui DeSantis. „Plasa” pentru investitori: expunere la Anthropic și venituri AWS În paralel cu dezvoltarea internă, Amazon și-a consolidat expunerea la Anthropic: a angajat investiții de până la 33 miliarde dolari (aprox. 152 mld. lei), inclusiv un acord de 25 miliarde dolari (aprox. 115 mld. lei) semnat în aprilie, care oferă Anthropic acces la până la cinci gigawați de capacitate de calcul pe cipurile Trainium ale Amazon. În schimb, Anthropic s-a angajat să cheltuiască peste 100 miliarde dolari (aprox. 460 mld. lei) pe AWS în următorul deceniu. Structura arată de ce Amazon poate câștiga financiar chiar dacă modelele sale rămân în urma liderilor: profită atât din participația în Anthropic, cât și din veniturile de cloud generate de consumul Anthropic. Publicația mai arată că rezultatele Amazon din T1 2026 au fost umflate de un câștig de 16,8 miliarde dolari (aprox. 77 mld. lei) legat de Anthropic, în timp ce fluxul de numerar liber a scăzut cu 95%. Planul de recuperare: Trainium, date proprii și scală de inginerie Pentru a reduce decalajul, DeSantis indică trei pârghii: cipuri AI proprii, date de antrenare proprietare (din operațiunile de retail și logistică) și capacitatea de execuție a unei echipe care acoperă modele de frontieră, proiectare de siliciu și cercetare în zona cuantică. The Next Web notează că cipurile Trainium alimentează deja majoritatea sarcinilor de inferență (rulare a modelelor) din Bedrock, iar Trainium3 – așteptat mai târziu în acest an – ar urma să aducă o performanță de patru ori mai mare decât generația anterioară. Rămâne însă o întrebare deschisă, în absența unor repere măsurabile: dacă cipurile proprii și datele interne pot compensa avansul de mai mulți ani al laboratoarelor care au investit miliarde în antrenarea modelelor de frontieră. DeSantis a indicat un orizont de „anul care vine”, dar fără benchmark-uri (teste standardizate) care să permită evaluarea progresului. [...]

Indisponibilitatea chatbotului Claude a creat întreruperi operaționale pentru utilizatori și echipe care îl folosesc în fluxuri de lucru , iar situația a fost urmărită în timp real de CNET , într-un material de tip „live” despre starea serviciului. Din informațiile disponibile în pagina CNET, subiectul este o posibilă cădere (outage) a lui Claude, asistentul de inteligență artificială dezvoltat de Anthropic , și actualizările privind disponibilitatea acestuia. Textul extras din sursă nu include însă detalii concrete despre cauză, durată, amploare sau momentul exact al incidentului, ci mai ales elemente de navigație și conținut general al site-ului. De ce contează pentru companii și utilizatori O întrerupere a unui chatbot folosit la scară largă are impact direct în zona operațională: întârzieri în activități care depind de generare de text, analiză, suport intern sau automatizări. Pentru organizațiile care au integrat astfel de instrumente în procese, chiar și o indisponibilitate temporară poate însemna blocaje și costuri indirecte (timp pierdut, replanificare, trecerea pe soluții alternative). Ce se știe și ce nu se știe din sursa disponibilă Pe baza conținutului furnizat din pagina CNET: Se știe : subiectul este verificarea statusului „Claude este indisponibil?” și „cele mai recente informații”. Nu se știe (din textul extras) : confirmarea oficială a incidentului, intervalul orar, regiunile afectate, numărul utilizatorilor impactați, cauza tehnică sau estimarea de remediere. În lipsa acestor detalii în materialul disponibil aici, nu se poate cuantifica impactul sau stabili cu certitudine starea serviciului la un anumit moment. [...]

Decizia SUA de a restricționa accesul la cele mai avansate modele Anthropic a reaprins tema „suveranității” AI în Europa , chiar înainte de VivaTech (Paris) și de reuniunea G7 de la Evian-les-Bains, arată o analiză din The Next Web . Miza pentru companiile europene este una operațională și de risc: instrumente critice pentru dezvoltare și productivitate pot deveni indisponibile peste noapte, printr-o decizie luată la Washington. În cazul Anthropic, ordinul american de a bloca accesul „străinilor” la cele mai performante sisteme s-a lovit de o problemă practică: pe un cloud partajat, restricția nu a putut fi aplicată selectiv, iar compania a oprit modelele pentru toată lumea, la nivel global, inclusiv pentru utilizatori europeni fără legătură cu măsura. Pentru Europa, demonstrația a fost că dependența de AI american nu este doar un risc teoretic, ci unul care se poate materializa imediat. „Campionul” european și limitele unei strategii bazate pe un singur nume În acest context, Mistral este tot mai des invocată drept răspuns european, atât de guvernul francez, cât și în dezbaterea mai largă din UE. Compania din Paris a atras finanțare prin datorie pentru a cumpăra cipuri Nvidia, s-a angajat în proiecte de centre de date și s-a poziționat ca alternativă europeană. Analiza ridică însă întrebarea esențială, incomodă în culisele VivaTech: dacă o singură companie poate susține greutatea unei strategii continentale de „suveranitate” tehnologică. Dependența de cloud-ul american rămâne problema structurală Dincolo de discursuri, o parte importantă din munca europeană la vârful AI rulează în continuare pe infrastructură de cloud din SUA. Iar formulele de tip „GPU-as-a-service” (închirierea de capacitate de calcul pe cipuri grafice, folosite masiv în AI) pot întări dependența pe care, teoretic, ar trebui să o reducă: a închiria putere de calcul de la un furnizor american nu este același lucru cu a o deține, iar diferența devine evidentă când se schimbă politicile de acces. UE are în plan cinci amplasamente pentru „gigafabrici” AI și a acordat contracte pentru cloud „suveran”, dar ritmul de construcție se măsoară în ani, în timp ce riscul politic se măsoară în cicluri de știri. Între independență și negociere: „un loc mai bun la masa americană” La Evian, discuția a căpătat o notă mai pragmatică: reprezentanți din mai multe țări G7 au ridicat, în discuții cu secretarul american al Comerțului, Howard Lutnick, ideea unui aranjament de tip „parteneri de încredere”, care să permită accesul aliaților la modelele americane tot mai restricționate. Mesajul public al Europei rămâne independența; solicitarea „în privat”, în această săptămână, a fost mai degrabă pentru condiții mai bune de acces la AI-ul american. Concluzia implicită a analizei: Europa oscilează între a construi suveranitatea (prin infrastructură proprie) și a o negocia (prin acorduri), încercând să le facă pe ambele în paralel. [...]

Dataland mizează pe infrastructură de date și senzori pentru a transforma arta IA într-o experiență personalizată , într-un model care împinge muzeele spre investiții tehnologice comparabile cu cele din centrele de date, potrivit Mediafax . Noul spațiu se inaugurează sâmbătă la Los Angeles și este prezentat ca primul muzeu din lume dedicat integral operelor produse de inteligența artificială. Muzeul este amplasat în centrul orașului, în complexul Grand LA proiectat de Frank Gehry, vizavi de Sala de Concerte Walt Disney. Proiectul este semnat de artistul turco-american Refik Anadol și partenerul său Efsun Erkiliç, care susțin ideea că „mașinile pot fi aliați, mai degrabă decât amenințări”. Anadol a declarat pentru Los Angeles Times, potrivit Le Figaro: „Sistemul este opera de artă.” O „vizită” construită din date biometrice și senzori Dataland îmbină imaginea, sunetul și parfumul, iar experiența este ajustată în funcție de datele colectate de la vizitatori. La intrare, fiecare primește un dispozitiv purtat la încheietura mâinii, similar unui ceas inteligent, care măsoară ritmul cardiac, emoțiile și temperatura; aceste informații influențează elementele vizuale, care variază în funcție de public, conform Forbes. În paralel, senzori montați pe pereți urmăresc mișcările vizitatorilor. Infrastructura tehnică descrisă în material include: o cameră principală cu 84 de proiectoare și 1,5 miliarde de pixeli; sunet redat prin aproximativ 250 de difuzoare; parfumuri realizate în colaborare cu L’Oréal Luxe; un total de zece milioane de linii de cod pentru întregul sistem. Dimensiunea proiectului: galerii, dar și spațiu dedicat serverelor Muzeul acoperă 2.300 de metri pătrați și include cinci galerii, completate de aproape 1.000 de metri pătrați de spațiu pentru servere. În articol, Dataland este descris ca punctul culminant al activității lui Anadol, care a mai realizat proiecții pe pereții Disney Hall (2018) și o instalație în holul Muzeului de Artă Modernă din New York (2022). „Large Nature Model”, antrenat pe imagini și date din natură Baza tehnologică a proiectului este un model dezvoltat de studio, numit „Large Nature Model”. Spre deosebire de sisteme precum ChatGPT, antrenate pe text, acesta ar fi fost alimentat exclusiv cu imagini și date din lumea naturală: peste 500 de milioane de imagini reprezentând 2,2 milioane de specii, furnizate de Smithsonian Institution, Muzeul de Istorie Naturală din Londra, Laboratorul de Ornitologie Cornell, iNaturalist și Getty, potrivit Los Angeles Times. Studioul afirmă că a făcut și expediții proprii în 16 păduri tropicale și că arhiva include 50 de milioane de cântece de păsări, inclusiv o înregistrare din 1987 a ultimului cântec cunoscut al unui Kauai Moho, specie dispărută. În lipsa unor informații despre buget, prețuri de bilete sau venituri estimate, impactul economic nu poate fi cuantificat din datele publicate; însă dimensiunea spațiului pentru servere și nivelul de instrumentare (senzori, proiecție, audio, date biometrice) indică o direcție operațională în care muzeul devine, practic, și o platformă tehnologică. [...]

HyperLight a atras 80 mil. dolari (aprox. 368 mil. lei) într-o rundă condusă de jucători-cheie din lanțul de producție hardware , un semnal că industria începe să parieze pe o alternativă la siliciu pentru interconectările optice necesare clusterelor uriașe de GPU-uri, potrivit The Next Web . Pe măsură ce infrastructura de inteligență artificială se extinde spre sute de mii de GPU-uri, „gâtul de sticlă” se mută de la cipuri la legăturile dintre ele: conexiunile din cupru, folosite pentru a transporta date, ajung la limite de viteză și consum energetic. În acest context, industria încearcă să mute traficul de date pe fibră/optică, adică pe lumină. Pariul HyperLight: niobat de litiu în strat subțire, nu siliciu HyperLight, companie desprinsă din Harvard și cu sediul în Cambridge (Massachusetts), dezvoltă componente pe bază de „thin-film lithium niobate” (TFLN) – niobat de litiu în strat subțire –, un material folosit pentru a converti semnale electrice în semnale optice la viteză mare, cu consum redus și pierderi mici, conform aceleiași surse. Majoritatea competitorilor construiesc optica pe siliciu („silicon photonics”). HyperLight susține că TFLN poate performa mai bine, mai ales pe măsură ce cresc vitezele de interconectare. Compania spune că platforma sa „Chiplet” ar acoperi, într-un design fabricabil, atât legături scurte din centrele de date, cât și conexiuni mai lungi, de tip telecom. În stadiul actual, HyperLight afirmă că: produse la 200G per bandă sunt deja livrate; componente la 400G per bandă sunt în faza de testare la clienți („sampling”). De ce contează: finanțarea vine de la cei care pot fabrica și cumpăra tehnologia Miza rundei nu este doar suma, ci componența investitorilor. Finanțarea a fost condusă de MediaTek , iar printre investitori se află Foxconn și Jabil (producție/assemblare), UMC (turnătorie/„foundry”), EDBI (Singapore), CDIB-TEN Capital (Taiwan) și Qatar Investment Authority. Publicația interpretează această structură ca pe un indiciu de „aliniere de ecosistem”: adică firmele care ar putea produce la scară și integra tehnologia în lanțurile lor de aprovizionare au un interes direct în reușita ei. CEO-ul Mian Zhang este citat astfel: „Această finanțare este despre mai mult decât capital. Este despre alinierea ecosistemului.” Ce urmează și care este limita informațiilor Potrivit articolului, banii vor merge către capacitate de producție , calificarea la clienți (procesul prin care un furnizor este validat pentru utilizare în produse/instalații) și relații mai strânse cu partenerii de tip foundry . În același timp, The Next Web notează explicit o rezervă: afirmațiile tehnice sunt ale companiei , iar o parte dintre investitori ar beneficia direct dacă TFLN devine materialul dominant pentru interconectările optice din infrastructura AI. În final, adoptarea la scară va depinde de piață și de capacitatea de a produce în volum, nu de anunțul de finanțare. [...]