Știri
Știri din categoria Inteligență artificială

Google își accelerează strategia de a reduce dependența de Nvidia prin discuții cu Marvell Technology pentru dezvoltarea a două cipuri dedicate inteligenței artificiale, într-un demers care ar putea influența costurile și capacitatea de livrare a Google Cloud, potrivit ITmedia.
Informația, atribuită de ITmedia publicației The Information, indică negocieri între Google (parte a Alphabet) și Marvell pentru a crea două componente noi menite să ruleze mai eficient modele de inteligență artificială. Miza este dublă: performanță mai bună pentru sarcini AI și o alternativă mai credibilă la plăcile grafice (GPU) Nvidia, care domină infrastructura de antrenare și inferență pentru AI.
Potrivit materialului, proiectul ar include:
ITmedia notează că Google lucrează de mai mult timp la poziționarea TPU ca alternativă viabilă la GPU-urile Nvidia folosite pe scară largă în industrie.
Articolul leagă direct această inițiativă de presiunea asupra Google de a demonstra investitorilor că investițiile în AI se transformă în rezultate comerciale. În acest context, vânzările de TPU sunt prezentate ca un factor important pentru creșterea veniturilor din Google Cloud.
Cu alte cuvinte, dacă Google reușește să-și întărească oferta de cipuri proprii (și ecosistemul din jurul lor), poate câștiga atât la nivel de costuri și disponibilitate a infrastructurii, cât și la nivel de diferențiere față de competitori care depind mai mult de Nvidia.
Conform informațiilor citate, cele două companii ar urmări ca proiectarea unității de procesare a memoriei să fie finalizată cel mai devreme anul viitor, după care ar urma livrarea pentru producție de test.
Materialul nu oferă detalii despre termeni comerciali, volume sau despre momentul în care noul TPU ar putea intra în producție.
Recomandate

Google își mobilizează conducerea și resursele interne pentru a recupera decalajul față de Anthropic la „agenți” de programare , potrivit TechRadar , care relatează despre un memo intern atribuit cofondatorului Sergey Brin și despre formarea unui „strike team” dedicat îmbunătățirii capabilităților Gemini în „agentic execution” (execuție autonomă de sarcini, în special scriere și finalizare de cod). Miza este una operațională: dacă Gemini rămâne în urmă la agenți care pot produce „cod final”, Google riscă să piardă viteză în dezvoltarea internă de software și, pe termen mai lung, în cursa pentru automatizarea muncii de cercetare în AI. „Strike team” pentru agenți de cod: presiune pe Gemini Conform unui reportaj The Information, citat de TechRadar, Google ar fi creat o echipă specială („strike team”) pentru a contracara progresul Anthropic și al agentului său Claude Code . În memo-ul menționat, Brin le-ar fi transmis inginerilor și cercetătorilor AI că Google trebuie să reducă rapid diferența: „Pentru a câștiga sprintul final, trebuie să reducem urgent decalajul în execuția agentică și să transformăm modelele noastre în dezvoltatori principali” ai codului final. Aceeași relatare susține că Sergey Brin și Koray Kavukcuoglu, director tehnologic la Google DeepMind, ar fi implicați direct în acest efort, semnalând importanța proiectului la nivelul conducerii. De ce e posibil să nu ajungă la public Direcția pare să fie, în primul rând, îmbunătățirea capacității Gemini de a lucra cu codul intern al Google. Asta ar crește performanța instrumentelor folosite de inginerii și cercetătorii companiei, însă ar reduce șansele ca rezultatul să fie lansat rapid ca produs public: dacă un agent este antrenat pe cod proprietar, publicarea lui devine dificilă. TechRadar notează totuși că instrumentele interne îmbunătățite „ar putea teoretic” să ajute ulterior la construirea unor modele mai bune care să poată fi lansate public. Context: „AI takeoff” și automatizarea cercetării Dincolo de competiția directă cu Anthropic, The Information (citat de TechRadar) indică un obiectiv mai ambițios: „AI takeoff”, adică sisteme AI capabile să se îmbunătățească. În această logică, un agent avansat de programare, combinat cu AI care rezolvă probleme de matematică și rulează experimente, ar putea automatiza la scară mare munca cercetătorilor și inginerilor AI. În acest moment, rămâne neclar dacă rezultatele „strike team”-ului vor fi vizibile în produse pentru utilizatorii externi sau vor rămâne, cel puțin inițial, un avantaj strict intern. [...]

Google aduce „ Continued Conversation ” în Gemini pentru Home, o schimbare care reduce fricțiunea în utilizarea zilnică a asistentului vocal și poate crește frecvența comenzilor în casă prin interacțiuni mai naturale, potrivit Google Blog . Funcția pornește de la un comportament simplu: după prima comandă „Hey Google”, Gemini răspunde și păstrează microfonul activ pentru câteva secunde (semnalizat prin luminile pulsatorii ale dispozitivului), astfel încât utilizatorul să poată continua imediat conversația fără a repeta formula de activare. Ce se schimbă operațional: patru îmbunătățiri față de abordarea anterioară Google spune că versiunea actualizată a „Continued Conversation” include patru îmbunătățiri majore, cu impact direct în utilizarea de zi cu zi: Context conversațional: Gemini „ține minte” firul discuției pentru întrebări de tip follow-up, spre deosebire de Google Assistant, unde utilizatorii ajung mai des să repete informații. Suport multilingv: funcția este disponibilă „global” în toate limbile și regiunile acceptate, nu doar în engleza din SUA. Detecție mai bună a „vorbitului pe lângă” (side-talk): sistemul ar distinge mai bine între comenzi și conversațiile din casă, pentru a reduce răspunsurile accidentale. Acces la nivel de locuință: odată activată, funcția se aplică tuturor celor din casă, inclusiv oaspeților. Cum se activează Pentru activare, utilizatorii trebuie să deschidă aplicația Google Home și să urmeze traseul: Home Settings > Gemini for Home voice assistant > Continued Conversation . Google menționează că detalii suplimentare despre această funcție și alte actualizări Gemini sunt disponibile pe pagina de comunitate Google Home, fără a oferi în material un calendar suplimentar sau limitări tehnice detaliate. [...]

Google își diversifică agresiv lanțul de aprovizionare pentru cipuri AI, mizând pe patru parteneri ca să reducă dependența de Nvidia în inferență , potrivit The Next Web . Strategia combină mai mulți furnizori de proiectare, o relație unică de fabricație cu TSMC și o foaie de parcurs care merge de la TPU-ul „Ironwood” (deja livrat) până la procesoare pe 2 nanometri așteptate în 2027. Miza este economică și operațională: inferența (rularea modelelor pentru utilizatori) devine costul dominant în AI, iar Google încearcă să obțină un cost mai mic „pe interogare” prin cipuri dedicate, în locul GPU-urilor generaliste. Ce face Google diferit: patru parteneri, roluri separate Programul de cipuri al Google este construit în jurul a patru parteneri de proiectare, cu responsabilități împărțite pe segmente: Broadcom : gestionează variantele de înaltă performanță și proiectează TPU v8 pentru antrenare („Sunfish”), țintind procesul TSMC pe 2 nm pentru finalul lui 2027 . Google și Broadcom au semnat pe 6 aprilie un acord pe termen lung pentru livrări până în 2031 (TPU-uri și componente de rețea). MediaTek : proiectează varianta optimizată pe cost pentru inferență a TPU v8 („Zebrafish”), tot pentru TSMC 2 nm în finalul lui 2027 . Implicarea MediaTek a început cu module I/O și componente periferice la Ironwood, unde designurile sale ar fi cu 20–30% mai ieftine decât alternativele. Marvell : este în discuții cu Google pentru o unitate de procesare a memoriei și un nou TPU orientat pe inferență; dacă se semnează contractul, ar deveni un al treilea partener de design pe această zonă. Google ar intenționa să producă aproape două milioane de astfel de unități, cu finalizarea designului așteptată anul viitor. Intel : are un acord multianual (din 9 aprilie) pentru procesoare Xeon și unități personalizate de procesare pentru infrastructura centrelor de date AI ale Google, acoperind straturile de rețea și calcul general care „înconjoară” TPU-urile, nu acceleratoarele AI propriu-zise. Indiferent de partenerul de proiectare, TSMC fabrică toate cipurile personalizate ale Google , ceea ce face relația cu producătorul taiwanez un element structural al strategiei. Ironwood, „capul de pod” în inferență Piesa centrală „de azi” este Ironwood , a șaptea generație TPU și primul cip Google proiectat explicit pentru inferență. Conform articolului, Ironwood oferă: de 10 ori performanța de vârf a TPU v5p; 192 GB memorie HBM3E per cip și 7,2 TB/s lățime de bandă; scalare până la 9.216 cipuri răcite cu lichid într-un „superpod”, cu 42,5 exaflopși FP8 . Ironwood este deja disponibil pentru clienții Google Cloud, iar Google intenționează să producă milioane de unități în acest an. Anthropic s-a angajat la până la un milion de TPU-uri , iar Meta are un aranjament de închiriere, potrivit sursei. De ce contează: inferența schimbă economia AI Rațiunea strategică invocată este că antrenarea unui model de vârf este un eveniment intens, dar relativ „punctual”, în timp ce inferența este continuă și crește cu fiecare utilizator și produs care integrează AI. La scara Google (căutări augmentate cu AI, conversații Gemini, apeluri API), costul per inferență devine determinant pentru profitabilitatea întregului business AI. În acest context, Google încearcă să atace punctul forte al Nvidia nu printr-un „cip unic” superior, ci printr-un sistem de cipuri specializate pe sarcini și costuri, care să reducă treptat ponderea hardware-ului Nvidia în infrastructura proprie. Cifrele și ce urmează la Cloud Next Articolul menționează proiecții de livrări totale TPU de 4,3 milioane de unități în 2026 , cu o creștere la peste 35 de milioane până în 2028 . Totodată, TrendForce ar estima că vânzările de cipuri personalizate (ASIC – circuite integrate proiectate pentru o sarcină specifică) vor crește cu 45% în 2026 , față de 16% pentru livrările de GPU-uri, iar piața ar putea ajunge la 118 miliarde dolari (aprox. 531 miliarde lei ) până în 2033. Google Cloud Next începe miercuri, la Las Vegas, cu keynote-uri susținute de Sundar Pichai și Thomas Kurian. Evenimentul este așteptat să detalieze arhitectura următoarei generații de TPU și legătura dintre Ironwood și generația v8. În paralel, Nvidia ar încerca să rămână relevantă și în ecosistemul de cipuri personalizate, inclusiv prin investiția de 2 miliarde dolari (aprox. 9 miliarde lei ) în Marvell și prin programul NVLink Fusion, conform sursei. [...]

Posibila numire a lui John Ternus la conducerea Apple ar muta accentul strategiei AI spre dispozitive , nu doar spre modele și servicii, iar asta poate conta direct în competiția cu rivalii care împing masiv „AI în cloud”, potrivit unei analize publicate de CNET . Textul pornește de la ideea că un CEO cu profil puternic de „hardware” (adică orientat spre proiectarea și integrarea componentelor și a produsului final) ar putea fi un avantaj pentru planurile Apple în inteligență artificială, tocmai pentru că diferențiatorul companiei a fost istoric combinația strânsă dintre dispozitive, software și servicii. De ce contează pentru AI: controlul asupra „cutiei” în care rulează tehnologia În logica CNET, AI-ul Apple are mai multe șanse să se distingă dacă este împachetat în produse și funcții care rulează eficient pe dispozitivele companiei, unde Apple controlează atât arhitectura hardware, cât și sistemele de operare. Un lider format în zona de hardware ar înclina natural spre această abordare: optimizare la nivel de dispozitiv, integrare și livrare de funcții AI ca parte din experiența produsului. Această direcție ar putea susține o strategie în care AI-ul nu este perceput ca un „add-on” (o funcție adăugată ulterior), ci ca o componentă proiectată împreună cu produsul. Limitările informației din sursă Materialul CNET este un comentariu/analiză și nu oferă, în fragmentul disponibil, detalii operaționale verificabile despre un plan concret de implementare, termene sau investiții. De asemenea, nu sunt prezentate cifre sau indicatori financiari care să permită o evaluare a impactului economic pe termen scurt. În consecință, concluzia rămâne una de interpretare editorială: un CEO „de hardware” ar putea fi potrivit pentru o strategie AI centrată pe dispozitive, însă direcția efectivă depinde de deciziile companiei și de execuție. [...]

Băncile europene ar putea primi în zilele următoare acces la modelul IA „Mythos”, dar implementarea vine cu riscuri de securitate cibernetică și cu presiune din partea autorităților de reglementare pentru controale mai stricte, potrivit Agerpres , care citează informații Reuters. Extinderea accesului la „Mythos”, modelul de inteligență artificială al start-up-ului american Anthropic , ar urma să vizeze bănci din Europa și Marea Britanie, într-un moment în care instituțiile financiare încearcă să țină pasul cu rivalii din SUA, care au primit deja acces inițial la tehnologie. Ce se știe despre calendar și condițiile de acces Surse apropiate dosarului au indicat că accesul pentru băncile europene ar putea fi acordat „în câteva zile”, însă o altă estimare menționează că implementarea ar putea dura „zile sau săptămâni”. Procesul include verificări pentru a se asigura că modelul este implementat în siguranță, potrivit uneia dintre surse. Bloomberg a relatat anterior că Anthropic va oferi în curând acces la „Mythos” pentru instituții financiare din Marea Britanie. De ce contează: avertismente pe zona de securitate și atenție sporită a regulatorilor Experți în securitate cibernetică avertizează că „Mythos” ridică provocări importante pentru industria bancară și pentru sistemele tehnologice existente, context în care au apărut avertismente din partea organismelor de reglementare și a decidenților prezenți la reuniunea de primăvară a Fondului Monetar Internațional. Pe fondul acestor preocupări, autoritățile de reglementare se grăbesc să evalueze riscurile de securitate cibernetică asociate noului model de inteligență artificială, în timp ce băncile încearcă să recupereze decalajul față de instituțiile care au intrat mai devreme în testare. Cine are deja acces și cum s-a făcut selecția Anthropic a oferit inițial acces la „Mythos” partenerilor din inițiativa „Project Glasswing” și altor aproximativ 40 de organizații care dezvoltă sau întrețin infrastructură software critică. Dintre bănci, JPMorgan Chase (parte din inițiativa Glasswing) este singura instituție despre care Anthropic a spus public că are acces la „Mythos”. În același timp, Bank of America a fost în Glasswing încă de la început și a testat intern tehnologia, potrivit unei surse citate. Presiune pentru „teren de joc” egal în industrie Joachim Nagel, președintele Bundesbank (Banca Centrală a Germaniei), a cerut ca toate instituțiile să aibă acces la „Mythos” pentru a asigura condiții concurențiale echitabile și pentru a evita utilizarea abuzivă a modelului. [...]

Sam Altman acuză că Anthropic folosește „marketing bazat pe frică” pentru a justifica accesul restrâns la modelul său de securitate cibernetică Mythos , într-un nou episod al rivalității dintre cele două laboratoare, potrivit TechCrunch . Anthropic a anunțat Mythos la începutul lunii și l-a pus la dispoziția unui grup restrâns de clienți din zona enterprise. Compania susține că modelul ar fi „prea puternic” pentru a fi lansat public, invocând riscul ca infractorii cibernetici să îl transforme într-o armă. Critici ai acestei poziționări au spus că retorica este exagerată. Într-o apariție la podcastul „Core Memory”, Altman a sugerat că această abordare ar fi o modalitate de a păstra inteligența artificială în mâinile unui cerc mic și exclusiv. „Există oameni în lume care, pentru mult timp, au vrut să păstreze IA în mâinile unui grup mai mic de oameni. Poți justifica asta în multe feluri diferite.” Altman a mers mai departe cu o comparație menită să ilustreze mecanismul comercial din spatele mesajului, descriindu-l drept „marketing incredibil” să pretinzi că ai construit „o bombă” și apoi să vinzi „un adăpost anti-bombă” extrem de scump. De ce contează: controlul accesului devine argument comercial Miza nu este doar schimbul de replici dintre competitori, ci modul în care „siguranța” și riscul de abuz sunt folosite pentru a stabili cine primește acces la modele avansate și în ce condiții. În cazul Mythos, justificarea pentru distribuția limitată este tocmai potențiala utilizare malițioasă, iar Altman atacă direct această logică, sugerând că poate funcționa și ca instrument de poziționare și vânzare către clienți mari. Context: „frica” ca instrument recurent în industria IA TechCrunch notează că „marketingul bazat pe frică” nu este o invenție a Anthropic și că o parte semnificativă a industriei a folosit, în timp, tactici de alarmare și hiperbolă pentru a-și prezenta produsele ca fiind foarte puternice. Publicația amintește, totodată, că retorica despre riscuri extreme ale IA nu a venit doar de la activiști, ci și de la cei care vând această tehnologie publicului — inclusiv Altman. [...]