Știri
Știri din categoria Inteligență artificială

Perplexity extinde accesul la „Personal Computer” pe Mac, mutând execuția în cloud pentru a reduce sarcina pe dispozitiv, o schimbare care poate influența direct modul în care utilizatorii și companiile folosesc asistenți AI pe macOS, printr-un model de utilizare legat de abonamente și de limite de credit. Informația este prezentată de Engadget.
Până acum, asistentul AI „Personal Computer” era disponibil doar pentru utilizatorii planului Max de 200 de dolari pe lună, însă Perplexity spune că l-a deschis acum pentru toți utilizatorii de Mac. Accesul se face printr-o aplicație nouă pentru macOS, iar utilizarea este „legată de limitele de credit” ale planurilor Pro și Max, potrivit companiei.
Perplexity afirmă că „Personal Computer” poate executa sarcini care implică fișiere locale, alte aplicații, web-ul și propriile servere ale companiei. Pentru utilizator, asta înseamnă un asistent care nu se limitează la întrebări, ci poate interacționa cu mai multe surse și contexte de lucru.
Compania poziționează produsul pentru „interogări de zi cu zi, atașamente și dictare”, adică utilizări tipice de productivitate, nu doar căutare.
Un element distinct față de unele instrumente similare este că Perplexity spune că va face „cea mai mare parte a muncii” în cloud, nu integral local, inclusiv pentru a reduce presiunea asupra resurselor Mac-ului. Practic, performanța și capabilitățile pot depinde mai mult de infrastructura Perplexity și de conexiunea la internet decât de configurația hardware a utilizatorului.
Perplexity mai precizează că asistentul folosește mai multe modele AI în funcție de sarcină, inclusiv Gemini pentru „cercetare aprofundată”, Nano Banana pentru imagini și ChatGPT pentru „memorare pe context lung și căutare largă”.
Perplexity susține că „Personal Computer” poate rula non-stop pe un Mac mini și poate fi controlat de la distanță de pe iPhone. Compania mai afirmă că acțiunile asistentului sunt „auditabile și reversibile”, ceea ce ar reduce riscul unor erori cu impact (de exemplu, ștergerea accidentală a fișierelor), deși articolul nu oferă detalii tehnice despre cum este implementată această reversibilitate.
Recomandate

Google își reproiectează acceleratoarele TPU pentru a rula antrenarea și inferența pe același cip , iar pentru generația TPUv9 „Triggerfish” a apelat din nou la MediaTek, potrivit Wccftech . Miza este una operațională: reducerea fragmentării între cipuri dedicate (separat pentru antrenare și pentru inferență) și simplificarea modului în care sunt comutate sarcinile de lucru în aplicații de tip „agentic AI” (modele care execută pași multipli și iau decizii pe parcurs). Ce se schimbă la TPUv9 „Triggerfish” Din informațiile citate de publicație, TPUv9 „Triggerfish” ar urma să combine capabilități de antrenare și inferență într-o singură soluție, cu câteva elemente tehnice orientate direct spre utilizare în centre de date: SRAM mai mare , menționat ca fiind de 2–3 ori față de generația anterioară, pentru a susține fluxuri de lucru mai complexe. Un „CPU tile” (o componentă CPU separată în același pachet) adăugat de MediaTek, care ar avea rolul de a gestiona comutarea sarcinilor între antrenare și inferență. Integrarea CPU-ului și a „compute die”-ului (matrița principală de calcul) în același pachet , pentru a reduce penalizările de comunicare dintre componente. Calendarul estimat și volumele invocate Wccftech, citând un raport FundaAI, notează că seria TPUv9 este așteptată să intre în producție de masă în T3 2027 , cu „Humufish” primul, urmat de „Triggerfish” în T4 2027 , iar ambele ar urma să ajungă la „volume ramp” (creștere accelerată a producției) în 2028 . În același context, publicația menționează o estimare potrivit căreia livrările totale de TPU în 2027 ar putea fi de circa 10–11 milioane de unități . Este o proiecție din surse de analiză, nu o cifră confirmată oficial de Google. Implicații pentru lanțul de aprovizionare: TSMC , Intel și ambalarea avansată Materialul mai indică o posibilă împărțire a rolurilor între producție și ambalare (packaging), într-un moment în care ambalarea avansată a devenit un blocaj pentru industria de cipuri AI: Deși au existat informații că unele TPU ar putea fi fabricate la Intel (cu un ordin de mărime de până la 3 milioane de unități, potrivit unor rapoarte anterioare), analiști citați susțin că fabricarea ar rămâne la TSMC , iar Intel ar putea prelua partea de ambalare . Pentru „Humufish”, Wccftech scrie că ar urma să fie folosit Intel EMIB (o tehnologie de interconectare în pachet), prezentată ca alternativă mai flexibilă și cu costuri mai mici față de CoWoS (o abordare 2,5D folosită pe scară largă în acceleratoarele AI). Publicația menționează și un scenariu în care Google ar putea muta o parte din capacitate către Intel Foundry , pe fondul „bottleneck”-urilor din lanțul de aprovizionare și al încărcării TSMC cu comenzi de la NVIDIA, AMD și Apple. Memorie: HBM4E pentru Triggerfish Pentru partea de memorie, articolul afirmă că: TPUv9 „Triggerfish” ar urma să folosească HBM4E ; TPUv9 „Humufish” ar urma să folosească HBM4 . HBM (High Bandwidth Memory) este memoria cu lățime de bandă foarte mare folosită în acceleratoare AI, iar trecerea la generații noi este relevantă pentru performanță și disponibilitate, în condițiile în care cererea globală rămâne ridicată. De ce contează Dincolo de numele de cod, direcția indicată de aceste informații sugerează că Google încearcă să consolideze antrenarea și inferența într-o singură platformă TPU , reducând dependența de configurații separate și optimizând comutarea sarcinilor în aplicații „agentic AI”. Dacă planul de producție (T3/T4 2027) se confirmă, următoarea etapă de urmărit va fi cum își împarte Google efectiv producția și ambalarea între TSMC și Intel, într-o piață în care capacitatea de packaging avansat a devenit la fel de critică precum fabricarea propriu-zisă. [...]

Întreruperea Claude a lovit simultan chat-ul și API-ul, riscând să blocheze fluxuri de lucru în companii , după ce Anthropic a confirmat că „investighează” problema și implementează o remediere, potrivit TechRadar . Problemele au început în jurul orei 10:02 ET (17:02, ora României), când a apărut un vârf de raportări pe Downdetector . La momentul relatării, numărul sesizărilor din SUA depășise 8.000, semn că incidentul a afectat un volum mare de utilizatori. Ce servicii au fost afectate și ce a comunicat Anthropic Pagina oficială Claude Status a indicat „o rată ridicată de erori” la nivelul modelelor și a transmis că „se implementează o remediere”. Ulterior, statusul a fost actualizat cu mesajul că „o remediere a fost implementată și monitorizăm rezultatele”. Din informațiile publicate, întreruperea a fost una extinsă, vizând: toate modelele Claude; atât conturile gratuite, cât și cele plătite; mai multe platforme Claude (interfața de chat, Claude Code, Claude Cowork și API-ul), cu excepția „Claude for Government”, menționat ca neafectat. Utilizatorii au raportat fie blocarea răspunsurilor („gândește” fără să finalizeze), fie mesaje de tipul „acest model nu este disponibil acum”. Evoluția incidentului: semne de revenire, dar cu întârzieri Pe parcursul zilei, raportările de pe Downdetector au început să scadă, însă mii de utilizatori ar fi rămas în continuare cu probleme, inclusiv în redacția TechRadar . Publicația notează că, după aproximativ o oră de la remedierea anunțată de Anthropic, serviciul a revenit pentru mulți utilizatori, deși cu întârzieri în răspunsuri în unele cazuri. TechRadar compară incidentul cu întreruperea semnificativă din 2 iunie, despre care spune că a fost mai mică și legată de modelul Opus 4.6, în timp ce întreruperea din 23 iunie ar fi fost „mai mare” și extinsă la toate modelele și platformele. De ce contează pentru companii Faptul că au fost afectate atât interfața de chat, cât și API-ul sugerează un impact operațional direct: de la utilizarea zilnică a asistentului în echipe până la aplicații și procese interne care depind de integrarea Claude. Anthropic a indicat că monitorizează situația după implementarea remedierii, ceea ce lasă deschisă posibilitatea unor probleme reziduale pe termen scurt. [...]

SpaceX își consolidează pivotul spre afacerea de „închiriere” de putere de calcul , după ce a semnat cu Reflection AI un contract de circa 6,3 miliarde de dolari (aprox. 29 mld. lei) până în 2029, potrivit The Next Web . Acordul adaugă un nou chiriaș major în centrele de date „Colossus” din Memphis și întărește ideea că SpaceX monetizează infrastructura AI ca linie de business separată, nu doar ca suport pentru propriile modele. Reflection AI va plăti 150 milioane de dolari pe lună (aprox. 690 mil. lei) pentru a închiria cipuri Nvidia în „Colossus 2”, cu plăți începând de la 1 iulie 2026 și până în 2029, suma totală ajungând la aproximativ 6,3 miliarde de dolari, conform CNBC (link în sursă). The Information a relatat prima despre tranzacție, iar contractul permite oricăreia dintre părți să renunțe cu un preaviz de 90 de zile după primele trei luni. Puterea de calcul ar rula pe sisteme Nvidia GB300, menționează publicația. Nvidia, furnizor și investitor în același timp Structura tranzacției este relevantă pentru dinamica pieței: Nvidia nu doar furnizează hardware-ul (cipurile), ci este și investitor în Reflection AI. Tech Funding News (link în sursă) scrie că Nvidia ar fi investit circa 800 milioane de dolari (aprox. 3,7 mld. lei) în startup anul trecut, ceea ce pune compania „de ambele părți” ale contractului: vinde tehnologia și sprijină financiar clientul care o închiriază. Cine este Reflection AI și ce urmărește Reflection AI este un startup „open-source” (în sensul că promovează „open weights” – modele cu parametri publicați, spre deosebire de laboratoarele „închise”), fondat în 2024 de Misha Laskin și Ioannis Antonoglou, ambii foști Google DeepMind; Antonoglou a contribuit la dezvoltarea AlphaGo, potrivit articolului. Compania a atras 2 miliarde de dolari (aprox. 9,2 mld. lei) în octombrie, la o evaluare de 8 miliarde de dolari (aprox. 36,8 mld. lei), cu Nvidia, Sequoia și Lightspeed printre investitori. Acum ar strânge din nou capital la o evaluare de 25 miliarde de dolari (aprox. 115 mld. lei), potrivit Bloomberg (link în sursă). The Next Web notează că Reflection nu a lansat încă un „frontier model” public (model de vârf, la limita performanței curente), iar compania are legături cu proiecte ale Departamentului Energiei din SUA și inițiative AI ale Pentagonului. SpaceX, din constructor de infrastructură pentru Grok în „proprietar” de centre de date Miza economică pentru SpaceX este că „Colossus” a devenit, în practică, o afacere de închiriere de capacitate. Publicația afirmă că SpaceX a construit inițial Colossus pentru Grok (modelul xAI), dar ulterior a transformat situl într-un business de tip „compute landlord”, inclusiv pe fondul faptului că nu ar fi reușit să facă centrul de date să funcționeze pentru propriile modele. Reflection intră într-o listă de chiriași care, potrivit articolului, include deja: Anthropic , cu plăți de aproximativ 1,25 miliarde de dolari pe lună (aprox. 5,75 mld. lei); Google, cu 920 milioane de dolari pe lună (aprox. 4,23 mld. lei). Tech Funding News mai susține (link în sursă) că aceste contracte ar duce SpaceX la peste 80 miliarde de dolari (aprox. 368 mld. lei) venituri angajate din compute până în 2029. Context operațional: Colossus 2 și dimensiunea infrastructurii Colossus 2 este campusul mai nou dintre cele două din Memphis. Colossus 1 ar găzdui deja peste 220.000 de GPU-uri Nvidia, iar SpaceX ar viza ca întregul complex să ajungă la o putere de 2 gigawați, ceea ce ar transforma Memphis într-una dintre cele mai mari concentrări de putere de calcul pentru AI, potrivit articolului. De ce contează Deși contractul cu Reflection (150 milioane de dolari/lună) este mult mai mic decât cel cu Anthropic, The Next Web îl tratează ca pe un semnal: infrastructura SpaceX ajunge să finanțeze, prin capacitate disponibilă, și „tabăra” modelelor deschise din cursa AI. În paralel, pentru Nvidia, tranzacția este încă un exemplu de model în care compania „vinde uneltele” și deține participații în „mina” care le folosește. [...]

Huawei vizează reducerea consumului de energie și a timpului de rulare pentru asistenții AI pe dispozitive , printr-o metodă de „potrivire” automată a modelelor în funcție de capabilitățile hardware, potrivit Huawei Central , care scrie că firma a primit aprobarea pentru un nou brevet pe această direcție. Brevetul, intitulat „An Artificial Intelligence (AI) Communication Method and Device”, descrie o soluție de comunicare între un asistent AI și dispozitive, cu obiectivul de a îmbunătăți eficiența și acuratețea rulării modelelor de tip LLM (modele lingvistice mari) direct pe device. Miza practică este ca utilizatorul să beneficieze de funcții AI mai „potrivite” contextului, fără testări repetate și consumatoare de resurse. Cum ar funcționa mecanismul descris în brevet Conform descrierii, sistemul implică două dispozitive într-un „sistem de comunicare”: un al doilea dispozitiv trimite către primul dispozitiv detalii despre modelele AI, inclusiv date complexe care înregistrează timpul de rulare și consumul de energie pentru diferite modele; după ce primește aceste informații, primul dispozitiv poate testa modelul în funcție de propriile capabilități hardware și poate transmite feedback către al doilea dispozitiv. Publicația notează că soluția introduce un mecanism de auto-verificare și potrivire a funcțiilor AI, astfel încât dispozitivele să nu mai fie nevoite să evalueze modelele „unul câte unul”. În schimb, ar putea determina mai rapid ce model este mai potrivit pentru mediul curent. De ce contează operațional: evaluare mai rapidă, rezultate mai precise În logica brevetului, metoda ar permite evaluarea capabilităților AI „mai ușor și mai eficient”, optimizând în același timp acuratețea rezultatelor evaluării. Sursa nu oferă un calendar de implementare și nici nu confirmă că soluția va ajunge într-un produs comercial; este vorba despre o aprobare de brevet și despre o descriere tehnică a unei posibile abordări. [...]

O acțiune colectivă în California acuză mari operatori de benzinării că au folosit un algoritm cu inteligență artificială pentru a crește coordonat prețurile , într-un posibil ocol al regulilor de concurență, potrivit WinFuture . Procesul vizează inclusiv companii precum Walmart , BP și 7-Eleven și se bazează pe un cadru legal californian relativ nou, care interzice explicit folosirea algoritmilor comuni de stabilire a prețurilor între competitori. Plângerea a fost depusă luni, la Sacramento, de un grup de șoferi care susțin că operatorii au utilizat intenționat software de stabilire a prețurilor cu inteligență artificială pentru a majora „sistematic și nelegal” prețurile benzinei la nivelul întregului stat. În centrul acuzațiilor este o soluție a furnizorului Kalibrate , despre care reclamanții afirmă că ar procesa în timp real date confidențiale ale concurenților pentru a alinia automat prețurile și a reduce competiția. De ce contează: costuri mai mari pentru consumatori și risc de sancțiuni Conform informațiilor citate de WinFuture din Bloomberg , în zonele unde software-ul Kalibrate ar fi fost folosit pe scară largă au fost observate majorări de până la 30 de cenți pe galon. (Sursa nu oferă o conversie în litri; un galon american înseamnă aproximativ 3,785 litri.) Aceeași sursă indică faptul că fiecare cent în plus ar costa anual șoferii din California circa 134 milioane de dolari (aprox. 603 milioane lei, la un curs orientativ de 4,5 lei/dolar), potrivit estimărilor menționate. Miza economică a cazului este dublă: pe de o parte, eventuale despăgubiri pentru consumatori; pe de altă parte, un precedent care poate limita utilizarea „algoritmilor de preț” în retailul de carburanți, într-un moment în care astfel de instrumente sunt promovate ca soluții de optimizare comercială. Cine este vizat și ce cer reclamanții Potrivit acțiunii, companiile acuzate operează împreună peste 1.700 de stații de alimentare în California. Reclamanții solicită despăgubiri pentru toți șoferii care ar fi plătit în plus pe o perioadă mai lungă din cauza acestui mecanism. În proces este inclus și Kalibrate, ca furnizor al software-ului. Până acum, reacțiile publice sunt limitate: Walmart a transmis doar că analizează plângerea și va răspunde în instanță, iar alte companii, inclusiv BP, au refuzat să comenteze sau nu au răspuns solicitărilor presei, conform materialului. [...]

OpenAI împinge Codex spre rolul de „spațiu de lucru persistent” pentru proiecte care depășesc un singur prompt , într-un material care descrie cum poate fi păstrat contextul și cum pot fi gestionate fluxuri de lucru complexe pe durate mai lungi, potrivit OpenAI . Publicația prezintă un „whitepaper” semnat de Jason Liu, care propune strategii practice pentru folosirea Codex astfel încât munca să poată continua coerent de la o sesiune la alta: păstrarea contextului, organizarea etapelor și susținerea progresului în proiecte de durată. Ce se schimbă operațional: din „prompt” în proces Mesajul central este repoziționarea Codex ca instrument care poate funcționa ca un „workspace” (spațiu de lucru) persistent, nu doar ca un răspuns punctual la o cerere. În această logică, utilizarea recomandată vizează: împărțirea obiectivelor ambițioase în pași verificabili; menținerea continuității între mai multe fire de lucru (workstreams), astfel încât proiectul să nu fie „resetat” la fiecare interacțiune; stabilirea momentelor în care execuția poate fi delegată către Codex și a celor în care supravegherea umană rămâne mai valoroasă. Documentația: ghidul complet este separat OpenAI direcționează cititorii către ghidul integral („Read the guide”), disponibil ca document separat, fără a detalia în pagina de prezentare exemple concrete sau rezultate măsurabile. Materialul este datat 22 iunie 2026 și este încadrat în seria „AI Adoption” (adopția inteligenței artificiale). [...]