Știri
Știri din categoria Inteligență artificială

Google testează un agent „mereu activ” în Gemini, capabil să execute sarcini în alte aplicații fără intervenție umană, potrivit Android Authority. Funcționalitatea, denumită „Spark” în scurgerile apărute, ar muta Gemini din zona de asistent conversațional în cea de automatizare practică, cu impact direct asupra modului în care utilizatorii își gestionează fluxurile de lucru în Google Workspace și, posibil, dincolo de acesta.
Conform capturilor și descrierilor publicate de utilizatori care ar fi activat Spark în Gemini, opțiunea de pornire apare în meniul secundar (overflow), accesibil din butonul „hamburger” din colțul stânga-sus al aplicației Gemini pe Android. Ecranul de întâmpinare indică faptul că agentul poate declanșa acțiuni în alte aplicații, cu exemple precum:
Miza operațională este că Spark nu s-ar limita la răspunsuri, ci ar executa efectiv pași în aplicații, pe baza unei cereri formulate de utilizator.
O altă componentă menționată este posibilitatea de a crea „skill-uri” (abilități) pentru sarcini recurente: un set de instrucțiuni reutilizabil, cu o variabilă completată din prompt. Publicația compară această abordare cu funcționalități similare oferite de Claude prin „Projects”.
Separat, Spark ar putea rula „workflows” (fluxuri de lucru) în mai mulți pași și ar indexa informații din mai multe aplicații simultan. În capturile văzute până acum apar doar aplicații din Google Workspace, însă materialul notează că ar putea exista și suport pentru aplicații terțe.
Un detaliu cu implicații de control și risc: utilizatorii ar putea avea opțiunea de a lăsa Spark să funcționeze fără ca un om să-i verifice rezultatele înainte de execuție, potrivit informațiilor din scurgeri.
Testing Catalog susține că Spark ar putea controla browserul Chrome „ca un agent” și ar putea folosi fișiere stocate pe computer sau pe alte dispozitive. Totuși, în forma descrisă acum, nu ar putea controla întregul computer, „ca OpenClaw și Claude Cowork”, potrivit aceleiași surse citate în articol.
Materialul mai menționează și posibilitatea ca Spark să se bazeze pe un model de inteligență artificială separat pentru funcționare.
Android Authority indică faptul că Google ar putea face un anunț la I/O 2026. În acest stadiu, informațiile provin din scurgeri și capturi din testare, astfel că numele final, disponibilitatea și lista completă de capabilități pot suferi modificări până la o confirmare oficială.
Recomandate

Google încearcă să mute dezbaterea despre regulile UE din zona concurenței în cea a securității datelor , avertizând că obligația de a deschide Android către alți asistenți AI și de a partaja date de căutare „anonimizate” ar putea crește riscurile de fraudă și reidentificare a utilizatorilor, potrivit Ars Technica . Miza este una de reglementare: Comisia Europeană pregătește pentru luna viitoare un set de măsuri care ar putea forța Google să „joace mai corect” cu rivalii din UE. Compania susține însă că, în forma discutată acum, schimbările ar crea breșe operaționale și de confidențialitate, chiar dacă obiectivul declarat al UE este reducerea poziției dominante a Google. Ce ar putea cere UE: acces AI pe Android și partajare de date din căutări Heather Adkins, vicepreședinte Google pentru inginerie de securitate, a declarat pentru Wired (citată de Ars Technica) că propunerile UE au două componente: Android : Gemini ar urma să nu mai fie singurul serviciu AI integrat, iar utilizatorii ar putea integra și alte modele AI cu acces de tip „la nivel de sistem”, similar cu cel de care beneficiază Gemini. Căutare : Google ar urma să partajeze cu alte companii date de căutare „anonimizate” , într-un format apropiat de cel folosit intern, inclusiv conținutul căutărilor, poziționări în rezultate și rate de click. Adkins a susținut că, dacă măsurile ar fi implementate „așa cum sunt descrise azi”, în câteva săptămâni s-ar putea vedea „o creștere semnificativă a fraudei în UE”. Riscul operațional invocat pe Android: „asistenți” malițioși cu acces extins Google argumentează că statutul special al lui Gemini pe Android îi oferă acces la fișierele utilizatorului, conținutul de pe ecran și interacțiuni vocale îmbunătățite . În logica companiei, extinderea acestui tip de acces către alți furnizori ar putea fi exploatată de actori rău intenționați, prin instalarea unor servicii AI malițioase capabile să fure date sau să manipuleze experiența de utilizare. Articolul notează că Adkins nu intră în detalii tehnice despre mecanismele de atac, dar sugerează că problema ar fi „suprafața” mai mare de risc odată cu apariția mai multor servicii cu privilegii similare. „Anonimizarea e grea”: disputa pe datele de căutare și reidentificare Partea cea mai sensibilă este partajarea de date de căutare. Conform proiectului de propunere citat, Google ar trebui să ofere competitorilor un set de date „anonimizate” cu granularitate ridicată, la un nivel care „nu a mai fost furnizat” până acum. Adkins a spus pentru Wired: „Anonimizarea este grea și trebuie să ai experții tehnici potriviți la masă ca să găsești soluțiile.” Google invocă și faptul că, odată cu disponibilitatea pe scară largă a modelelor AI puternice, de-anonimizarea (reidentificarea) seturilor mari de date ar fi mai ușoară. În plus, compania susține că echipele sale interne ar fi reușit să lege date de căutare „anonime” de utilizatori individuali în doar două ore , folosind așa-numitele „atacuri de corelare” (linkage attacks), adică tehnici care combină indicii din mai multe surse pentru a identifica persoane. Un alt argument prezentat este riscul de securitate la nivel de ecosistem: dacă datele ajung la firme mai mici, acestea ar putea deveni ținte mai ușoare pentru atacatori. Context: DMA și calendarul deciziei Demersul UE se desfășoară în cadrul Digital Markets Act (DMA) , care desemnează companii precum Google, Meta sau Amazon drept „gatekeeperi” (platforme cu rol de control asupra accesului la piețe digitale) și le impune obligații suplimentare. Potrivit articolului, perioada de comentarii s-a încheiat pe 1 mai , iar Comisia Europeană lucrează la modul de aplicare. O decizie finală este așteptată pe 27 iulie , iar aceasta ar urma să fie obligatorie din punct de vedere legal pentru Google, în calitatea sa de gatekeeper. Până atunci, detaliile despre accesul AI pe Android și despre nivelul de anonimizare cerut pentru datele de căutare rămân „în aer”. [...]

Gemini Spark ajunge pe macOS și poate automatiza sarcini direct în fișierele de pe desktop , o extindere care mută asistentul din zona de chat către execuție efectivă de „muncă” pe calculator, potrivit Google Blog . Actualizarea vine la pachet cu mai multe integrări cu aplicații și cu o funcție de urmărire în timp real a subiectelor, inclusiv pentru știri și finanțe. macOS: automatizări pe fișiere și aplicații, cu acces pe bază de permisiuni Google spune că aduce Spark în aplicația Gemini pentru macOS pentru a automatiza „sarcini consumatoare de timp” la nivelul desktopului. Exemplul dat este sortarea automată a fișierelor PDF din folderul Downloads în directoare specifice, la cerere. O altă utilizare descrisă este legarea fișierelor locale de Google Workspace: utilizatorul poate cere crearea unui tabel de buget pe baza celor mai recente facturi salvate pe computer și programarea unor actualizări regulate. Din perspectiva controlului accesului, compania precizează că Spark „are acces doar la fișierele pentru care îi acorzi permisiunea”. Urmează execuția de sarcini de la distanță, inițiată de pe telefon Google anunță și o funcție „în curând” pentru rularea de sarcini de la distanță: utilizatorul va putea atribui din telefon o sarcină în mai mulți pași care să fie executată pe Mac cât timp nu este la computer. Ca exemplu, compania menționează că Spark ar putea căuta un raport de vânzări pe Mac, extrage cifra de venit total și trimite rezultatul pe e-mail. Disponibilitate: beta, doar pentru abonați Google AI Ultra , inițial în SUA Gemini Spark pentru macOS este disponibil în versiune beta pentru abonații Google AI Ultra cu vârsta de peste 18 ani, începând din SUA. Google indică drept punct de descărcare pagina gemini.google/mac. Integrări cu aplicații și suport pentru MCP Pe lângă macOS, Google extinde lista de „aplicații conectate” (integrări) pentru Spark. Sunt menționate: Google Tasks și Google Keep (transformarea notițelor din Keep în acțiuni în Tasks); Canva, Dropbox, Instacart, OpenTable și Zillow Rentals. Aceste integrări ar urma să se lanseze „în următoarea săptămână” pe web și mobil, iar pentru aplicația macOS „în următoarele săptămâni”. Separat, Google spune că introduce suport pentru Model Context Protocol (MCP) , care permite conectarea unor aplicații preferate direct în Spark pentru un asistent mai „personalizat” (protocolul este un mecanism de integrare care ajută un model să primească context și să interacționeze cu servicii externe). Monitorizare în timp real: inclusiv alerte și rapoarte financiare O altă schimbare este capacitatea Spark de a urmări subiecte și de a reacționa la evenimente în timp real. Google dă ca exemplu trimiterea unui „raport financiar detaliat” dacă o acțiune atinge un anumit prag. Spark poate urmări bloguri, site-uri de știri, rețele sociale, finanțe, cumpărături, vreme și sport, pe lângă e-mail. Google afirmă că actualizările încep să fie livrate „de astăzi” și promite mai multe detalii despre ce urmează pentru Spark „în această vară”. [...]

Google extinde în SUA generarea de imagini „personalizate” în Gemini, folosind date din aplicațiile conectate, ceea ce ridică miza pentru controlul consimțământului și al setărilor de confidențialitate. Potrivit Google Blog , începând de astăzi, „toți utilizatorii eligibili” din Statele Unite pot accesa gratuit generarea profund personalizată de imagini în aplicația Gemini. Funcționalitatea se bazează pe „Personal Intelligence”, un mecanism prin care Gemini, cu permisiunea utilizatorului, poate folosi informații din servicii Google precum Gmail, Google Photos , YouTube și Search pentru a oferi răspunsuri mai relevante. Noutatea anunțată este conectarea acestui strat de personalizare cu „Nano Banana” și cu Google Photos, astfel încât imaginile generate să reflecte mai ușor preferințele și stilul de viață al utilizatorului, deduse din aplicațiile conectate. Din perspectivă operațională, Google susține că utilizatorii nu mai trebuie să descrie în detaliu contextul personal în prompturi (instrucțiunile text către model), putând folosi cereri mai generale, de tipul „proiectează casa visurilor mele”. În plus, compania afirmă că Gemini poate folosi imagini reale ale utilizatorului din Google Photos, reducând nevoia de încărcare manuală a fotografiilor atunci când cererea implică reprezentarea persoanei (de exemplu, „creează o ilustrație cu mine și lucrurile mele preferate”). Controlul utilizatorului rămâne pe bază de „opt-in” Google precizează că conectarea aplicațiilor Google la Gemini rămâne opțională („opt-in”) și poate fi ajustată oricând din setări. Compania trimite și la o pagină separată cu detalii despre eligibilitate, fără a include în textul principal criteriile concrete sau o listă completă a condițiilor. Extinderea este, deocamdată, limitată la SUA și la utilizatorii „eligibili”, iar anunțul nu oferă un calendar pentru alte piețe. [...]

Google ar fi început să limiteze accesul Meta la modelul Gemini din cauza lipsei de capacitate de calcul , iar blocajul riscă să întârzie proiecte interne de inteligență artificială la Meta, potrivit IT Home , care citează un articol din Financial Times . Meta ar fi cerut de la Google o cantitate de resurse de calcul (putere de procesare necesară pentru rularea și antrenarea modelelor de inteligență artificială) peste ceea ce compania putea livra. Conform informațiilor, Alphabet (compania-mamă a Google) ar fi transmis în jurul lunii martie că nu poate acoperi necesarul Meta pentru Gemini, iar acest deficit ar fi afectat calendarul mai multor inițiative interne, unele fiind amânate. Efect operațional: proiecte întârziate și raționalizarea consumului de „tokeni” În urma restricțiilor, Meta ar fi cerut angajaților să economisească „tokeni” (unitatea de bază folosită pentru a măsura consumul în servicii de inteligență artificială, în special la utilizarea modelelor lingvistice mari). Măsura sugerează o presiune directă asupra bugetelor și planificării de produs, atunci când accesul la infrastructura necesară nu mai este garantat la nivelul cerut. Financial Times mai notează că și alți clienți ai Google ar fi fost afectați, însă într-o măsură mai mică; Meta ar fi resimțit cel mai puternic impactul, tocmai din cauza volumului ridicat de resurse solicitate. Context: investiții de miliarde, dar „gâtul de sticlă” rămâne Deși marile companii tehnologice investesc de ani buni miliarde de dolari în achiziții de cipuri și în construirea de centre de date, piața încă se confruntă cu un deficit de capacitate care să țină pasul cu cererea în creștere pentru servicii de inteligență artificială, potrivit aceleiași relatări. În acest context, IT Home menționează că veniturile Google Cloud au ajuns la 20 de miliarde de dolari (aprox. 92 miliarde lei) în trimestrul I, până în martie. Totuși, CEO-ul Google, Sundar Pichai, a indicat că limitările de capacitate au frânat o creștere mai rapidă și au contribuit la acumularea de comenzi restante, care ar fi crescut aproape dublu față de trimestrul anterior. Ce urmează Dacă restricțiile de capacitate persistă, companiile mari care depind de furnizori externi pentru acces la modele și infrastructură ar putea fi nevoite să își recalibreze planurile: fie prin prioritizarea proiectelor și reducerea consumului, fie prin diversificarea furnizorilor sau accelerarea investițiilor proprii în infrastructură. În material nu sunt oferite detalii despre durata limitărilor sau despre un calendar de revenire la capacitatea solicitată. [...]

Google a plafonat accesul Meta la Gemini din lipsă de capacitate de calcul , un semnal că infrastructura pentru inteligență artificială începe să devină un blocaj operațional chiar și pentru cei mai mari jucători din tehnologie, potrivit Ziarul Financiar . Google i-a transmis Meta în jurul lunii martie că nu poate furniza întreaga capacitate Gemini pe care compania o dorea să o cumpere, conform a trei persoane familiarizate cu situația. Restricțiile sunt încă în vigoare și, potrivit publicației, au perturbat și întârziat unele proiecte interne de AI ale Meta. Un blocaj de infrastructură care lovește direct în proiecte și bugete Limitarea accesului la modele nu este doar o chestiune comercială, ci una de „putere de calcul” (capacitatea de procesare necesară pentru antrenarea și rularea modelelor AI). În acest context, Meta a început să-și împingă angajații să folosească mai eficient „tokenurile” AI – unități prin care este măsurată utilizarea AI – atât din cauza restricțiilor impuse de Google, cât și pe fondul unei inițiative mai ample de eficientizare a costurilor cu AI. Aceeași sursă notează că și alți clienți ai Google au fost afectați de restricții, însă într-o măsură mai mică, Meta fiind lovită mai puternic din cauza cererii „excepțional de mari” pentru modelele Google. De ce contează: cererea depășește investițiile, iar cloud-ul rămâne limitat Decizia Google de a plafona accesul unui client mare oferă o imagine rară asupra presiunilor din infrastructura AI, într-un moment în care industria investește masiv în cipuri, centre de date și energie, dar tot nu reușește să țină pasul cu cererea. Ca reacție la cererea ridicată – în special din partea clienților corporate mari precum Meta – Google s-a grăbit să-și asigure capacitate suplimentară, potrivit unei persoane familiarizate cu situația. La începutul lunii, compania a semnat un acord de 920 de milioane de dolari pe lună (aprox. 4,22 mld. lei) pentru a închiria capacitate de calcul de la SpaceX , compania lui Elon Musk. Google și Meta au refuzat să comenteze. Context financiar: „suntem limitați de capacitatea de calcul” La prezentarea rezultatelor pentru primul trimestru, în aprilie, directorul general al Google, Sundar Pichai, a spus că veniturile din cloud au depășit pentru prima dată 20 de miliarde de dolari, iar portofoliul de contracte cloud semnate, dar încă nelivrate, aproape s-a dublat față de trimestrul anterior, ajungând la peste 460 de miliarde de dolari. „Evident, pe termen scurt suntem limitați de capacitatea de calcul. De exemplu, veniturile noastre din Cloud ar fi fost mai mari dacă am fi putut satisface cererea.” În esență, episodul arată că „frenezia AI” nu mai pune presiune doar pe bugete, ci și pe livrarea efectivă a capacității, cu efecte directe asupra ritmului de dezvoltare a produselor și asupra veniturilor din cloud. [...]

Google reduce costurile și timpul de generare pentru media generativă prin lansarea modelului de imagini Nano Banana 2 Lite și prin deschiderea către dezvoltatori a Gemini Omni Flash pentru generare și editare video, potrivit Google Blog . Miza practică: fluxuri de lucru mai ieftine și mai rapide pentru aplicații care produc volume mari de imagini și clipuri, cu integrare directă în instrumentele Google pentru dezvoltatori și în unele produse pentru consumatori. Nano Banana 2 Lite este prezentat drept „cel mai rapid” și „cel mai eficient ca preț” model din familia Gemini Image, orientat spre utilizare la scară (throughput ridicat) și latență mică. Google indică o latență de 4 secunde pentru ieșiri text-to-image și un cost de 0,034 dolari per imagine la rezoluție 1K (aprox. 0,16 lei), poziționând modelul ca opțiune pentru prototipare interactivă și pipeline-uri în care costul este constrângerea principală. Compania spune că Nano Banana 2 Lite este recomandatul înlocuitor pentru dezvoltatorii care folosesc prima versiune Nano Banana (gemini-2.5-flash-image). Ce se schimbă operațional pentru dezvoltatori Disponibilitatea este extinsă simultan pe mai multe canale, ceea ce reduce fricțiunea de implementare pentru echipele care lucrează deja în ecosistemul Google: Nano Banana 2 Lite este disponibil în Nano Banana 2 Lite , în Google AI Studio , în Gemini API și în Gemini Enterprise Agent Platform . În paralel, Google spune că modelul începe să fie introdus și în suprafețe pentru consumatori, inclusiv AI Mode din Search, aplicația Gemini , NotebookLM, Google Photos, Stitch, Google Flow și Google Ads. Gemini Omni Flash ajunge „pentru prima dată” la dezvoltatori în Gemini Omni Flash , în Google AI Studio , în Gemini API și în aceeași platformă enterprise. Modelul este disponibil și în aplicația Gemini și în Google Flow. Din perspectiva costurilor, Google precizează că Omni Flash este tarifat la 0,10 dolari pe secundă de video generat (aprox. 0,47 lei), la același nivel cu Veo 3.1 Fast. De ce contează: cost pe unitate și viteză, nu doar „calitate” Google își construiește mesajul în jurul a două constrângeri tipice în producția de media generativă: latența (timpul până la rezultat) și costul per unitate (imagine sau secundă de video). Nano Banana 2 Lite este descris ca fiind optimizat pentru „near-real-time” și volume mari, iar Omni Flash ca un model „cost-efficient” pentru generare și editare video conversațională (adică editare prin comenzi în limbaj natural). Publicația susține că cele două modele pot fi „înlanțuite” într-un flux cap-coadă: imagine generată rapid cu Nano Banana 2 Lite, apoi animată în video cu Omni Flash. Pentru experiențe cu mai multe iterații, Google menționează folosirea Interactions API pentru păstrarea contextului și istoricului sesiunii, cu până la trei editări secvențiale. Limitări declarate pentru Omni Flash Google notează explicit câteva limitări operaționale, relevante pentru planificarea produselor: generările video sunt, deocamdată, de 10 secunde , cu durate mai lungi „în curând”; încărcarea de referințe audio și „scene extension” nu sunt suportate în Gemini API pentru acest model; referințele video de până la 3 secunde sunt acceptate de schema API, dar nu sunt procesate corect de model „în acest moment”; consistența personajelor între scene sau la mișcări de panoramare are limitări, pe care compania spune că lucrează să le îmbunătățească. Siguranță și verificare a conținutului Google afirmă că Gemini Omni și Nano Banana 2 Lite folosesc SynthID (watermarking, adică marcaj invizibil pentru identificarea conținutului generat de AI) și că verificarea se poate face prin aplicația Gemini, Gemini în Chrome sau Search. Pentru dezvoltatori, concluzia practică este că Google împinge media generativă către un model de utilizare „industrială”: costuri unitare explicite, timpi de răspuns scurți și integrare directă în API-uri și instrumente enterprise, dar cu limitări încă active pe partea de video, pe care echipele trebuie să le trateze ca riscuri de produs în faza de implementare. [...]