Știri
Știri din categoria Inteligență artificială

Google extinde „agentic browsing” pe mobil, aducând Gemini și funcția auto browse în Chrome pentru Android la final de iunie, cu acces inițial limitat la SUA și la anumite configurații de dispozitive, potrivit Google Blog.
Actualizarea vizează un set de funcții bazate pe Gemini 3.1, prin care browserul poate rezuma pagini, răspunde la întrebări despre conținutul afișat și automatiza sarcini „de rutină” direct din Chrome. Miza operațională este mutarea unor acțiuni care până acum necesitau navigare manuală între site-uri și aplicații într-un flux asistat de AI, cu confirmări explicite pentru pașii sensibili.
Google descrie Gemini în Chrome pe Android ca un „asistent personal de navigare” care înțelege pagina deschisă. Utilizatorul accesează funcțiile dintr-o pictogramă Gemini în bara de instrumente, iar interfața se deschide în partea de jos a ecranului.
Funcțiile menționate includ:
Pentru prima dată pe Android, Google introduce și „auto browse”, o funcție care poate executa sarcini pe web în numele utilizatorului. Exemplele date includ găsirea și rezervarea unui loc de parcare folosind detalii din confirmarea biletului (cu SpotHero) sau actualizarea unei comenzi (exemplul Chewy).
Pe partea de control și securitate, Google precizează că auto browse cere confirmare înainte de acțiuni sensibile, cum ar fi cumpărături sau postări pe rețele sociale. Compania mai spune că protecțiile sunt aliniate cu cele de pe desktop și că vizează inclusiv riscuri precum „prompt injection” (o tehnică prin care un atacator încearcă să manipuleze un sistem AI prin instrucțiuni inserate în conținut).
Pachetul include și „Nano Banana”, un instrument pentru crearea sau personalizarea de imagini direct în Chrome. Google indică utilizări precum transformarea unei pagini într-un infografic sau modificarea unei fotografii dintr-un anunț imobiliar pentru a vizualiza o cameră „mobilată”.
Conform informațiilor publicate, lansarea începe „la final de iunie” pentru utilizatori din SUA, pe dispozitive selectate cu Android 12 sau mai nou. Există și condiții tehnice explicite:
În paralel, auto browse va fi disponibil pentru abonații „AI Pro” și „AI Ultra” din SUA, tot pe dispozitive selectate cu Android 12+. Google nu oferă în material un calendar pentru extinderea în alte piețe și nici detalii despre disponibilitatea în România.
Recomandate

Google extinde în SUA generarea de imagini „personalizate” în Gemini, folosind date din aplicațiile conectate, ceea ce ridică miza pentru controlul consimțământului și al setărilor de confidențialitate. Potrivit Google Blog , începând de astăzi, „toți utilizatorii eligibili” din Statele Unite pot accesa gratuit generarea profund personalizată de imagini în aplicația Gemini. Funcționalitatea se bazează pe „Personal Intelligence”, un mecanism prin care Gemini, cu permisiunea utilizatorului, poate folosi informații din servicii Google precum Gmail, Google Photos , YouTube și Search pentru a oferi răspunsuri mai relevante. Noutatea anunțată este conectarea acestui strat de personalizare cu „Nano Banana” și cu Google Photos, astfel încât imaginile generate să reflecte mai ușor preferințele și stilul de viață al utilizatorului, deduse din aplicațiile conectate. Din perspectivă operațională, Google susține că utilizatorii nu mai trebuie să descrie în detaliu contextul personal în prompturi (instrucțiunile text către model), putând folosi cereri mai generale, de tipul „proiectează casa visurilor mele”. În plus, compania afirmă că Gemini poate folosi imagini reale ale utilizatorului din Google Photos, reducând nevoia de încărcare manuală a fotografiilor atunci când cererea implică reprezentarea persoanei (de exemplu, „creează o ilustrație cu mine și lucrurile mele preferate”). Controlul utilizatorului rămâne pe bază de „opt-in” Google precizează că conectarea aplicațiilor Google la Gemini rămâne opțională („opt-in”) și poate fi ajustată oricând din setări. Compania trimite și la o pagină separată cu detalii despre eligibilitate, fără a include în textul principal criteriile concrete sau o listă completă a condițiilor. Extinderea este, deocamdată, limitată la SUA și la utilizatorii „eligibili”, iar anunțul nu oferă un calendar pentru alte piețe. [...]

Google reduce costurile și timpul de generare pentru media generativă prin lansarea modelului de imagini Nano Banana 2 Lite și prin deschiderea către dezvoltatori a Gemini Omni Flash pentru generare și editare video, potrivit Google Blog . Miza practică: fluxuri de lucru mai ieftine și mai rapide pentru aplicații care produc volume mari de imagini și clipuri, cu integrare directă în instrumentele Google pentru dezvoltatori și în unele produse pentru consumatori. Nano Banana 2 Lite este prezentat drept „cel mai rapid” și „cel mai eficient ca preț” model din familia Gemini Image, orientat spre utilizare la scară (throughput ridicat) și latență mică. Google indică o latență de 4 secunde pentru ieșiri text-to-image și un cost de 0,034 dolari per imagine la rezoluție 1K (aprox. 0,16 lei), poziționând modelul ca opțiune pentru prototipare interactivă și pipeline-uri în care costul este constrângerea principală. Compania spune că Nano Banana 2 Lite este recomandatul înlocuitor pentru dezvoltatorii care folosesc prima versiune Nano Banana (gemini-2.5-flash-image). Ce se schimbă operațional pentru dezvoltatori Disponibilitatea este extinsă simultan pe mai multe canale, ceea ce reduce fricțiunea de implementare pentru echipele care lucrează deja în ecosistemul Google: Nano Banana 2 Lite este disponibil în Nano Banana 2 Lite , în Google AI Studio , în Gemini API și în Gemini Enterprise Agent Platform . În paralel, Google spune că modelul începe să fie introdus și în suprafețe pentru consumatori, inclusiv AI Mode din Search, aplicația Gemini , NotebookLM, Google Photos, Stitch, Google Flow și Google Ads. Gemini Omni Flash ajunge „pentru prima dată” la dezvoltatori în Gemini Omni Flash , în Google AI Studio , în Gemini API și în aceeași platformă enterprise. Modelul este disponibil și în aplicația Gemini și în Google Flow. Din perspectiva costurilor, Google precizează că Omni Flash este tarifat la 0,10 dolari pe secundă de video generat (aprox. 0,47 lei), la același nivel cu Veo 3.1 Fast. De ce contează: cost pe unitate și viteză, nu doar „calitate” Google își construiește mesajul în jurul a două constrângeri tipice în producția de media generativă: latența (timpul până la rezultat) și costul per unitate (imagine sau secundă de video). Nano Banana 2 Lite este descris ca fiind optimizat pentru „near-real-time” și volume mari, iar Omni Flash ca un model „cost-efficient” pentru generare și editare video conversațională (adică editare prin comenzi în limbaj natural). Publicația susține că cele două modele pot fi „înlanțuite” într-un flux cap-coadă: imagine generată rapid cu Nano Banana 2 Lite, apoi animată în video cu Omni Flash. Pentru experiențe cu mai multe iterații, Google menționează folosirea Interactions API pentru păstrarea contextului și istoricului sesiunii, cu până la trei editări secvențiale. Limitări declarate pentru Omni Flash Google notează explicit câteva limitări operaționale, relevante pentru planificarea produselor: generările video sunt, deocamdată, de 10 secunde , cu durate mai lungi „în curând”; încărcarea de referințe audio și „scene extension” nu sunt suportate în Gemini API pentru acest model; referințele video de până la 3 secunde sunt acceptate de schema API, dar nu sunt procesate corect de model „în acest moment”; consistența personajelor între scene sau la mișcări de panoramare are limitări, pe care compania spune că lucrează să le îmbunătățească. Siguranță și verificare a conținutului Google afirmă că Gemini Omni și Nano Banana 2 Lite folosesc SynthID (watermarking, adică marcaj invizibil pentru identificarea conținutului generat de AI) și că verificarea se poate face prin aplicația Gemini, Gemini în Chrome sau Search. Pentru dezvoltatori, concluzia practică este că Google împinge media generativă către un model de utilizare „industrială”: costuri unitare explicite, timpi de răspuns scurți și integrare directă în API-uri și instrumente enterprise, dar cu limitări încă active pe partea de video, pe care echipele trebuie să le trateze ca riscuri de produs în faza de implementare. [...]

Gemini Spark ajunge pe macOS și poate automatiza sarcini direct în fișierele de pe desktop , o extindere care mută asistentul din zona de chat către execuție efectivă de „muncă” pe calculator, potrivit Google Blog . Actualizarea vine la pachet cu mai multe integrări cu aplicații și cu o funcție de urmărire în timp real a subiectelor, inclusiv pentru știri și finanțe. macOS: automatizări pe fișiere și aplicații, cu acces pe bază de permisiuni Google spune că aduce Spark în aplicația Gemini pentru macOS pentru a automatiza „sarcini consumatoare de timp” la nivelul desktopului. Exemplul dat este sortarea automată a fișierelor PDF din folderul Downloads în directoare specifice, la cerere. O altă utilizare descrisă este legarea fișierelor locale de Google Workspace: utilizatorul poate cere crearea unui tabel de buget pe baza celor mai recente facturi salvate pe computer și programarea unor actualizări regulate. Din perspectiva controlului accesului, compania precizează că Spark „are acces doar la fișierele pentru care îi acorzi permisiunea”. Urmează execuția de sarcini de la distanță, inițiată de pe telefon Google anunță și o funcție „în curând” pentru rularea de sarcini de la distanță: utilizatorul va putea atribui din telefon o sarcină în mai mulți pași care să fie executată pe Mac cât timp nu este la computer. Ca exemplu, compania menționează că Spark ar putea căuta un raport de vânzări pe Mac, extrage cifra de venit total și trimite rezultatul pe e-mail. Disponibilitate: beta, doar pentru abonați Google AI Ultra , inițial în SUA Gemini Spark pentru macOS este disponibil în versiune beta pentru abonații Google AI Ultra cu vârsta de peste 18 ani, începând din SUA. Google indică drept punct de descărcare pagina gemini.google/mac. Integrări cu aplicații și suport pentru MCP Pe lângă macOS, Google extinde lista de „aplicații conectate” (integrări) pentru Spark. Sunt menționate: Google Tasks și Google Keep (transformarea notițelor din Keep în acțiuni în Tasks); Canva, Dropbox, Instacart, OpenTable și Zillow Rentals. Aceste integrări ar urma să se lanseze „în următoarea săptămână” pe web și mobil, iar pentru aplicația macOS „în următoarele săptămâni”. Separat, Google spune că introduce suport pentru Model Context Protocol (MCP) , care permite conectarea unor aplicații preferate direct în Spark pentru un asistent mai „personalizat” (protocolul este un mecanism de integrare care ajută un model să primească context și să interacționeze cu servicii externe). Monitorizare în timp real: inclusiv alerte și rapoarte financiare O altă schimbare este capacitatea Spark de a urmări subiecte și de a reacționa la evenimente în timp real. Google dă ca exemplu trimiterea unui „raport financiar detaliat” dacă o acțiune atinge un anumit prag. Spark poate urmări bloguri, site-uri de știri, rețele sociale, finanțe, cumpărături, vreme și sport, pe lângă e-mail. Google afirmă că actualizările încep să fie livrate „de astăzi” și promite mai multe detalii despre ce urmează pentru Spark „în această vară”. [...]

Google introduce o voce nouă în Google Maps pentru Noua Zeelandă, care pronunță corect toponimele în te reo Māori , o schimbare cu impact operațional direct pentru utilizatori și pentru calitatea serviciului de navigație, potrivit Google Blog . Actualizarea folosește un model de tip „text-to-speech” (transformă textul în vorbire) și combină engleza cu accent neozeelandez („Kiwi”) cu pronunția fidelă a denumirilor indigene. Funcția începe să fie disponibilă de astăzi și se distribuie la nivel global pe Android, iOS, Android Auto și CarPlay. Pentru a o activa, utilizatorii trebuie să își actualizeze aplicația și să seteze limba la „English (New Zealand)”. Ce se schimbă concret în utilizare Noua voce urmărește să reducă erorile de pronunție în timpul navigației, în special pentru nume de orașe și regiuni, precum „Taranaki” și „Whangārei”, menționate ca exemple în material. Din perspectiva utilizatorului, schimbarea este una de „calitate a interacțiunii”: indicațiile rămân în engleză, dar numele de locuri sunt rostite corect în te reo Māori. Cum a fost construită vocea și cine a fost implicat Google spune că a lucrat cu experți lingvistici de la Te Taura Whiri (Comisia pentru Limba Māori) și a folosit date publice ale New Zealand Geographic Board pentru a construi vocea și a calibra pronunțiile. În articol este inclusă și o declarație a lui Ngahiwi Apanui-Barr, director executiv al Te Taura Whiri, care leagă pronunția corectă de accesul la semnificațiile culturale ale toponimelor: „Numele de locuri Māori poartă povești care ne conectează la istoriile, oamenii și realizările noastre. Primul pas pentru a debloca aceste povești este pronunția corectă. Dacă putem auzi cuvintele spuse corect, putem spune cuvintele corect.” Componenta de guvernanță a datelor: suveranitatea datelor Māori Un element distinct al proiectului este modul în care Google descrie gestionarea datelor lingvistice: „suveranitatea datelor Māori” și principiile companiei privind inteligența artificială ( AI Principles ) au fost „centrale” în dezvoltarea modelului. Inițial, Te Taura Whiri ar urma să fie „kaitiaki” (gardian) al lexiconului te reo Māori, iar pe termen lung planul este crearea unui grup de custodi care să asigure accesul și beneficiile pentru mediul academic, cercetători și comunități Māori, precum și sustenabilitatea „kaupapa” (misiunii). În context, Google notează și relevanța culturală a limbii: te reo Māori este recunoscută în Noua Zeelandă drept „taonga” (comoară), este una dintre cele două limbi oficiale (alături de limbajul semnelor), iar 73% dintre neozeelandezi au spus că o consideră o parte importantă a culturii și identității țării (sondaj Verian, 2025). [...]

Google coboară costul generării de imagini la 0,034 dolari (aprox. 0,16 lei) pentru 1.000 de imagini , mizând pe volum și viteză pentru a împinge instrumentele de „media generativă” în fluxurile de lucru ale dezvoltatorilor, potrivit TechCrunch . Nano Banana 2 Lite, cea mai nouă versiune a generatorului intern de imagini și video al Google, este prezentată de companie ca fiind „semnificativ” mai rapidă și mai accesibilă decât versiunea anterioară. Google spune că modelul are o latență mai mică și poate produce imagini în patru secunde, ceea ce îl face potrivit pentru iterații rapide și pentru generarea unui număr mare de imagini într-un timp scurt. Ce se schimbă operațional: viteză + cost pentru producție la scară Din perspectiva utilizării în produse și procese, mesajul central este orientarea către fluxuri „high-volume”, unde contează mai mult timpul de răspuns și costul pe unitate decât calitatea maximă. Google descrie Nano Banana 2 Lite ca fiind optimizat pentru astfel de fluxuri rapide, în timp ce Nano Banana 2 rămâne un „cal de bătaie” generalist, iar Nano Banana Pro este poziționat ca model mai puternic și mai scump pentru cazuri avansate. Modelul este disponibil prin: Google AI Studio ; Gemini API ; platforma Gemini Enterprise Agent Platform. Google afirmă că Nano Banana 2 Lite înlocuiește modelul original Nano Banana, pe care compania îl numește acum „model legacy” (model vechi, menținut pentru compatibilitate). Context: investiții continue, în pofida reacțiilor la „conținut AI de umplutură” Lansarea vine într-un moment în care modelele de generare de imagini sunt criticate pentru „AI slop” – un termen folosit pentru conținut de calitate slabă produs în masă. Chiar și așa, companiile continuă să investească în instrumente care generează imagini și video, iar Google își promovează frecvent modelele ca instrumente utile inclusiv pentru crearea de reclame. În paralel, TechCrunch notează că legăturile dintre Hollywood și companiile de inteligență artificială se strâng, pe fondul controverselor: Google a încheiat un acord de 75 milioane de dolari (aprox. 345 milioane lei) cu studioul independent A24, parteneriat care a atras critici din partea fanilor. Pachetul mai larg: extinderea Gemini Omni Flash și un demo pentru comerț electronic Tot marți, Google a anunțat o lansare mai largă pentru Gemini Omni Flash, un model de generare video introdus inițial la Google I/O. Conform companiei, costul este de 0,10 dolari (aprox. 0,46 lei) pe secundă de video generat. Google a prezentat și o aplicație demonstrativă, Omni Product Studio, care ar transforma imagini statice generate de Omni în „clipuri cinematice” pentru comerț electronic. Într-o postare pe blog, compania își justifică strategia prin nevoia de iterație rapidă în creația asistată de modele generative: „Construirea cu media generativă înseamnă adesea iterație creativă. Cu aceste două modele, dezvoltatorii pot construi experiențe multimedia complete, de la un capăt la altul, care conectează generarea rapidă de imagini cu crearea și editarea video.” [...]

Google încearcă să mute dezbaterea despre regulile UE din zona concurenței în cea a securității datelor , avertizând că obligația de a deschide Android către alți asistenți AI și de a partaja date de căutare „anonimizate” ar putea crește riscurile de fraudă și reidentificare a utilizatorilor, potrivit Ars Technica . Miza este una de reglementare: Comisia Europeană pregătește pentru luna viitoare un set de măsuri care ar putea forța Google să „joace mai corect” cu rivalii din UE. Compania susține însă că, în forma discutată acum, schimbările ar crea breșe operaționale și de confidențialitate, chiar dacă obiectivul declarat al UE este reducerea poziției dominante a Google. Ce ar putea cere UE: acces AI pe Android și partajare de date din căutări Heather Adkins, vicepreședinte Google pentru inginerie de securitate, a declarat pentru Wired (citată de Ars Technica) că propunerile UE au două componente: Android : Gemini ar urma să nu mai fie singurul serviciu AI integrat, iar utilizatorii ar putea integra și alte modele AI cu acces de tip „la nivel de sistem”, similar cu cel de care beneficiază Gemini. Căutare : Google ar urma să partajeze cu alte companii date de căutare „anonimizate” , într-un format apropiat de cel folosit intern, inclusiv conținutul căutărilor, poziționări în rezultate și rate de click. Adkins a susținut că, dacă măsurile ar fi implementate „așa cum sunt descrise azi”, în câteva săptămâni s-ar putea vedea „o creștere semnificativă a fraudei în UE”. Riscul operațional invocat pe Android: „asistenți” malițioși cu acces extins Google argumentează că statutul special al lui Gemini pe Android îi oferă acces la fișierele utilizatorului, conținutul de pe ecran și interacțiuni vocale îmbunătățite . În logica companiei, extinderea acestui tip de acces către alți furnizori ar putea fi exploatată de actori rău intenționați, prin instalarea unor servicii AI malițioase capabile să fure date sau să manipuleze experiența de utilizare. Articolul notează că Adkins nu intră în detalii tehnice despre mecanismele de atac, dar sugerează că problema ar fi „suprafața” mai mare de risc odată cu apariția mai multor servicii cu privilegii similare. „Anonimizarea e grea”: disputa pe datele de căutare și reidentificare Partea cea mai sensibilă este partajarea de date de căutare. Conform proiectului de propunere citat, Google ar trebui să ofere competitorilor un set de date „anonimizate” cu granularitate ridicată, la un nivel care „nu a mai fost furnizat” până acum. Adkins a spus pentru Wired: „Anonimizarea este grea și trebuie să ai experții tehnici potriviți la masă ca să găsești soluțiile.” Google invocă și faptul că, odată cu disponibilitatea pe scară largă a modelelor AI puternice, de-anonimizarea (reidentificarea) seturilor mari de date ar fi mai ușoară. În plus, compania susține că echipele sale interne ar fi reușit să lege date de căutare „anonime” de utilizatori individuali în doar două ore , folosind așa-numitele „atacuri de corelare” (linkage attacks), adică tehnici care combină indicii din mai multe surse pentru a identifica persoane. Un alt argument prezentat este riscul de securitate la nivel de ecosistem: dacă datele ajung la firme mai mici, acestea ar putea deveni ținte mai ușoare pentru atacatori. Context: DMA și calendarul deciziei Demersul UE se desfășoară în cadrul Digital Markets Act (DMA) , care desemnează companii precum Google, Meta sau Amazon drept „gatekeeperi” (platforme cu rol de control asupra accesului la piețe digitale) și le impune obligații suplimentare. Potrivit articolului, perioada de comentarii s-a încheiat pe 1 mai , iar Comisia Europeană lucrează la modul de aplicare. O decizie finală este așteptată pe 27 iulie , iar aceasta ar urma să fie obligatorie din punct de vedere legal pentru Google, în calitatea sa de gatekeeper. Până atunci, detaliile despre accesul AI pe Android și despre nivelul de anonimizare cerut pentru datele de căutare rămân „în aer”. [...]