Știri
Știri din categoria Inteligență artificială

Gemini Spark ajunge pe macOS și poate automatiza sarcini direct în fișierele de pe desktop, o extindere care mută asistentul din zona de chat către execuție efectivă de „muncă” pe calculator, potrivit Google Blog. Actualizarea vine la pachet cu mai multe integrări cu aplicații și cu o funcție de urmărire în timp real a subiectelor, inclusiv pentru știri și finanțe.
Google spune că aduce Spark în aplicația Gemini pentru macOS pentru a automatiza „sarcini consumatoare de timp” la nivelul desktopului. Exemplul dat este sortarea automată a fișierelor PDF din folderul Downloads în directoare specifice, la cerere.
O altă utilizare descrisă este legarea fișierelor locale de Google Workspace: utilizatorul poate cere crearea unui tabel de buget pe baza celor mai recente facturi salvate pe computer și programarea unor actualizări regulate. Din perspectiva controlului accesului, compania precizează că Spark „are acces doar la fișierele pentru care îi acorzi permisiunea”.
Google anunță și o funcție „în curând” pentru rularea de sarcini de la distanță: utilizatorul va putea atribui din telefon o sarcină în mai mulți pași care să fie executată pe Mac cât timp nu este la computer. Ca exemplu, compania menționează că Spark ar putea căuta un raport de vânzări pe Mac, extrage cifra de venit total și trimite rezultatul pe e-mail.
Gemini Spark pentru macOS este disponibil în versiune beta pentru abonații Google AI Ultra cu vârsta de peste 18 ani, începând din SUA. Google indică drept punct de descărcare pagina gemini.google/mac.
Pe lângă macOS, Google extinde lista de „aplicații conectate” (integrări) pentru Spark. Sunt menționate:
Aceste integrări ar urma să se lanseze „în următoarea săptămână” pe web și mobil, iar pentru aplicația macOS „în următoarele săptămâni”.
Separat, Google spune că introduce suport pentru Model Context Protocol (MCP), care permite conectarea unor aplicații preferate direct în Spark pentru un asistent mai „personalizat” (protocolul este un mecanism de integrare care ajută un model să primească context și să interacționeze cu servicii externe).
O altă schimbare este capacitatea Spark de a urmări subiecte și de a reacționa la evenimente în timp real. Google dă ca exemplu trimiterea unui „raport financiar detaliat” dacă o acțiune atinge un anumit prag. Spark poate urmări bloguri, site-uri de știri, rețele sociale, finanțe, cumpărături, vreme și sport, pe lângă e-mail.
Google afirmă că actualizările încep să fie livrate „de astăzi” și promite mai multe detalii despre ce urmează pentru Spark „în această vară”.
Recomandate

Google reduce costurile și timpul de generare pentru media generativă prin lansarea modelului de imagini Nano Banana 2 Lite și prin deschiderea către dezvoltatori a Gemini Omni Flash pentru generare și editare video, potrivit Google Blog . Miza practică: fluxuri de lucru mai ieftine și mai rapide pentru aplicații care produc volume mari de imagini și clipuri, cu integrare directă în instrumentele Google pentru dezvoltatori și în unele produse pentru consumatori. Nano Banana 2 Lite este prezentat drept „cel mai rapid” și „cel mai eficient ca preț” model din familia Gemini Image, orientat spre utilizare la scară (throughput ridicat) și latență mică. Google indică o latență de 4 secunde pentru ieșiri text-to-image și un cost de 0,034 dolari per imagine la rezoluție 1K (aprox. 0,16 lei), poziționând modelul ca opțiune pentru prototipare interactivă și pipeline-uri în care costul este constrângerea principală. Compania spune că Nano Banana 2 Lite este recomandatul înlocuitor pentru dezvoltatorii care folosesc prima versiune Nano Banana (gemini-2.5-flash-image). Ce se schimbă operațional pentru dezvoltatori Disponibilitatea este extinsă simultan pe mai multe canale, ceea ce reduce fricțiunea de implementare pentru echipele care lucrează deja în ecosistemul Google: Nano Banana 2 Lite este disponibil în Nano Banana 2 Lite , în Google AI Studio , în Gemini API și în Gemini Enterprise Agent Platform . În paralel, Google spune că modelul începe să fie introdus și în suprafețe pentru consumatori, inclusiv AI Mode din Search, aplicația Gemini , NotebookLM, Google Photos, Stitch, Google Flow și Google Ads. Gemini Omni Flash ajunge „pentru prima dată” la dezvoltatori în Gemini Omni Flash , în Google AI Studio , în Gemini API și în aceeași platformă enterprise. Modelul este disponibil și în aplicația Gemini și în Google Flow. Din perspectiva costurilor, Google precizează că Omni Flash este tarifat la 0,10 dolari pe secundă de video generat (aprox. 0,47 lei), la același nivel cu Veo 3.1 Fast. De ce contează: cost pe unitate și viteză, nu doar „calitate” Google își construiește mesajul în jurul a două constrângeri tipice în producția de media generativă: latența (timpul până la rezultat) și costul per unitate (imagine sau secundă de video). Nano Banana 2 Lite este descris ca fiind optimizat pentru „near-real-time” și volume mari, iar Omni Flash ca un model „cost-efficient” pentru generare și editare video conversațională (adică editare prin comenzi în limbaj natural). Publicația susține că cele două modele pot fi „înlanțuite” într-un flux cap-coadă: imagine generată rapid cu Nano Banana 2 Lite, apoi animată în video cu Omni Flash. Pentru experiențe cu mai multe iterații, Google menționează folosirea Interactions API pentru păstrarea contextului și istoricului sesiunii, cu până la trei editări secvențiale. Limitări declarate pentru Omni Flash Google notează explicit câteva limitări operaționale, relevante pentru planificarea produselor: generările video sunt, deocamdată, de 10 secunde , cu durate mai lungi „în curând”; încărcarea de referințe audio și „scene extension” nu sunt suportate în Gemini API pentru acest model; referințele video de până la 3 secunde sunt acceptate de schema API, dar nu sunt procesate corect de model „în acest moment”; consistența personajelor între scene sau la mișcări de panoramare are limitări, pe care compania spune că lucrează să le îmbunătățească. Siguranță și verificare a conținutului Google afirmă că Gemini Omni și Nano Banana 2 Lite folosesc SynthID (watermarking, adică marcaj invizibil pentru identificarea conținutului generat de AI) și că verificarea se poate face prin aplicația Gemini, Gemini în Chrome sau Search. Pentru dezvoltatori, concluzia practică este că Google împinge media generativă către un model de utilizare „industrială”: costuri unitare explicite, timpi de răspuns scurți și integrare directă în API-uri și instrumente enterprise, dar cu limitări încă active pe partea de video, pe care echipele trebuie să le trateze ca riscuri de produs în faza de implementare. [...]

Google introduce o voce nouă în Google Maps pentru Noua Zeelandă, care pronunță corect toponimele în te reo Māori , o schimbare cu impact operațional direct pentru utilizatori și pentru calitatea serviciului de navigație, potrivit Google Blog . Actualizarea folosește un model de tip „text-to-speech” (transformă textul în vorbire) și combină engleza cu accent neozeelandez („Kiwi”) cu pronunția fidelă a denumirilor indigene. Funcția începe să fie disponibilă de astăzi și se distribuie la nivel global pe Android, iOS, Android Auto și CarPlay. Pentru a o activa, utilizatorii trebuie să își actualizeze aplicația și să seteze limba la „English (New Zealand)”. Ce se schimbă concret în utilizare Noua voce urmărește să reducă erorile de pronunție în timpul navigației, în special pentru nume de orașe și regiuni, precum „Taranaki” și „Whangārei”, menționate ca exemple în material. Din perspectiva utilizatorului, schimbarea este una de „calitate a interacțiunii”: indicațiile rămân în engleză, dar numele de locuri sunt rostite corect în te reo Māori. Cum a fost construită vocea și cine a fost implicat Google spune că a lucrat cu experți lingvistici de la Te Taura Whiri (Comisia pentru Limba Māori) și a folosit date publice ale New Zealand Geographic Board pentru a construi vocea și a calibra pronunțiile. În articol este inclusă și o declarație a lui Ngahiwi Apanui-Barr, director executiv al Te Taura Whiri, care leagă pronunția corectă de accesul la semnificațiile culturale ale toponimelor: „Numele de locuri Māori poartă povești care ne conectează la istoriile, oamenii și realizările noastre. Primul pas pentru a debloca aceste povești este pronunția corectă. Dacă putem auzi cuvintele spuse corect, putem spune cuvintele corect.” Componenta de guvernanță a datelor: suveranitatea datelor Māori Un element distinct al proiectului este modul în care Google descrie gestionarea datelor lingvistice: „suveranitatea datelor Māori” și principiile companiei privind inteligența artificială ( AI Principles ) au fost „centrale” în dezvoltarea modelului. Inițial, Te Taura Whiri ar urma să fie „kaitiaki” (gardian) al lexiconului te reo Māori, iar pe termen lung planul este crearea unui grup de custodi care să asigure accesul și beneficiile pentru mediul academic, cercetători și comunități Māori, precum și sustenabilitatea „kaupapa” (misiunii). În context, Google notează și relevanța culturală a limbii: te reo Māori este recunoscută în Noua Zeelandă drept „taonga” (comoară), este una dintre cele două limbi oficiale (alături de limbajul semnelor), iar 73% dintre neozeelandezi au spus că o consideră o parte importantă a culturii și identității țării (sondaj Verian, 2025). [...]

Google coboară costul generării de imagini la 0,034 dolari (aprox. 0,16 lei) pentru 1.000 de imagini , mizând pe volum și viteză pentru a împinge instrumentele de „media generativă” în fluxurile de lucru ale dezvoltatorilor, potrivit TechCrunch . Nano Banana 2 Lite, cea mai nouă versiune a generatorului intern de imagini și video al Google, este prezentată de companie ca fiind „semnificativ” mai rapidă și mai accesibilă decât versiunea anterioară. Google spune că modelul are o latență mai mică și poate produce imagini în patru secunde, ceea ce îl face potrivit pentru iterații rapide și pentru generarea unui număr mare de imagini într-un timp scurt. Ce se schimbă operațional: viteză + cost pentru producție la scară Din perspectiva utilizării în produse și procese, mesajul central este orientarea către fluxuri „high-volume”, unde contează mai mult timpul de răspuns și costul pe unitate decât calitatea maximă. Google descrie Nano Banana 2 Lite ca fiind optimizat pentru astfel de fluxuri rapide, în timp ce Nano Banana 2 rămâne un „cal de bătaie” generalist, iar Nano Banana Pro este poziționat ca model mai puternic și mai scump pentru cazuri avansate. Modelul este disponibil prin: Google AI Studio ; Gemini API ; platforma Gemini Enterprise Agent Platform. Google afirmă că Nano Banana 2 Lite înlocuiește modelul original Nano Banana, pe care compania îl numește acum „model legacy” (model vechi, menținut pentru compatibilitate). Context: investiții continue, în pofida reacțiilor la „conținut AI de umplutură” Lansarea vine într-un moment în care modelele de generare de imagini sunt criticate pentru „AI slop” – un termen folosit pentru conținut de calitate slabă produs în masă. Chiar și așa, companiile continuă să investească în instrumente care generează imagini și video, iar Google își promovează frecvent modelele ca instrumente utile inclusiv pentru crearea de reclame. În paralel, TechCrunch notează că legăturile dintre Hollywood și companiile de inteligență artificială se strâng, pe fondul controverselor: Google a încheiat un acord de 75 milioane de dolari (aprox. 345 milioane lei) cu studioul independent A24, parteneriat care a atras critici din partea fanilor. Pachetul mai larg: extinderea Gemini Omni Flash și un demo pentru comerț electronic Tot marți, Google a anunțat o lansare mai largă pentru Gemini Omni Flash, un model de generare video introdus inițial la Google I/O. Conform companiei, costul este de 0,10 dolari (aprox. 0,46 lei) pe secundă de video generat. Google a prezentat și o aplicație demonstrativă, Omni Product Studio, care ar transforma imagini statice generate de Omni în „clipuri cinematice” pentru comerț electronic. Într-o postare pe blog, compania își justifică strategia prin nevoia de iterație rapidă în creația asistată de modele generative: „Construirea cu media generativă înseamnă adesea iterație creativă. Cu aceste două modele, dezvoltatorii pot construi experiențe multimedia complete, de la un capăt la altul, care conectează generarea rapidă de imagini cu crearea și editarea video.” [...]

Google extinde în SUA generarea de imagini „personalizate” în Gemini, folosind date din aplicațiile conectate, ceea ce ridică miza pentru controlul consimțământului și al setărilor de confidențialitate. Potrivit Google Blog , începând de astăzi, „toți utilizatorii eligibili” din Statele Unite pot accesa gratuit generarea profund personalizată de imagini în aplicația Gemini. Funcționalitatea se bazează pe „Personal Intelligence”, un mecanism prin care Gemini, cu permisiunea utilizatorului, poate folosi informații din servicii Google precum Gmail, Google Photos , YouTube și Search pentru a oferi răspunsuri mai relevante. Noutatea anunțată este conectarea acestui strat de personalizare cu „Nano Banana” și cu Google Photos, astfel încât imaginile generate să reflecte mai ușor preferințele și stilul de viață al utilizatorului, deduse din aplicațiile conectate. Din perspectivă operațională, Google susține că utilizatorii nu mai trebuie să descrie în detaliu contextul personal în prompturi (instrucțiunile text către model), putând folosi cereri mai generale, de tipul „proiectează casa visurilor mele”. În plus, compania afirmă că Gemini poate folosi imagini reale ale utilizatorului din Google Photos, reducând nevoia de încărcare manuală a fotografiilor atunci când cererea implică reprezentarea persoanei (de exemplu, „creează o ilustrație cu mine și lucrurile mele preferate”). Controlul utilizatorului rămâne pe bază de „opt-in” Google precizează că conectarea aplicațiilor Google la Gemini rămâne opțională („opt-in”) și poate fi ajustată oricând din setări. Compania trimite și la o pagină separată cu detalii despre eligibilitate, fără a include în textul principal criteriile concrete sau o listă completă a condițiilor. Extinderea este, deocamdată, limitată la SUA și la utilizatorii „eligibili”, iar anunțul nu oferă un calendar pentru alte piețe. [...]

Google încearcă să mute dezbaterea despre regulile UE din zona concurenței în cea a securității datelor , avertizând că obligația de a deschide Android către alți asistenți AI și de a partaja date de căutare „anonimizate” ar putea crește riscurile de fraudă și reidentificare a utilizatorilor, potrivit Ars Technica . Miza este una de reglementare: Comisia Europeană pregătește pentru luna viitoare un set de măsuri care ar putea forța Google să „joace mai corect” cu rivalii din UE. Compania susține însă că, în forma discutată acum, schimbările ar crea breșe operaționale și de confidențialitate, chiar dacă obiectivul declarat al UE este reducerea poziției dominante a Google. Ce ar putea cere UE: acces AI pe Android și partajare de date din căutări Heather Adkins, vicepreședinte Google pentru inginerie de securitate, a declarat pentru Wired (citată de Ars Technica) că propunerile UE au două componente: Android : Gemini ar urma să nu mai fie singurul serviciu AI integrat, iar utilizatorii ar putea integra și alte modele AI cu acces de tip „la nivel de sistem”, similar cu cel de care beneficiază Gemini. Căutare : Google ar urma să partajeze cu alte companii date de căutare „anonimizate” , într-un format apropiat de cel folosit intern, inclusiv conținutul căutărilor, poziționări în rezultate și rate de click. Adkins a susținut că, dacă măsurile ar fi implementate „așa cum sunt descrise azi”, în câteva săptămâni s-ar putea vedea „o creștere semnificativă a fraudei în UE”. Riscul operațional invocat pe Android: „asistenți” malițioși cu acces extins Google argumentează că statutul special al lui Gemini pe Android îi oferă acces la fișierele utilizatorului, conținutul de pe ecran și interacțiuni vocale îmbunătățite . În logica companiei, extinderea acestui tip de acces către alți furnizori ar putea fi exploatată de actori rău intenționați, prin instalarea unor servicii AI malițioase capabile să fure date sau să manipuleze experiența de utilizare. Articolul notează că Adkins nu intră în detalii tehnice despre mecanismele de atac, dar sugerează că problema ar fi „suprafața” mai mare de risc odată cu apariția mai multor servicii cu privilegii similare. „Anonimizarea e grea”: disputa pe datele de căutare și reidentificare Partea cea mai sensibilă este partajarea de date de căutare. Conform proiectului de propunere citat, Google ar trebui să ofere competitorilor un set de date „anonimizate” cu granularitate ridicată, la un nivel care „nu a mai fost furnizat” până acum. Adkins a spus pentru Wired: „Anonimizarea este grea și trebuie să ai experții tehnici potriviți la masă ca să găsești soluțiile.” Google invocă și faptul că, odată cu disponibilitatea pe scară largă a modelelor AI puternice, de-anonimizarea (reidentificarea) seturilor mari de date ar fi mai ușoară. În plus, compania susține că echipele sale interne ar fi reușit să lege date de căutare „anonime” de utilizatori individuali în doar două ore , folosind așa-numitele „atacuri de corelare” (linkage attacks), adică tehnici care combină indicii din mai multe surse pentru a identifica persoane. Un alt argument prezentat este riscul de securitate la nivel de ecosistem: dacă datele ajung la firme mai mici, acestea ar putea deveni ținte mai ușoare pentru atacatori. Context: DMA și calendarul deciziei Demersul UE se desfășoară în cadrul Digital Markets Act (DMA) , care desemnează companii precum Google, Meta sau Amazon drept „gatekeeperi” (platforme cu rol de control asupra accesului la piețe digitale) și le impune obligații suplimentare. Potrivit articolului, perioada de comentarii s-a încheiat pe 1 mai , iar Comisia Europeană lucrează la modul de aplicare. O decizie finală este așteptată pe 27 iulie , iar aceasta ar urma să fie obligatorie din punct de vedere legal pentru Google, în calitatea sa de gatekeeper. Până atunci, detaliile despre accesul AI pe Android și despre nivelul de anonimizare cerut pentru datele de căutare rămân „în aer”. [...]

Google ar fi început să limiteze accesul Meta la modelul Gemini din cauza lipsei de capacitate de calcul , iar blocajul riscă să întârzie proiecte interne de inteligență artificială la Meta, potrivit IT Home , care citează un articol din Financial Times . Meta ar fi cerut de la Google o cantitate de resurse de calcul (putere de procesare necesară pentru rularea și antrenarea modelelor de inteligență artificială) peste ceea ce compania putea livra. Conform informațiilor, Alphabet (compania-mamă a Google) ar fi transmis în jurul lunii martie că nu poate acoperi necesarul Meta pentru Gemini, iar acest deficit ar fi afectat calendarul mai multor inițiative interne, unele fiind amânate. Efect operațional: proiecte întârziate și raționalizarea consumului de „tokeni” În urma restricțiilor, Meta ar fi cerut angajaților să economisească „tokeni” (unitatea de bază folosită pentru a măsura consumul în servicii de inteligență artificială, în special la utilizarea modelelor lingvistice mari). Măsura sugerează o presiune directă asupra bugetelor și planificării de produs, atunci când accesul la infrastructura necesară nu mai este garantat la nivelul cerut. Financial Times mai notează că și alți clienți ai Google ar fi fost afectați, însă într-o măsură mai mică; Meta ar fi resimțit cel mai puternic impactul, tocmai din cauza volumului ridicat de resurse solicitate. Context: investiții de miliarde, dar „gâtul de sticlă” rămâne Deși marile companii tehnologice investesc de ani buni miliarde de dolari în achiziții de cipuri și în construirea de centre de date, piața încă se confruntă cu un deficit de capacitate care să țină pasul cu cererea în creștere pentru servicii de inteligență artificială, potrivit aceleiași relatări. În acest context, IT Home menționează că veniturile Google Cloud au ajuns la 20 de miliarde de dolari (aprox. 92 miliarde lei) în trimestrul I, până în martie. Totuși, CEO-ul Google, Sundar Pichai, a indicat că limitările de capacitate au frânat o creștere mai rapidă și au contribuit la acumularea de comenzi restante, care ar fi crescut aproape dublu față de trimestrul anterior. Ce urmează Dacă restricțiile de capacitate persistă, companiile mari care depind de furnizori externi pentru acces la modele și infrastructură ar putea fi nevoite să își recalibreze planurile: fie prin prioritizarea proiectelor și reducerea consumului, fie prin diversificarea furnizorilor sau accelerarea investițiilor proprii în infrastructură. În material nu sunt oferite detalii despre durata limitărilor sau despre un calendar de revenire la capacitatea solicitată. [...]