Știri
Știri din categoria Inteligență artificială

Google mută Gemini spre „agenți” care lucrează în fundal, 24/7, prin introducerea Gemini Spark și a unui nou „Daily Brief”, într-o schimbare care duce aplicația din zona de răspunsuri la întrebări către automatizare de sarcini în ecosistemul Workspace, potrivit Google.
Pe lângă componenta de „agent” (software care poate executa pași și fluxuri de lucru în numele utilizatorului), compania anunță o interfață refăcută („Neural Expressive”), un nou model „Gemini 3.5 Flash”, capabilități de generare video prin „Gemini Omni” și o aplicație pentru macOS care va integra Spark.
Noutatea cu impact operațional este Gemini Spark, descris ca un agent personal care poate rula în cloud și poate continua să lucreze chiar și când utilizatorul închide laptopul sau blochează telefonul. Google spune că Spark este integrat cu instrumente Workspace precum Gmail, Docs și Slides și urmărește să preia sarcini mai complexe, nu doar să ofere răspunsuri.
Exemplele de utilizare indicate includ:
Google precizează că Spark „operează sub direcția” utilizatorului: acesta decide dacă îl activează și la ce aplicații se conectează, iar agentul ar trebui să ceară confirmare înainte de acțiuni cu miză mare, precum cheltuirea de bani sau trimiterea de e-mailuri.
Spark urmează să fie disponibil inițial pentru „testeri de încredere” în această săptămână, iar compania spune că plănuiește o lansare Beta pentru abonații Google AI Ultra din SUA „săptămâna viitoare”.
În paralel, Google anunță extinderea listei de aplicații conectate prin noi conexiuni MCP către Canva, OpenTable și Instacart, disponibile „de astăzi”. În „următoarele săptămâni”, Spark ar urma să poată folosi aceste conexiuni pentru a duce sarcinile la capăt. Pe foaia de parcurs pentru vară mai apar: posibilitatea de a trimite mesaje text și e-mailuri către Spark, crearea de „sub-agenți” personalizați și operarea browserului local.
Google introduce și „Daily Brief”, un agent care, după activarea de către utilizator, rulează în fundal peste aplicațiile conectate și compilează un rezumat de dimineață: actualizări urgente din Gmail, evenimente din Calendar și detalii de follow-up. Compania susține că nu este doar un rezumat, ci prioritizează în funcție de obiective și poate sugera pași următori. Daily Brief începe să fie disponibil „de astăzi” pentru abonații Google AI Plus, Pro și Ultra, inițial în SUA.
Separat, „Neural Expressive” este noul limbaj de design al aplicației, cu animații, culori, tipografie și feedback haptic. Google mai spune că a integrat experiența „Gemini Live” direct în aplicație și că urmează să ofere dialecte regionale. Neural Expressive se lansează global „de astăzi” pe web, Android și iOS.
„Gemini Omni” este prezentat ca un model care combină intrări text, imagini și video pentru a produce clipuri video de calitate, inclusiv cu șabloane și opțiuni precum zoom „cinematic” sau schimbarea fundalului. Omni începe să fie disponibil „de astăzi” pentru abonații Google AI Plus, Pro și Ultra la nivel global (detalii suplimentare în materialul dedicat Gemini Omni). Google menționează și posibilitatea creării unui „avatar AI” personalizat (detalii: AI avatar).
Pentru macOS, Google spune că aplicația Gemini este disponibilă la descărcare (link: download) și că, „în această vară”, va primi integrarea Spark pentru sarcini care implică fișiere locale și automatizări pe desktop, plus funcții noi de voce care folosesc contextul de pe ecran pentru a transforma vorbirea liberă în texte „precise”, direct la cursor.
Recomandate

Google își mută miza pe „agenți” AI care execută sarcini, nu doar răspund la întrebări , iar la I/O 2026 a legat această direcție de Search, Gemini și o nouă platformă de dezvoltare, potrivit Google Blog . Pentru utilizatori și companii, schimbarea contează prin promisiunea de automatizare mai agresivă (căutare, cumpărături, productivitate), dar și prin dependența mai mare de ecosistemul Google (cont, aplicații conectate, abonamente). Modele noi: viteză, cost și trecerea la conținut video generat Google a lansat Gemini 3.5 Flash , descris ca primul model dintr-o serie care combină „inteligență de vârf” cu capacitatea de a acționa. Compania spune că modelul este disponibil pe scară largă prin platforma sa „agent-first” (orientată către agenți) Google Antigravity, prin Gemini API în Google AI Studio și în Android Studio. În material sunt menționate și rezultate pe benchmark-uri pentru programare și agenți (Terminal-Bench 2.1, GDPval-AA și MCP Atlas), precum și poziționarea în indexul Artificial Analysis. Google susține că 3.5 Flash poate reduce semnificativ timpul de lucru pentru sarcini „pe termen lung” (de la zile/săptămâni la o fracțiune) și că poate fi „adesea la mai puțin de jumătate din costul” altor modele de vârf, fără a detalia metodologia sau comparațiile. Separat, Google a prezentat Gemini Omni , un model care pornește de la generare video și care ar urma, „în timp”, să poată produce „orice ieșire din orice intrare”. Compania afirmă că videoclipurile generate includ SynthID , un filigran digital „imperceptibil”, care ar permite verificarea conținutului în aplicația Gemini, în Chrome și în Search. Search devine o platformă de execuție: AI Mode, agenți și interfețe generate din mers Pe zona de căutare, Google spune că AI Mode (modul său de „AI Search”) a depășit 1 miliard de utilizatori lunar și că, de acum, Gemini 3.5 Flash devine modelul implicit la nivel global . Tot aici, compania afirmă că interogările în AI Mode s-au dublat în fiecare trimestru de la lansare și că, în trimestrul anterior, Search a atins un maxim istoric al numărului de căutări (fără a oferi valori absolute). Schimbarea operațională majoră este trecerea de la căutare ca listă de rezultate la căutare ca „agent”: „Information agents” : agenți care rulează „în fundal 24/7”, monitorizează web-ul și date proaspete (inclusiv informații în timp real despre finanțe, cumpărături și sport) și trimit actualizări sintetizate, cu posibilitatea de a acționa. Lansarea este indicată „în această vară”, inițial pentru abonații Google AI Pro și Ultra. „Generative UI” cu Antigravity : Search ar putea construi „formatul ideal” pentru întrebare, generând interfețe (tabele, grafice, simulări) în timp real. Google spune că funcția ajunge în Search „în această vară” pentru toată lumea, gratuit, iar „mini-aplicațiile” pentru sarcini recurente ar urma să fie introduse în lunile următoare, începând cu abonații. În paralel, Google extinde Personal Intelligence în AI Mode către mai mulți utilizatori, în aproape 200 de țări și teritorii și 98 de limbi, fără abonament, cu posibilitatea de conectare „în siguranță” la aplicații precum Gmail și Google Photos (și „în curând” Google Calendar). Compania insistă că utilizatorul controlează dacă și când conectează aceste aplicații. Comerț: „Universal Cart” și checkout mai strâns legat de Google Google introduce Universal Cart , un coș de cumpărături care ar urma să funcționeze ca „hub” pentru cumpărături pe Google: adăugare de produse din Search, conversații cu Gemini, YouTube sau chiar Gmail, cu monitorizare de reduceri, istoric de preț și alerte de stoc. Coșul este construit pe Google Wallet și ar folosi raționament pentru a semnala incompatibilități între produse și a sugera alternative. Pentru finalizarea cumpărăturilor, Google menționează Universal Commerce Protocol (UCP) , care ar permite checkout „în câteva atingeri” cu Google Pay sau transferul produselor către site-ul retailerului. Lansarea Universal Cart este programată „în această vară” în Search și aplicația Gemini, urmând ca YouTube și Gmail să fie adăugate ulterior. Aplicația Gemini: agenți personali și funcții pe bază de abonament În aplicația Gemini, Google a prezentat Gemini Spark , un „agent personal 24/7” care poate rula în fundal pe telefon sau laptop și care ar fi proiectat să ceară confirmare înainte de acțiuni majore. Spark este descris ca fiind într-o etapă foarte timpurie; Google spune că îl oferă inițial unor testeri de încredere și că plănuiește o versiune beta pentru abonații Google AI Ultra din SUA. Tot în Gemini, Daily Brief este un agent care „lucrează peste noapte” și pregătește un rezumat al zilei pe baza inboxului, calendarului și sarcinilor. Funcția începe să fie disponibilă pentru abonații Google AI (18+) în SUA, cu condiția conectării aplicațiilor Google. Platforma pentru dezvoltatori: Antigravity ca „sistem de operare” pentru agenți Pentru dezvoltatori și companii, Google împinge Google Antigravity ca platformă unificată pentru dezvoltare „agent-first”, cu: Antigravity 2.0 , aplicație desktop pentru interacțiune cu agenți și orchestrare multi-agent; Antigravity CLI , variantă pentru terminal; Antigravity SDK , acces programatic și posibilitatea de a găzdui agenți pe infrastructura proprie. Google afirmă că își propune să unifice experiența și să migreze utilizatorii de la Gemini CLI către Antigravity CLI, oferind și un ghid de portare. Pentru zona enterprise, compania spune că Antigravity va putea fi conectat direct la proiecte Google Cloud și că va fi distribuit către clienții Gemini Enterprise „în lunile următoare”. Ce urmează și ce rămâne neclar Calendarul comunicat de Google indică o serie de lansări „în această vară” și „în lunile următoare”, cu diferențiere tot mai puternică între utilizatorii gratuiti și abonați (Pro/Ultra) pentru funcțiile de agenți și automatizare. În același timp, unele afirmații cu impact economic (de exemplu, „adesea la mai puțin de jumătate din cost”) nu sunt însoțite de detalii comparabile sau de metodologii, ceea ce limitează evaluarea independentă a beneficiilor. [...]

Google își extinde automatizarea în Workspace, cu funcții AI care pot prelua sarcini din e-mail și documente potrivit Google Workspace , care anunță noi capabilități bazate pe inteligență artificială în Gmail, Docs și Keep, plus un agent personal „24/7” numit Gemini Spark. Miza practică pentru companii este mutarea de la AI care „ajută” la AI care poate acționa în numele utilizatorului, cu impact direct asupra modului în care sunt gestionate comunicarea, redactarea și organizarea muncii. Google spune că peste 4 miliarde de utilizatori folosesc aplicațiile Workspace (Gmail, Docs, Drive) și poziționează noile funcții ca instrumente de productivitate, disponibile fie prin abonamentele Google AI, fie în regim de „preview” (acces anticipat) pentru clienții business. Voce în Gmail, Docs și Keep: căutare, redactare și organizare „hands-free” Pachetul de funcții conversaționale cu voce vizează trei aplicații: Gmail Live : căutare în inbox prin comenzi vocale și răspunsuri „sintetizate” (rezumate/compilate) din e-mailuri, pentru situații în care utilizatorul e „în mișcare”. Exemplele din anunț includ întrebări precum „care e poarta de îmbarcare?” sau „ce se întâmplă la școala copilului săptămâna asta?”. Docs Live : dictare și redactare asistată, cu Gemini în rol de „partener de idei” care structurează un document și, cu permisiunea utilizatorului, poate extrage detalii relevante din Gmail, Drive, Chat și de pe web. Keep : transformă un „brain dump” (o înșiruire de idei spusă liber) în notițe și liste organizate. Aceste funcții sunt în curs de lansare pentru abonații Google AI Pro și Ultra și vor fi disponibile „în această vară” în preview pentru clienții business Google Workspace . AI Inbox: Gmail trece de la prioritizare la execuție Google extinde AI Inbox cu funcții orientate spre acțiune, nu doar spre triere. Noile capabilități includ: ciorne de răspuns personalizate (draft replies) pentru e-mailuri care cer un răspuns rapid; acces instant la fișiere relevante (linkuri către Docs/Sheets/Slides) afișate lângă sarcina asociată; gestionare mai simplă a sarcinilor , inclusiv marcarea ca „rezolvat”, eliminarea sugestiilor neutile sau marcarea ca citite a tuturor mesajelor dintr-un subiect. AI Inbox este disponibil pentru abonații Google AI Ultra și în preview pentru clienții Google Workspace Enterprise Plus . Tot acum începe extinderea către abonații Google AI Plus și Pro din SUA, împreună cu aceste actualizări. Gemini Spark: agent personal care „acționează în numele tău”, cu frâne pentru acțiuni sensibile Anunțat la Google I/O , Gemini Spark este descris ca un agent personal disponibil „24/7”, care marchează o schimbare: de la un asistent care răspunde la întrebări la unul care poate executa acțiuni în numele utilizatorului, „sub direcția” acestuia. Google precizează că utilizatorul alege dacă îl activează și că Spark este proiectat să ceară confirmare înainte de acțiuni cu miză mare, precum trimiterea de e-mailuri sau adăugarea de evenimente în calendar. Pentru clienții business, Gemini Spark în Google Workspace ar urma să fie disponibil „în curând” în preview, în aplicația Gemini. Google Pics: editare și generare de imagini, integrată în aplicațiile Workspace Google lansează și Google Pics , un instrument de creare și editare de imagini construit pe modelul „Nano Banana”, cu accent pe control fin în editare. Printre funcțiile enumerate: segmentare de obiecte (selectarea și modificarea unor elemente fără a afecta restul imaginii); editare și traducere de text în imagini , păstrând designul și stilul fontului; integrare în Workspace , începând cu Slides și Drive; colaborare prin „canvase” partajabile, editabile simultan. Google Pics este disponibil inițial pentru un grup limitat de „Trusted Testers”, iar „în această vară” ar urma să fie lansat global pentru abonații Google AI Pro și Ultra și în preview pentru clienții business. În ansamblu, anunțul indică o accelerare a integrării AI în fluxurile de lucru din Workspace, cu o diferență importantă: unele funcții nu se opresc la recomandări sau redactare, ci sunt construite să ducă sarcinile mai aproape de execuție, în special prin AI Inbox și Gemini Spark. [...]

Google mută accentul de la „asistenți” la agenți AI care execută sarcini , o schimbare cu impact direct asupra modului în care companiile își pot automatiza fluxurile de lucru și pot construi produse noi, potrivit colecției de anunțuri de la I/O 2026 publicate de Google Workspace . Mesajul central: AI-ul nu mai este prezentat doar ca instrument de redactare sau generare de conținut, ci ca „agent” care poate acționa în numele utilizatorului. În același material, Google spune că lansează două modele noi: Gemini Omni și Gemini 3.5. Gemini Omni este descris ca un model care „poate crea orice din orice tip de intrare”, pornind de la video, și ca un pas înainte în înțelegerea lumii, lucrul cu mai multe tipuri de date (multimodalitate) și editare. Gemini 3.5 Flash este prezentat drept primul dintr-o nouă familie de modele care combină „inteligența de vârf” cu capacitatea de a întreprinde acțiuni. De ce contează pentru companii: automatizare mai aproape de execuție Unghiul operațional al anunțurilor este trecerea „dincolo de unelte care doar ajută la scris” către agenți care „ajută la acțiune”, printr-o platformă de dezvoltare orientată pe agenți, numită Google Antigravity. Google susține că, prin acești agenți, „oricine poate fi un constructor”, indicând o țintă mai largă decât comunitatea clasică de dezvoltatori: echipe de produs, marketing, operațiuni sau utilizatori avansați din companii. Materialul nu oferă, în această pagină de colecție, detalii tehnice despre integrare, disponibilitate pe regiuni sau condiții comerciale; acestea ar urma să fie în articolele individuale din colecție. Agenți integrați în produse: căutare, aplicația Gemini și cumpărături Google afirmă că „deblochează agenți și experiențe agentice” în mai multe produse, cu exemple punctuale: „agenți de informare” în Search; Gemini Spark și Daily Brief în aplicația Gemini; lansarea Universal Cart , descris ca „un coș de cumpărături cu adevărat inteligent”. Direcția indicată este extinderea AI-ului din zona de răspunsuri și recomandări către inițierea și coordonarea de acțiuni (de exemplu, în comerț), ceea ce poate schimba atât experiența utilizatorilor, cât și modul în care comercianții și platformele își gestionează conversia și relația cu clienții. Extinderea Gemini și noi „formate” de utilizare Google mai spune că „scalează” Gemini în produse, de la Google Pics la „ochelari inteligenți” și Ask YouTube, cu scopul de a crea experiențe noi și de a se extinde către noi „form factors” (categorii de dispozitive). În colecție este menționat și faptul că „ochelarii inteligenți” ar urma să vină „în această toamnă”, fără alte detalii în pagina de sinteză. În ansamblu, colecția I/O 2026 conturează o repoziționare: AI-ul este prezentat ca infrastructură de execuție (agenți) și ca strat transversal peste produse, nu doar ca funcție izolată. Pentru mediul de afaceri, miza imediată este cât de repede aceste capabilități ajung în instrumente de lucru și în fluxuri comerciale, și în ce condiții de control și integrare vor fi disponibile. [...]

Google pregătește „Android Halo”, o interfață care arată în timp real ce face un agent AI pe telefon , cu scopul de a face mai ușor de urmărit progresul sarcinilor fără a întrerupe utilizatorul, potrivit Google Workspace . Funcția, prezentată în avanpremieră pe 19 mai 2026, oferă „vizibilitate dintr-o privire” asupra activității agentului: utilizatorul poate vedea când agentul lucrează la o sarcină, intră în „mod live” sau trimite un mesaj. Diferența operațională, așa cum o descrie compania, este că informația apare discret în partea de sus a ecranului, astfel încât progresul poate fi urmărit „din orice ecran”, fără a opri activitatea curentă. Ce se schimbă, concret, în utilizarea agenților AI pe Android Android Halo este gândit ca un strat de comunicare permanent vizibil, care aduce statusul agentului în zona superioară a ecranului. În practică, asta înseamnă că interacțiunea cu agentul nu mai depinde exclusiv de deschiderea unei aplicații sau de comutarea între ferestre, ci devine un element de „monitorizare” continuă în interfața telefonului. Disponibilitate și compatibilitate anunțată Google spune că Android Halo va fi disponibil „mai târziu în acest an” și va funcționa cu Gemini Spark și „alți agenți acceptați” (fără a detalia lista). Totodată, compania precizează că, pe „cele mai avansate dispozitive” care includ Gemini Intelligence , Android Halo va oferi capabilități suplimentare. Google nu a comunicat încă ce dispozitive vor fi considerate „cele mai avansate”, ce condiții tehnice sunt necesare și nici ce funcții suplimentare vor fi activate prin Gemini Intelligence, menționând doar că va reveni cu detalii mai târziu în 2026. [...]

Google a introdus discret limite mai stricte pentru abonații plătiți Gemini , iar schimbarea a declanșat reacții negative din partea utilizatorilor care spun că plătesc pentru un serviciu devenit mai imprevizibil, potrivit Android Headlines . Miza este una operațională: când „plătit” nu mai înseamnă acces stabil, produsul devine mai greu de folosit în scenarii profesionale și mai dificil de justificat ca abonament. Noile restricții vizează utilizarea (așa-numitele „usage limits”, adică plafoane de consum), iar problema semnalată este că acestea ar fi fost înăsprite fără o comunicare suficient de vizibilă pentru clienții existenți. În practică, utilizatorii pot ajunge mai repede la un prag după care accesul la anumite funcții este limitat sau încetinit, chiar dacă au un plan plătit. De ce contează: „abonament” cu acces variabil Pentru un produs de inteligență artificială folosit la muncă, predictibilitatea contează la fel de mult ca performanța. Dacă limitele se schimbă din mers, utilizatorii nu mai pot estima: cât pot folosi serviciul într-o zi/săptămână; dacă pot baza procese interne pe el (de exemplu, redactare, analiză, rezumare); ce primesc efectiv pentru prețul plătit, în condițiile în care accesul poate fi „tăiat” mai devreme decât se așteptau. În acest context, reacția abonaților nu este doar una de nemulțumire „de produs”, ci una legată de raportul cost–beneficiu și de încrederea în condițiile comerciale. Ce urmează Materialul indică un val de nemulțumiri în rândul abonaților Gemini Pro, pe fondul acestor limite mai stricte. Dacă Google nu clarifică public și detaliat ce s-a schimbat și cum se aplică plafoanele, riscul imediat este creșterea ratei de renunțare la abonament și migrarea către alternative percepute ca mai transparente în privința limitelor de utilizare. [...]

Google extinde Project Genie către abonații AI Ultra și îl leagă de Street View , ceea ce mută prototipul din zona de demonstrație către un instrument mai ușor de folosit la scară globală pentru simulări „ancorate” în locuri reale, potrivit Google Blog . Noutatea este o funcție de „grounding” (ancorare) în imagini din Google Street View: modelul poate genera medii virtuale interactive pornind de la imagini din lumea reală, astfel încât agenți AI sau, potențial, roboți să poată „naviga” și interacționa într-un cadru mai apropiat de realitate. Google spune că Genie a fost folosit ca instrument de cercetare și că a ajutat inclusiv Waymo la simularea unor medii rutiere „hiper-realiste”. Ce aduce integrarea cu Street View În Project Genie, utilizatorul poate selecta un loc (deocamdată doar din SUA) printr-un marcaj de tip „pin” din Maps și poate alege opțional un stil vizual (de exemplu „Desert Sands”, „Stone Age”, „Ocean World” sau „B&W film”). Apoi descrie un personaj, iar sistemul generează o lume imaginară în care punctul de start este legat de imagistica reală din Street View. Google precizează că această capabilitate folosește „Maps Imagery Grounding”, aceeași tehnologie utilizată de dezvoltatori pentru a crea vizualuri generate de AI pe baza imaginilor Street View. Disponibilitatea Street View în Project Genie este „acum” pentru locuri din SUA, cu planuri de extindere către alte zone „în timp”. Acces: inclus în abonamentul Google AI Ultra de 200 de dolari Începând cu 19 mai 2026, Project Genie (inclusiv noua funcție bazată pe Street View) intră într-un proces de lansare graduală către „toți abonații eligibili” Google AI Ultra, la prețul de 200 de dolari (aprox. 920 lei) pe lună, la nivel global, pentru utilizatori de 18+ ani. Google subliniază că Project Genie rămâne un prototip experimental de cercetare în Google Labs și că lucrează la îmbunătățirea detaliilor și a acurateții, menționând existența unor limitări curente (fără a le detalia în textul sursă inclus aici). De ce contează pentru piață Mutarea funcției către un abonament comercial scump (AI Ultra) sugerează o direcție de monetizare pentru modele de tip „world model” (modele care generează și simulează medii), cu utilizări posibile în testare, instruirea agenților AI și simulări. În același timp, restricția inițială la locații din SUA indică faptul că extinderea globală a funcției depinde de pași operaționali ulteriori, pe care Google îi descrie doar la nivel de intenție („în timp”). [...]