Știri
Știri din categoria Inteligență artificială

Google a lansat Nano Banana 2, noua versiune a modelului său de generare imagini cu inteligență artificială, cunoscut și ca Gemini 3.1 Flash Image, cu îmbunătățiri semnificative la capitolul viteză, precizie și procesare a textului, potrivit Mobilissimo.ro.
Noua versiune îl înlocuiește pe Nano Banana Pro în cadrul modelelor Gemini Fast, Thinking și Pro și vine la pachet cu Gemini 3.1 Pro, lansat recent. Modelul este deja disponibil în aplicațiile Google, atât pe mobil, cât și pe desktop, iar integrarea în Google Search și în funcții precum Circle to Search este așteptată în perioada următoare.

Potrivit prezentării, modelul oferă:
Google susține că modelul poate menține coerența pentru până la 5 personaje într-o scenă și fidelitatea pentru până la 14 obiecte într-un flux de lucru, ceea ce îl face mai potrivit pentru proiecte vizuale complexe.

Ca și în cazul altor modele AI ale companiei, conținutul generat este marcat cu watermark SynthID, pentru a indica faptul că este produs cu ajutorul inteligenței artificiale.

Lansarea confirmă strategia Google de a accelera dezvoltarea și integrarea modelelor Gemini în cât mai multe produse și servicii, într-un context de competiție intensă pe piața AI.

Recomandate

Google își mută agentul de „cercetare” spre fluxuri de lucru enterprise, permițând conectarea la date proprietare și generarea nativă de grafice odată cu lansarea Deep Research și Deep Research Max , construite pe modelul Gemini 3.1 Pro , potrivit IT之家 . Noile versiuni marchează o schimbare de poziționare: de la un instrument orientat în principal spre rezumate și căutare, la o componentă de bază pentru procese de lucru în companii, cu accent pe acces la surse de date specializate și pe livrarea rezultatelor în formate vizuale „gata de folosit”. Două moduri de utilizare: interactiv vs. „în fundal” Conform descrierii citate de publicație dintr-o postare Google din 21 aprilie, Deep Research este gândit pentru scenarii interactive, unde contează echilibrul între viteză și eficiență. Deep Research Max vizează fluxuri de lucru asincrone, rulate în fundal, precum generarea de rapoarte detaliate de tip due diligence (analiză aprofundată înaintea unei decizii de investiție sau achiziție), unde obiectivul este „cea mai mare acoperire” și calitatea maximă a sintezei. Pentru varianta Max, Google indică utilizarea unei „capacități extinse de calcul în timpul testării” (test-time compute), pentru raționare iterativă, căutare și rafinare. Conectare la surse de date proprietare prin MCP Elementul cu impact operațional direct este extinderea surselor de date pe care agentul le poate folosi. Ambele versiuni, bazate pe Gemini 3.1 Pro, pot: căuta pe web; accesa orice server MCP la distanță (MCP este un mecanism de conectare la servicii/surse externe, menționat în material ca modalitate de integrare sigură); folosi fișiere încărcate de utilizator; conecta spații de stocare de fișiere deja legate. Prin MCP, utilizatorii pot conecta agentul, „în siguranță”, la fluxuri profesionale de date — de exemplu date financiare sau de piață — astfel încât acesta să poată naviga baze de date specializate, nu doar să funcționeze ca un motor de căutare pe internet. Ieșiri vizuale și control mai bun al procesului Pe partea de rezultate, agentul poate genera nativ grafice și infografice de calitate, pentru vizualizarea dinamică a datelor complexe, potrivit informațiilor preluate de IT之家. La nivel de control și transparență, sunt menționate funcții precum planificare colaborativă, un set extins de instrumente, o bază de cercetare multimodală și ieșire în timp real (streaming). Utilizatorii pot revizui, ghida și optimiza planul de cercetare înainte de execuție și pot combina instrumente precum Google Search, servere MCP la distanță și execuție de cod. [...]

Meta își extinde supravegherea internă a muncii pentru a genera date de antrenare IA , printr-un instrument care va rula pe computerele și aplicațiile interne și va înregistra activitatea angajaților, inclusiv tastele apăsate și clicurile de mouse, potrivit G4Media . Miza operațională este dublă: compania își accelerează dezvoltarea de inteligență artificială folosind date „din producție”, dar crește și presiunea asupra angajaților într-un moment în care sunt așteptate noi reduceri de personal. Instrumentul a fost comunicat angajaților marți și, conform informațiilor din material, va înregistra activitatea din sistemele interne pentru a fi folosită ca set de date la antrenarea tehnologiei de inteligență artificială. BBC a aflat că activitatea angajaților pe un computer Meta ar fi fost accesibilă companiei și înainte, însă utilizarea explicită a urmăririi și înregistrării în scop de instruire și îmbunătățire a instrumentelor IA este elementul nou. Ce se schimbă în practică Din descrierea din articol, noul instrument ar urma să ruleze pe: computerele angajaților Meta; aplicațiile interne ale companiei, și să înregistreze activitatea acestora pentru a o transforma în date de antrenare pentru modele de inteligență artificială. Reacțiile interne citate de BBC indică tensiuni: un angajat care a cerut anonimatul a descris situația drept „foarte distopică”, iar o persoană care a părăsit recent compania a spus că este „doar cea mai recentă modalitate prin care ne impun IA pe gât”. Context: reduceri de personal și înghețarea angajărilor Schimbarea vine pe fondul restructurărilor. Meta a concediat deja aproximativ 2.000 de angajați în acest an, în valuri mai mici, iar angajații se așteaptă la pierderi de locuri de muncă mai mari în lunile următoare, conform articolului. Totodată, luna trecută compania a adoptat o înghețare parțială a angajărilor, care „pare să aibă o amploare mai mare”: site-ul de recrutare folosit de Meta afișa aproximativ 800 de anunțuri în martie, iar acum promovează doar șapte. Un purtător de cuvânt al Meta a refuzat să comenteze eliminarea anunțurilor sau planurile de reduceri, potrivit materialului. De ce contează pentru business Din perspectivă operațională, Meta încearcă să-și alimenteze rapid proiectele de inteligență artificială cu date generate din activitatea internă, într-un moment în care Mark Zuckerberg s-a angajat să crească cheltuielile pentru IA în acest an și să poziționeze compania în fruntea tehnologiei. În același timp, măsura amplifică riscurile de climat intern și de retenție a talentelor, mai ales pe fondul concedierilor și al înghețării angajărilor descrise în articol. [...]

OpenAI a extins capabilitățile de generare de imagini din ChatGPT, adăugând căutare online și posibilitatea de a crea până la 8 imagini coerente dintr-un singur prompt , o schimbare care poate reduce semnificativ timpul și costul de producție pentru serii vizuale (benzi desenate, postări în social media, randări de design), potrivit IT之家 . Noul instrument se numește ChatGPT Images 2.0 și este construit pe modelul GPT Image 2 . Principala noutate este introducerea unei „capacități de gândire” (în sensul descris de OpenAI ca raționare înainte de generare), care permite sistemului să planifice structura imaginii înainte de a o produce. Ce se schimbă operațional: „gândire” + căutare online + analiză de fișiere Conform descrierii citate, atunci când utilizatorul activează „gândirea”, generatorul de imagini poate: să caute informații pe internet; să folosească fișiere încărcate pentru a crea conținut de analiză vizuală; să facă o planificare prin raționament a structurii imaginii înainte de generare. Funcția este disponibilă în acest moment pentru abonații ChatGPT Plus, Pro, Business și Enterprise. Producție în serie: până la 8 imagini per prompt, cu consistență între cadre În zona de generare multi-imagine, Images 2.0 poate produce dintr-o singură comandă până la 8 imagini. Elementul cu impact practic este că sistemul poate păstra consecvența personajelor, obiectelor și a stilului în scene diferite, ceea ce vizează direct fluxurile de lucru în care utilizatorii au nevoie de „cadre” multiple din aceeași poveste vizuală. OpenAI susține că această consistență reduce pragul de dificultate pentru: pagini de benzi desenate; serii de imagini pentru social media; propuneri de design interior. Calitate și limbaj: 2K, formate mai largi și text mai bun în mai multe limbi Pe partea de calitate, noua versiune suportă rezoluție de până la 2K și extinde raportul de aspect până la 3:1 și 1:3. Totodată, sunt menționate optimizări pentru stiluri precum pixel art, benzi desenate și cadre „cinematografice”. La capitolul multilingv, instrumentul îmbunătățește generarea de text în chineză, japoneză, coreeană, hindi și bengaleză. (Sursa nu oferă detalii despre performanță sau metrici de evaluare pentru aceste îmbunătățiri.) [...]

Google a adus în România Pomelli, un instrument de marketing cu inteligență artificială pentru afaceri mici , care poate genera rapid materiale de „brand” – de la imagini cu produse până la campanii pentru rețele sociale – reducând munca necesară pentru producția de conținut, potrivit Știrile ProTV . Pomelli este disponibil „începând din aceste zile” și în alte piețe europene (Uniunea Europeană, Norvegia, Elveția și Marea Britanie). Instrumentul funcționează, deocamdată, în limba engleză, inclusiv la nivelul interfeței, însă utilizatorii pot edita și adapta conținutul pentru română. Ce schimbă pentru micile afaceri: producția de conținut devine un proces automatizat Platforma este prezentată ca un ajutor pentru firmele mici care nu au echipe dedicate de marketing sau bugete consistente pentru creație, dar au nevoie de materiale coerente de comunicare. Pomelli automatizează procesul în trei pași: Analiză : scanează site-ul companiei pentru a identifica detalii despre afacere, precum comunicarea de brand, mesajele, fonturile și culorile; Generare de propuneri : sugerează idei de conținut personalizat și campanii, iar utilizatorul poate explora opțiunile și prin comenzi conversaționale; Creație : generează imagini și clipuri video „de înaltă calitate” pentru social media, site sau reclame, care pot fi editate și descărcate direct. Limitări și disponibilitate În forma actuală, Pomelli generează text doar în engleză , ceea ce înseamnă că firmele care comunică preponderent în română vor avea un pas suplimentar de lucru: traducerea și adaptarea mesajelor. Instrumentul are și o versiune mobilă , optimizată pentru utilizarea de pe telefon, ceea ce îl face mai ușor de folosit în activitatea de zi cu zi a antreprenorilor și a echipelor mici. Pomelli a fost creat ca experiment de Google Labs , în parteneriat cu Google DeepMind , mai notează materialul. [...]

Posibila numire a lui John Ternus la conducerea Apple ar muta accentul strategiei AI spre dispozitive , nu doar spre modele și servicii, iar asta poate conta direct în competiția cu rivalii care împing masiv „AI în cloud”, potrivit unei analize publicate de CNET . Textul pornește de la ideea că un CEO cu profil puternic de „hardware” (adică orientat spre proiectarea și integrarea componentelor și a produsului final) ar putea fi un avantaj pentru planurile Apple în inteligență artificială, tocmai pentru că diferențiatorul companiei a fost istoric combinația strânsă dintre dispozitive, software și servicii. De ce contează pentru AI: controlul asupra „cutiei” în care rulează tehnologia În logica CNET, AI-ul Apple are mai multe șanse să se distingă dacă este împachetat în produse și funcții care rulează eficient pe dispozitivele companiei, unde Apple controlează atât arhitectura hardware, cât și sistemele de operare. Un lider format în zona de hardware ar înclina natural spre această abordare: optimizare la nivel de dispozitiv, integrare și livrare de funcții AI ca parte din experiența produsului. Această direcție ar putea susține o strategie în care AI-ul nu este perceput ca un „add-on” (o funcție adăugată ulterior), ci ca o componentă proiectată împreună cu produsul. Limitările informației din sursă Materialul CNET este un comentariu/analiză și nu oferă, în fragmentul disponibil, detalii operaționale verificabile despre un plan concret de implementare, termene sau investiții. De asemenea, nu sunt prezentate cifre sau indicatori financiari care să permită o evaluare a impactului economic pe termen scurt. În consecință, concluzia rămâne una de interpretare editorială: un CEO „de hardware” ar putea fi potrivit pentru o strategie AI centrată pe dispozitive, însă direcția efectivă depinde de deciziile companiei și de execuție. [...]

Google își mobilizează conducerea și resursele interne pentru a recupera decalajul față de Anthropic la „agenți” de programare , potrivit TechRadar , care relatează despre un memo intern atribuit cofondatorului Sergey Brin și despre formarea unui „strike team” dedicat îmbunătățirii capabilităților Gemini în „agentic execution” (execuție autonomă de sarcini, în special scriere și finalizare de cod). Miza este una operațională: dacă Gemini rămâne în urmă la agenți care pot produce „cod final”, Google riscă să piardă viteză în dezvoltarea internă de software și, pe termen mai lung, în cursa pentru automatizarea muncii de cercetare în AI. „Strike team” pentru agenți de cod: presiune pe Gemini Conform unui reportaj The Information, citat de TechRadar, Google ar fi creat o echipă specială („strike team”) pentru a contracara progresul Anthropic și al agentului său Claude Code . În memo-ul menționat, Brin le-ar fi transmis inginerilor și cercetătorilor AI că Google trebuie să reducă rapid diferența: „Pentru a câștiga sprintul final, trebuie să reducem urgent decalajul în execuția agentică și să transformăm modelele noastre în dezvoltatori principali” ai codului final. Aceeași relatare susține că Sergey Brin și Koray Kavukcuoglu, director tehnologic la Google DeepMind, ar fi implicați direct în acest efort, semnalând importanța proiectului la nivelul conducerii. De ce e posibil să nu ajungă la public Direcția pare să fie, în primul rând, îmbunătățirea capacității Gemini de a lucra cu codul intern al Google. Asta ar crește performanța instrumentelor folosite de inginerii și cercetătorii companiei, însă ar reduce șansele ca rezultatul să fie lansat rapid ca produs public: dacă un agent este antrenat pe cod proprietar, publicarea lui devine dificilă. TechRadar notează totuși că instrumentele interne îmbunătățite „ar putea teoretic” să ajute ulterior la construirea unor modele mai bune care să poată fi lansate public. Context: „AI takeoff” și automatizarea cercetării Dincolo de competiția directă cu Anthropic, The Information (citat de TechRadar) indică un obiectiv mai ambițios: „AI takeoff”, adică sisteme AI capabile să se îmbunătățească. În această logică, un agent avansat de programare, combinat cu AI care rezolvă probleme de matematică și rulează experimente, ar putea automatiza la scară mare munca cercetătorilor și inginerilor AI. În acest moment, rămâne neclar dacă rezultatele „strike team”-ului vor fi vizibile în produse pentru utilizatorii externi sau vor rămâne, cel puțin inițial, un avantaj strict intern. [...]