Inteligență artificială25 iun. 2026
Google integrează „computer use” direct în Gemini 3.5 Flash - dezvoltatorii pot construi agenți care acționează în browser, mobil și desktop prin Gemini API
Google integrează „computer use” direct în Gemini 3.5 Flash, ceea ce mută automatizarea de tip agent din zona de demo în fluxuri de lucru enterprise. Potrivit Google Blog , funcția care permite unui model să „vadă, raționeze și acționeze” în interfețe (browser, mobil, desktop) devine un instrument încorporat în Gemini 3.5 Flash, după ce fusese disponibilă separat ca model dedicat „Gemini 2.5 computer use”. Integrarea contează operațional pentru companii și dezvoltatori deoarece reduce fragmentarea: în loc să combine modele și instrumente diferite, pot folosi același model „Flash” pentru apeluri de funcții (function calling) și pentru utilizarea de instrumente integrate (precum ancorarea în Search și Maps), plus controlul efectiv al unui computer. Google susține că 3.5 Flash oferă „cea mai bună performanță de până acum” pentru sarcini de tip „agentic computer use” (automatizări în care agentul execută pași multipli în timp). Ce se schimbă pentru dezvoltatori și echipele IT Google indică faptul că dezvoltatorii și companiile pot începe să folosească „computer use” în 3.5 Flash prin două canale: Gemini API , pentru integrare în aplicații și servicii; Gemini Enterprise Agent Platform , pentru scenarii enterprise. În termeni practici, capabilitatea este poziționată pentru sarcini „de cursă lungă” (long-horizon), unde un agent trebuie să parcurgă mai multe etape și aplicații, inclusiv în automatizări de business. Exemplele menționate includ testare software continuă și muncă de tip „knowledge work” în aplicații profesionale. Miza de risc: protecții contra „ prompt injection ” în medii reale Google pune accent pe riscul de „prompt injection” (când un agent este manipulat prin instrucțiuni ascunse/indirecte în conținutul pe care îl procesează) și spune că folosește antrenare adversarială țintită pentru a reduce aceste vulnerabilități în Gemini 3.5 Flash. În plus, compania anunță două sisteme opționale de protecție pentru mediul enterprise, care pot: cere confirmare explicită a utilizatorului pentru acțiuni sensibile sau ireversibile; opri automat sarcina dacă este identificată o tentativă de prompt injection indirect. Google recomandă o abordare „defense-in-depth” (apărare în profunzime), combinând aceste măsuri cu izolare în sandbox (mediu controlat), verificare umană („human-in-the-loop”) și controale stricte de acces. Ce urmează Compania indică faptul că există deja clienți care „obțin valoare” din această capabilitate și direcționează dezvoltatorii către testare într-un mediu demo găzduit de Browserbase și către implementări de referință și documentație prin canalele Gemini API și platforma enterprise. Articolul nu oferă detalii despre prețuri, disponibilitate pe regiuni sau praguri de acces, dincolo de aceste puncte de intrare. [...]