Știri
Știri din categoria Inteligență artificială

Google integrează „computer use” direct în Gemini 3.5 Flash, ceea ce mută automatizarea de tip agent din zona de demo în fluxuri de lucru enterprise. Potrivit Google Blog, funcția care permite unui model să „vadă, raționeze și acționeze” în interfețe (browser, mobil, desktop) devine un instrument încorporat în Gemini 3.5 Flash, după ce fusese disponibilă separat ca model dedicat „Gemini 2.5 computer use”.
Integrarea contează operațional pentru companii și dezvoltatori deoarece reduce fragmentarea: în loc să combine modele și instrumente diferite, pot folosi același model „Flash” pentru apeluri de funcții (function calling) și pentru utilizarea de instrumente integrate (precum ancorarea în Search și Maps), plus controlul efectiv al unui computer. Google susține că 3.5 Flash oferă „cea mai bună performanță de până acum” pentru sarcini de tip „agentic computer use” (automatizări în care agentul execută pași multipli în timp).
Google indică faptul că dezvoltatorii și companiile pot începe să folosească „computer use” în 3.5 Flash prin două canale:
În termeni practici, capabilitatea este poziționată pentru sarcini „de cursă lungă” (long-horizon), unde un agent trebuie să parcurgă mai multe etape și aplicații, inclusiv în automatizări de business. Exemplele menționate includ testare software continuă și muncă de tip „knowledge work” în aplicații profesionale.
Google pune accent pe riscul de „prompt injection” (când un agent este manipulat prin instrucțiuni ascunse/indirecte în conținutul pe care îl procesează) și spune că folosește antrenare adversarială țintită pentru a reduce aceste vulnerabilități în Gemini 3.5 Flash.
În plus, compania anunță două sisteme opționale de protecție pentru mediul enterprise, care pot:
Google recomandă o abordare „defense-in-depth” (apărare în profunzime), combinând aceste măsuri cu izolare în sandbox (mediu controlat), verificare umană („human-in-the-loop”) și controale stricte de acces.
Compania indică faptul că există deja clienți care „obțin valoare” din această capabilitate și direcționează dezvoltatorii către testare într-un mediu demo găzduit de Browserbase și către implementări de referință și documentație prin canalele Gemini API și platforma enterprise. Articolul nu oferă detalii despre prețuri, disponibilitate pe regiuni sau praguri de acces, dincolo de aceste puncte de intrare.