Inteligență artificială16 apr. 2026
Boston Dynamics îmbunătățește câinele robot Spot cu AI-ul Google pentru citirea manometrelor și termometrelor - Colaborarea cu Google DeepMind crește precizia de la 23% la 98% în sarcinile de inspecție
Integrarea Gemini în roboți industriali duce citirea instrumentelor analogice aproape de nivel „utilizabil în teren” , ceea ce poate reduce erorile și timpul pierdut în inspecții de rutină în fabrici și depozite, potrivit Ars Technica . Modelul Google DeepMind Gemini Robotics-ER 1.6 , anunțat pe 14 aprilie, este descris ca un model de „raționament de nivel înalt” pentru roboți, capabil să planifice și să execute sarcini. În practică, una dintre îmbunătățirile cu impact operațional direct este citirea mai precisă a instrumentelor analogice precum termometrele și manometrele, dar și efectuarea de inspecții vizuale prin „sight glasses” (ferestre transparente pentru verificarea interiorului rezervoarelor și conductelor). De ce contează pentru operațiunile din industrie Boston Dynamics testează Spot ca „inspector” mobil în facilități industriale, inclusiv în fabrici auto ale Hyundai Motor Group (proprietarul companiei). Astfel de inspecții cer „raționament vizual complex”, pentru a interpreta: mai multe ace indicatoare pe cadrane, niveluri de lichid, limite ale recipientelor, gradații și marcaje, text prezent pe instrumente. În acest context, creșterea acurateții la citirea instrumentelor poate însemna mai puține verificări manuale și o automatizare mai credibilă a rondurilor de control. Ce aduce nou Gemini Robotics-ER 1.6 Google DeepMind leagă saltul de performanță de o funcție numită „agentic vision” (viziune „agentică”), care combină raționamentul vizual cu capacitatea de a executa cod pentru a crea un fel de „ciornă vizuală” („visual scratchpad”) folosită la analizarea și manipularea imaginilor. Conform datelor prezentate, „agentic vision” ar fi ridicat performanța la citirea instrumentelor de la 23% în Gemini Robotics-ER 1.5 la 98% în Gemini Robotics-ER 1.6. Ca reper, modelul Gemini 3.0 Flash ar fi atins 67% acuratețe. Chiar și fără „agentic vision”, varianta de bază a Gemini Robotics-ER 1.6 ar ajunge la 86% acuratețe la citirea instrumentelor, printr-un proces de „indicarea” elementelor din imagine pentru a rezolva sarcini complexe (de exemplu numărare sau identificarea elementelor relevante). Modelul ar include și o îmbunătățire numită „multi-view reasoning”, care ar permite folosirea mai multor fluxuri video de la camere pentru o înțelegere mai bună a mediului. [...]