Tehnologie10 iun. 2026
Google lansează modelul Gemini 3.5 Live Translate pentru traducere vocală în timp real - disponibil în Google Translate și Google Meet, cu suport pentru peste 70 de limbi
Google duce traducerea vocală în timp real mai aproape de utilizarea de masă , după ce a lansat modelul audio Gemini 3.5 Live Translate, care recunoaște peste 70 de limbi și ajunge direct în aplicația Google Translate pentru Android și iOS, potrivit IT之家 . Modelul este gândit să reducă întârzierile tipice traducerii „pe rând”, în care sistemul așteaptă ca vorbitorul să termine fraza înainte să traducă. Gemini 3.5 Live Translate generează audio continuu și încearcă să echilibreze două obiective aflate în tensiune: să aștepte suficient context pentru o traducere mai bună, dar și să răspundă rapid ca să țină pasul cu ritmul vorbirii. În conversație, traducerea ar rămâne fluentă, fără pauze incomode, cu un decalaj de doar câteva secunde față de vorbitor. Un element operațional important este că modelul nu se limitează la „a spune” traducerea, ci încearcă să păstreze caracteristici ale vocii originale – intonația, viteza și înălțimea (pitch-ul) – pentru ca rezultatul să sune mai natural. Unde va fi disponibil și pentru cine Din 9 iunie (ora Beijingului), Gemini 3.5 Live Translate începe să fie integrat treptat în produse Google, în mai multe „canale” de acces: Dezvoltatori : prin Gemini Live API și Google AI Studio , în regim de „public preview” (previzualizare publică). Clienți enterprise : din această lună, în Google Meet , ca „private preview” (previzualizare privată). Utilizatori obișnuiți : prin aplicația Google Translate pe Android și iOS . Publicația notează că funcția va ajunge în aplicația Google Translate la nivel global. Ce se schimbă în utilizare: căști, zgomot și un nou „mod de ascultare” Pentru utilizatorii finali, scenariul descris este simplu: la folosirea traducerii în timp real, conectarea oricăror căști ar permite o traducere mai cursivă în peste 70 de limbi, cu o voce tradusă mai apropiată de tonul vorbitorului. Pe partea de robustețe, modelul ar include și rezistență mai bună la zgomot , pentru a funcționa în medii aglomerate sau imprevizibile, și poate gestiona intrări multilingve fără ajustări manuale ale setărilor. Pentru Android , Google pregătește și un nou „mod de ascultare” bazat pe 3.5 Live Translate: utilizatorul poate ține telefonul la ureche „ca la un apel” și poate asculta traducerea prin difuzorul pentru convorbiri, util când nu are căști și nu vrea ca cei din jur să audă traducerea. Unde ar putea fi folosit de companii și dezvoltatori IT之家 menționează că dezvoltatorii pot integra modelul în scenarii precum: apeluri și convorbiri multilingve, ședințe și conferințe, cursuri, transmisiuni live și difuzare (broadcast), cu obiectivul de a oferi o experiență de interpretariat în timp real. [...]