Inteligență artificială14 iun. 2026
Google integrează Gemini 3.5 Live Translate în Google Translate și Google Meet - traducere vocală aproape în timp real în peste 70 de limbi și extindere treptată în Workspace
Google extinde masiv traducerea vocală în Meet și Translate, trecând de la câteva limbi la peste 70 , pe baza noului model audio Gemini 3.5 Live Translate , potrivit HDSatelit . Miza este una operațională: traducerea devine mai rapidă și mai „naturală” în conversații, pentru utilizare pe telefon și în întâlniri online, cu latență redusă. Modelul, prezentat de Google ca un sistem „audio-la-audio”, ar detecta automat peste 70 de limbi și ar genera o voce tradusă care păstrează intonația și ritmul vorbitorului. Diferența față de abordările clasice este că traducerea nu mai așteaptă finalul frazei, ci este produsă continuu, aproape în timp real. Google Meet: de la 5 limbi la peste 70 și peste 2.000 de combinații În Google Meet, actualizarea ar urma să ducă traducerea vocală de la cele 5 limbi suportate anterior la peste 70 de limbi și la mai mult de 2.000 de combinații lingvistice într-o singură întâlnire. Google mai spune că va simplifica interfața, astfel încât funcția să fie mai ușor de accesat direct din platformă. Lansarea începe „în această lună” pentru clienți selectați Google Workspace , printr-un „private preview” (acces limitat pentru testare), iar extinderea mai largă este programată pentru mai târziu în acest an. Google Translate: Live translate pe Android și iOS, cu un mod nou de ascultare pe Android Pe partea de Google Translate, modelul va fi disponibil pe Android și iOS, fiind legat de funcția „Live translate” din aplicație. Conform paginii de ajutor a Google Translate, Live translate poate fi folosit cu sau fără căști pe telefon sau tabletă și include multe limbi suportate, inclusiv româna. Noutatea menționată pentru Android este un „listening mode” prin difuzorul de apeluri, astfel încât utilizatorul poate asculta traducerea direct prin receptor, ca la un apel obișnuit, fără să aibă neapărat căști. Pentru dezvoltatori: acces în preview și limitele tipice ale traducerii audio Pentru dezvoltatori, Google a deschis Gemini 3.5 Live Translate în preview prin Gemini Live API și Google AI Studio. „Model card”-ul oficial îl descrie ca un model bazat pe Gemini 3 Pro, cu intrare audio și ieșire audio plus text; documentația menționează și parametri precum context audio de până la 128K tokeni și output de până la 64K tokeni (tokenii sunt unități folosite de modele pentru a „măsura” volumul de informație procesat). Tot în documentație sunt menționate limitări uzuale: pot exista variații de voce, dificultăți la accente, la limbi asemănătoare sau la treceri rapide între mai multe limbi. Etichetarea conținutului generat: SynthID pentru audio Google afirmă că sunetul produs de modelele sale este marcat cu SynthID, un „watermark” (marcaj) imperceptibil introdus în fișierul audio, care ar rămâne detectabil chiar dacă materialul este distribuit sau transformat. În contextul traducerilor vocale automate, această etichetare ar putea conta pentru identificarea conținutului generat de inteligență artificială și pentru evitarea confuziilor privind proveniența audio-ului. [...]