Inteligență artificială02 iul. 2026
Google DeepMind lansează Nano Banana 2 Lite și deschide Gemini Omni Flash pentru dezvoltatori - costuri declarate de 0,034 dolari/1.000 de imagini și 0,10 dolari/secundă video
Google reduce costurile și timpul de generare pentru media generativă prin lansarea modelului de imagini Nano Banana 2 Lite și prin deschiderea către dezvoltatori a Gemini Omni Flash pentru generare și editare video, potrivit Google Blog . Miza practică: fluxuri de lucru mai ieftine și mai rapide pentru aplicații care produc volume mari de imagini și clipuri, cu integrare directă în instrumentele Google pentru dezvoltatori și în unele produse pentru consumatori. Nano Banana 2 Lite este prezentat drept „cel mai rapid” și „cel mai eficient ca preț” model din familia Gemini Image, orientat spre utilizare la scară (throughput ridicat) și latență mică. Google indică o latență de 4 secunde pentru ieșiri text-to-image și un cost de 0,034 dolari per imagine la rezoluție 1K (aprox. 0,16 lei), poziționând modelul ca opțiune pentru prototipare interactivă și pipeline-uri în care costul este constrângerea principală. Compania spune că Nano Banana 2 Lite este recomandatul înlocuitor pentru dezvoltatorii care folosesc prima versiune Nano Banana (gemini-2.5-flash-image). Ce se schimbă operațional pentru dezvoltatori Disponibilitatea este extinsă simultan pe mai multe canale, ceea ce reduce fricțiunea de implementare pentru echipele care lucrează deja în ecosistemul Google: Nano Banana 2 Lite este disponibil în Nano Banana 2 Lite , în Google AI Studio , în Gemini API și în Gemini Enterprise Agent Platform . În paralel, Google spune că modelul începe să fie introdus și în suprafețe pentru consumatori, inclusiv AI Mode din Search, aplicația Gemini , NotebookLM, Google Photos, Stitch, Google Flow și Google Ads. Gemini Omni Flash ajunge „pentru prima dată” la dezvoltatori în Gemini Omni Flash , în Google AI Studio , în Gemini API și în aceeași platformă enterprise. Modelul este disponibil și în aplicația Gemini și în Google Flow. Din perspectiva costurilor, Google precizează că Omni Flash este tarifat la 0,10 dolari pe secundă de video generat (aprox. 0,47 lei), la același nivel cu Veo 3.1 Fast. De ce contează: cost pe unitate și viteză, nu doar „calitate” Google își construiește mesajul în jurul a două constrângeri tipice în producția de media generativă: latența (timpul până la rezultat) și costul per unitate (imagine sau secundă de video). Nano Banana 2 Lite este descris ca fiind optimizat pentru „near-real-time” și volume mari, iar Omni Flash ca un model „cost-efficient” pentru generare și editare video conversațională (adică editare prin comenzi în limbaj natural). Publicația susține că cele două modele pot fi „înlanțuite” într-un flux cap-coadă: imagine generată rapid cu Nano Banana 2 Lite, apoi animată în video cu Omni Flash. Pentru experiențe cu mai multe iterații, Google menționează folosirea Interactions API pentru păstrarea contextului și istoricului sesiunii, cu până la trei editări secvențiale. Limitări declarate pentru Omni Flash Google notează explicit câteva limitări operaționale, relevante pentru planificarea produselor: generările video sunt, deocamdată, de 10 secunde , cu durate mai lungi „în curând”; încărcarea de referințe audio și „scene extension” nu sunt suportate în Gemini API pentru acest model; referințele video de până la 3 secunde sunt acceptate de schema API, dar nu sunt procesate corect de model „în acest moment”; consistența personajelor între scene sau la mișcări de panoramare are limitări, pe care compania spune că lucrează să le îmbunătățească. Siguranță și verificare a conținutului Google afirmă că Gemini Omni și Nano Banana 2 Lite folosesc SynthID (watermarking, adică marcaj invizibil pentru identificarea conținutului generat de AI) și că verificarea se poate face prin aplicația Gemini, Gemini în Chrome sau Search. Pentru dezvoltatori, concluzia practică este că Google împinge media generativă către un model de utilizare „industrială”: costuri unitare explicite, timpi de răspuns scurți și integrare directă în API-uri și instrumente enterprise, dar cu limitări încă active pe partea de video, pe care echipele trebuie să le trateze ca riscuri de produs în faza de implementare. [...]