Tehnologie26 mai 2026
Xiaomi Auto prezintă cadrul „Xiaomi Auto World Model” pentru modele de lume în condus asistat - integrează reconstrucția 3D cu generarea video și raportează rezultate SOTA pe Waymo și nuScenes
Xiaomi Auto susține că a obținut rezultate de top (SOTA) pe benchmark-uri-cheie pentru „world models” în conducerea asistată , după ce a prezentat un nou cadru care cuplează într-o singură arhitectură reconstrucția 3D și generarea video, potrivit IT Home . Miza este una operațională: compania spune că modelul este deja folosit în producție pentru date sintetice, simulare și instruirea utilizatorilor, adică exact zonele care pot accelera dezvoltarea și validarea funcțiilor de asistență la condus. Xiaomi descrie cadrul „Xiaomi Auto World Model” ca o schimbare de abordare pentru modelele de tip „world model” (modele care încearcă să reprezinte și să anticipeze evoluția unei scene), împingând industria de la „percepția scenelor” către „raționament cognitiv și evoluția scenelor”. Elementul central este integrarea strânsă între două direcții tehnice folosite în prezent separat: reconstrucția (WorldRec) și generarea (WorldGen). De ce contează integrarea reconstrucție + generare În varianta Xiaomi, reconstrucția 3D și generarea video se constrâng reciproc: reconstrucția oferă geometria 3D ca „ancoră” structurală, iar generarea extinde predicția dincolo de ceea ce a fost observat de senzori. Compania susține că această buclă închisă aduce câștiguri pe trei axe: stabilitate mai bună , prin reducerea acumulării erorilor și a „derivelor” în secvențe lungi; consistență mai bună , printr-o reprezentare 4D a scenei folosită ca memorie între cadre; realism mai bun , deoarece generarea folosește imagini RGB randate din reconstrucție ca schelet geometric, reducând diferența dintre simulare și realitate. Rezultate raportate și unde spune Xiaomi că folosește deja modelul Xiaomi afirmă că a obținut SOTA (state of the art, adică cel mai bun rezultat raportat) pe benchmark-uri mainstream precum Waymo și nuScenes . Publicația nu oferă în material valori numerice sau metrici, ci doar concluzia de performanță. Pe partea de implementare, compania spune că a făcut deja „business landing” (adoptare în utilizare internă) în trei scenarii: Generare de date sintetice: livrarea a peste 100.000 de clipuri de date sintetice de calitate, folosite direct la antrenarea modelelor de percepție, cu scopul de a îmbunătăți recunoașterea în scenarii periculoase. Testare în simulare: un mediu de simulare „în buclă închisă” pentru eficientizarea testării și pentru reproducerea accidentelor reale în simulare, în vederea optimizării țintite. „Școala” de conducere asistată: generarea dinamică de videoclipuri de instruire din perspectivă la volan; Xiaomi spune că funcția este deja disponibilă pentru toate modelele sale, în modul „simulare pe scenă reală”. Pentru detalii tehnice, Xiaomi indică o pagină de proiect și lucrarea științifică asociată: JointWM și lucrarea pe arXiv . [...]