Inteligență artificială14 mai 2026
Xiaomi publică și open-source OneVL, un cadru de inferență în spațiul latent pentru conducere autonomă - Lei Jun susține că unifică VLA și „modelul lumii” și îmbunătățește viteza și acuratețea
Xiaomi a publicat și a făcut open-source framework-ul OneVL pentru raționament „în spațiul latent”, mizând pe o accelerare a dezvoltării modelelor pentru conducere autonomă prin unificarea, într-o singură arhitectură, a modelelor VLA (vision-language-action, adică modele care leagă percepția vizuală și limbajul de acțiuni) și a „modelului lumii” (o reprezentare internă a mediului), potrivit IT之家 . Declarațiile îi aparțin lui Lei Jun , fondator, președinte și CEO Xiaomi, care susține că OneVL este primul din industrie care face această unificare prin inferență în spațiul latent. Miza practică a anunțului este una operațională: Xiaomi încearcă să reducă barierele de intrare pentru cercetare și implementare, punând la dispoziție atât greutățile modelului (parametrii antrenați), cât și codul de antrenare și inferență. În același timp, compania își poziționează soluția ca o alternativă mai eficientă la abordări de tip „chain-of-thought” (CoT, raționament în pași expliciți), printr-o variantă „latent CoT” (raționament comprimat în reprezentări interne, fără pași textualizați). Ce susține Xiaomi că aduce OneVL Conform descrierii din material, OneVL urmărește să combine mai multe direcții tehnice într-un singur cadru: unificarea VLA, a „modelului lumii” și a inferenței în spațiul latent; creșterea vitezei și a preciziei, pe baza unei capacități de raționament pe care Xiaomi o compară cu cea a unui „XLA model” (termen folosit în textul sursă, fără detalii suplimentare în articol); performanțe care, potrivit afirmațiilor companiei, depășesc „CoT explicit” la precizie și se aliniază ca viteză cu predicția de tip „doar răspunsul” („only-answer”). Lei Jun mai afirmă că OneVL „ridică plafonul” performanței pentru metodele de raționament latent pe mai multe benchmark-uri uzuale de inferență și planificare, fără ca articolul să includă valori numerice sau numele acelor teste. Ce a fost publicat: raport tehnic, pagină de proiect, cod Xiaomi a publicat resursele asociate proiectului, inclusiv documentație și cod: raport tehnic: https://arxiv.org/abs/2604.18486 pagina proiectului: https://xiaomi-embodied-intelligence.github.io/OneVL cod open-source: https://github.com/xiaomi-research/onevl În mesajul citat de IT之家 , Lei Jun spune că invită dezvoltatori și cercetători din întreaga lume să exploreze „mai multe posibilități” pentru modelele mari dedicate conducerii autonome, în contextul în care compania a ales să publice integral modelul și instrumentele de lucru. [...]