Tag: invatare continua ai

Știri despre „invatare continua ai”

ByteDance explorează noi metode de învățare pentru agenți AI în medii reale.

Inteligență artificială04 iul. 2026

ByteDance susține că a identificat o nouă „scaling law” pentru agenți AI - ritmul de învățare s-ar putea dubla la fiecare trei luni prin interacțiune cu mediul real

ByteDance susține că a găsit o „lege de scalare” care ar permite agenților AI să-și accelereze învățarea după lansare , o direcție cu miză economică directă pentru industrie, în condițiile în care îmbunătățirea modelelor prin „mai multe date și mai multă putere de calcul” începe să-și arate limitele, potrivit South China Morning Post . Într-o lucrare publicată joi, echipa Seed AI a ByteDance arată că agenții AI (software autonom care execută sarcini în numele unui om) își pot dubla viteza de învățare la fiecare trei luni, dacă interacționează cu medii din lumea reală pe perioade îndelungate. Concluzia este prezentată ca o alternativă la metoda dominantă din ultimii ani: creșterea seturilor de date și a resurselor de calcul în faza de antrenare inițială. Contextul este presiunea tot mai mare asupra „scalării” tradiționale. Publicația notează că voci influente din industrie, inclusiv cofondatorul OpenAI Andrej Karpathy, au avertizat că abordarea de tip „forță brută” nu poate continua la nesfârșit. În paralel, institutul american de cercetare Epoch AI a avertizat că datele publice, generate de oameni, sub formă de text, ar putea fi epuizate în următorii șase ani, ceea ce amplifică nevoia de căi alternative de progres. Ce au măsurat cercetătorii ByteDance și cum Pentru a studia cum „învață” agenții după ce sunt deja utilizați (post-deployment), echipa a dezvoltat EdgeBench, un set de evaluare cu 134 de sarcini „ultra-lungi”, care acoperă domenii precum inginerie software, descoperire științifică, matematică formală și muncă profesională bazată pe cunoaștere. Fiecare sarcină cere cel puțin 12 ore de operare continuă a agentului AI. Cercetătorii au înregistrat 38.000 de ore de interacțiune cu mediul pentru a evalua cinci modele „de vârf”, inclusiv: Anthropic Claude Opus 4.8; OpenAI GPT 5.5 și GPT 5.4; modele ale companiilor chineze Zhipu AI și DeepSeek. De ce contează: o cale de creștere când pre-antrenarea încetinește Datele obținute ar indica faptul că performanța unui agent urmează o curbă matematică „foarte predictibilă”, sugerând că abilitățile pot continua să crească într-un mod previzibil prin experiență practică, chiar dacă beneficiile pre-antrenării (pre-training) se estompează. În lucrare, echipa ByteDance argumentează că „învățarea după lansare din medii bogate ar putea merita aceeași atenție sistematică de scalare pe care a primit-o pre-antrenarea”. Miza operațională este că agenții integrați în scenarii reale – de la software pentru companii la cercetare științifică și proiecte de inginerie – nu se pot baza doar pe cunoștințele „statice” din antrenarea inițială, ci ar trebui să evolueze continuu „la locul de muncă”. Rămâne, însă, o zonă insuficient înțeleasă în industrie, chiar și pe fondul orientării tot mai accentuate către „agentic AI”: modul în care aceste sisteme autonome învață din mediile reale după implementare. ByteDance își poziționează rezultatele ca un pas spre standardizarea și măsurarea acestui tip de progres. [...]