Tag: qwen2.5-coder

Știri despre „qwen2.5-coder”

Interfețe grafice inovatoare generate de inteligența artificială, cu feedback de la designeri.

Inteligență artificială07 feb. 2026

Apple testează un model open-source care depășește GPT-5 în generarea de interfețe – cheia stă în feedbackul natural oferit de designeri

Apple a demonstrat că un model de inteligență artificială open-source, ajustat cu ajutorul feedbackului direct al designerilor, poate depăși performanța GPT-5 în generarea de interfețe grafice (UI) . Studiul, publicat pe platforma de cercetare a companiei, schimbă radical modul în care este colectat feedbackul uman pentru antrenarea modelelor de limbaj: în loc de metode tradiționale precum sistemele de notare sau alegerile între variante, cercetătorii au folosit intervenții directe ale designerilor în interfețele generate de AI. Feedbackul natural bate clasificarea Cercetarea s-a bazat pe interacțiunile a 21 de designeri profesioniști care au oferit corecturi folosind metode proprii de lucru: schițare vizuală pe interfață, comentarii naturale și modificări directe în software-ul de design. Aceste acțiuni au generat 1.460 de exemple de preferințe între variante de UI, transformate apoi în date pentru antrenarea unui model AI. Evaluatorii independenți au fost de acord cu intervențiile designerilor în 76,1% din cazuri și cu schițele vizuale în 63,6%, în timp ce acordul cu alegerile bazate doar pe clasificare a fost de doar 49,2%, practic echivalent cu șansa . Astfel, cercetătorii au concluzionat că datele generate prin metode de lucru naturale sunt semnificativ mai consistente și utile pentru AI decât evaluările formale. Un model mic, dar bine învățat Folosind aceste date, echipa Apple a antrenat un model open-source, Qwen2.5-Coder, aplicând o tehnică proprie de optimizare numită ORPO. Rezultatul a fost remarcabil: modelul a depășit toate bazele de comparație, inclusiv GPT-5, în evaluări realizate de oameni în format „arena” – în care mai mulți evaluatori compară răspunsuri fără să știe ce model le-a generat. Performanța confirmă că modelele mai mici, dar fin ajustate , pot întrece sisteme mai mari și mai complexe, dacă sunt instruite cu date de calitate superioară. Studiul atrage atenția și asupra costurilor: o revizuire completă a unei interfețe de către un designer a necesitat în medie 3,45 minute, față de doar 12 secunde pentru o evaluare clasică prin alegere. Ca soluție de compromis, schițele vizuale au oferit o combinație eficientă: feedback scurt, dar profund, cu o medie de doar 42 de caractere de explicație per intervenție. Modelul antrenat de Apple este disponibil public pe GitHub , ceea ce deschide oportunități pentru comunitatea de cercetare și pentru companiile care vor să integreze astfel de sisteme în produse comerciale. [...]