Știri
Știri din categoria Inteligență artificială

Modelele AI „de ultimă generație” pot da greș la sarcini de birou simple, iar asta împinge companiile spre modele mai mici, mai ieftine și mai rapide, pe fondul presiunii de a scala aplicațiile la volume mari de utilizare, potrivit South China Morning Post, care îl citează pe David Meyer, senior vice-president of product la Databricks.
Executivul spune că trăsăturile care fac un model „state-of-the-art” (Sota) performant la probleme complexe pot deveni un dezavantaj în munca de birou. Exemplul dat: pus să identifice un număr greșit pe o factură, un astfel de model „de multe ori corectează greșeala”, în loc să extragă eroarea pentru a fi reparată ulterior în fluxul de lucru.
Diferența de performanță nu se limitează la sarcini administrative. Meyer afirmă că, deși modele avansate precum Claude (Anthropic) sunt puternice la programare, pot rămâne în urmă la „data engineering” (inginerie de date) față de modele cu antrenament și date mult mai specializate pe această zonă. În context, ingineria de date înseamnă transformarea seturilor de date la scară și operațiuni de curățare, inclusiv tratarea valorilor lipsă și a zerourilor.
În viziunea lui Meyer, concluzia e una practică: nu există un singur model, indiferent cât de mare, care să fie la fel de bun la toate.
„Un singur model, indiferent cât de mare, nu poate fi la fel de bun la toate.”
Ca alternativă, Meyer indică folosirea unor modele open-source mai mici, rafinate cu „reinforcement learning” (învățare prin recompensă), pentru scopuri specifice. Avantajul invocat este costul de antrenare „cu ordine de mărime” mai mic decât în cazul modelelor Sota.
Tendința se vede și în produsele Databricks. Compania folosește, între altele, Genie – un asistent care traduce limbajul natural în interogări de date, susținut de un sistem de „agenți” și modele AI. Observând interacțiunile clienților cu platforma, Meyer spune că preferința pentru modele mai mici a crescut puternic, pe fondul a două beneficii: cost redus și latență mai mică (timpul până la primul răspuns și până la răspunsul complet).
„Modelele mici, prin natura lor, sunt mult mai rapide” în timpul până la primul token și până la răspuns.
Argumentul devine critic când aplicațiile trebuie să scaleze la „un număr uimitor de mare de interogări pe secundă”, situație în care companiile au nevoie de modele ieftine pentru a susține volumul.
Meyer mai spune că, deși există entuziasm pentru modelele Qwen, iar modelele open-source din China sunt „uimitoare” ca performanță, latență și cost, preocupările de reglementare și conformitate le limitează, în prezent, utilizarea în mediul enterprise. Seria Qwen este dezvoltată de Alibaba Cloud.
În pofida acestor constrângeri, graba de a integra AI în companii continuă, alimentată de teama de a nu rămâne în urmă, potrivit lui Meyer. El adaugă că firmele listate tind să fie mai prudente în privința impactului cheltuielilor cu AI asupra bilanțului, în timp ce companiile private sunt, în general, mai dispuse să cheltuiască.
Databricks a anunțat în februarie că a încheiat o finanțare de circa 5 miliarde de dolari (aprox. 23 mld. lei) la o evaluare de 134 miliarde de dolari (aprox. 616 mld. lei). Compania a raportat o creștere de peste 65% de la an la an în ultimul trimestru din 2025 și estimează că este pe cale să genereze 5,4 miliarde de dolari (aprox. 25 mld. lei) în următoarele 12 luni.
Recomandate

Alibaba mută „inteligența” roboților în cloud, cu teste pilot la clienți enterprise , încercând să transforme modelele sale de limbaj în capabilități operaționale pentru navigație și manipulare în lumea reală, potrivit Interesting Engineering . Compania chineză a lansat prima sa familie de modele de „AI întrupat” (embodied AI – sisteme care leagă percepția și limbajul de acțiuni fizice), sub numele Qwen-Robot. Suita este dezvoltată de Tongyi Lab și se află în testare pilot cu anumiți clienți enterprise ai Alibaba Cloud , ceea ce indică o direcție de produs orientată spre utilizare comercială, nu doar demonstrații de laborator. Ce include suita Qwen-Robot și ce problemă încearcă să rezolve Alibaba descrie trei modele specializate, fiecare vizând o „componentă” diferită a inteligenței fizice: Qwen-RobotNav : model pentru mișcare și navigație – urmarea instrucțiunilor, deplasare către locații, urmărirea țintelor și suport pentru conducere autonomă. Qwen-RobotManip : model pentru interacțiune fizică – prindere, mutare și manipulare de obiecte, antrenat pe date din sisteme robotice diferite. Qwen-RobotWorld : „model al lumii” – estimează cum se pot schimba mediile și ajută robotul să anticipeze consecințele acțiunilor. Miza, în logica prezentată de companie, este conectarea înțelegerii limbajului și a imaginilor (modele vizual-lingvistice) cu controlul efectiv al mișcărilor. Alibaba punctează și o constrângere practică: datele de antrenare pentru roboți sunt costisitoare, eterogene (navigație, brațe robotice, vehicule, camere) și greu de combinat fără conflicte. Demonstrații și indicatori tehnici menționați Într-o demonstrație, Alibaba a arătat Qwen-RobotNav pe un robot patruped Unitree Go2 , echipat cu hardware NVIDIA Jetson Thor și o singură cameră cu rezoluție redusă. Robotul ar fi navigat într-un apartament necunoscut, pe baza instrucțiunilor vocale, fără hărți preîncărcate, cu o latență de inferență de 196 milisecunde . Pentru Qwen-RobotManip, compania afirmă că modelul a fost antrenat pe peste 38.000 de ore de date open-source pentru sarcini de manipulare și interacțiune cu obiecte. Alibaba mai susține că modelul a obținut cel mai mare scor la categoria „generalist” din benchmark-ul RoboChallenge pentru robotică în lumea reală: process score 59,83 și rată de succes a sarcinilor 45% . Separat, Alibaba a prezentat Qwen-RobotClaw , un cadru de tip „agent” (software care orchestrează pași și instrumente pentru a îndeplini o sarcină) ce permite modelelor Qwen să folosească suita Qwen-Robot ca „unelte” pentru lumea fizică. Într-un exemplu, agentul ar fi căutat o toaletă, a identificat un semn „defect” și s-a redirecționat autonom. Compania a mai făcut open-source Chat2Robot , o platformă în browser pentru testarea interacțiunilor de embodied AI. De ce contează: intrarea Alibaba într-o cursă cu miză industrială Mișcarea Alibaba vine pe fondul intensificării competiției globale în „AI fizic”, cu inițiative menționate în material precum Gemini Robotics (Google DeepMind) și extinderea ecosistemului de robotică al Nvidia (Cosmos, Isaac, GR00T), dar și start-up-uri precum Physical Intelligence, Skild AI și Figure AI (atribuite South China Morning Post). Pentru China, aceeași sursă notează că avantajul de producție este completat de investiții în software de decizie autonomă, într-un ecosistem care include dezvoltatori AI, companii de robotică și producători de vehicule electrice. În acest context, testarea pilot cu clienți enterprise ai Alibaba Cloud sugerează că următorul pas relevant va fi trecerea de la performanțe în demonstrații și benchmark-uri la implementări repetabile în operațiuni reale. [...]

ChatGPT a coborât sub 50% cotă de piață, semn că piața asistenților AI intră într-o fază mai competitivă și mai orientată spre monetizare , potrivit HotNews , care citează raportul „State of AI” 2026 al firmei de analiză Sensor Tower . Datele indică o schimbare de dinamică într-un segment care, până recent, părea dominat aproape incontestabil de OpenAI: la începutul anului, ChatGPT era încă peste 50%, dar până la finalul lunii mai a scăzut la 46,4%, pe fondul creșterii rapide a rivalilor. Cine câștigă teren și cum arată împărțirea pieței Conform estimărilor Sensor Tower, avansul vine în special din două direcții: Gemini (Google) : 27,7% cotă de piață, alimentată în mare parte de integrarea în ecosistemul mai larg de instrumente Google; Claude (Anthropic) : 10,3% cotă de piață, cu o reputație puternică pentru sarcini de productivitate și, prin Claude Code, utilizare intensă în rândul programatorilor. Alți asistenți — inclusiv Grok (xAI), Perplexity, DeepSeek și Meta AI — sunt menționați cu sub 5% fiecare. De ce contează pentru business: utilizatorii schimbă mai ușor aplicația, iar banii cresc Raportul „State of AI” 2026, citat de TechCrunch, estimează că între începutul anului și finalul lunii iunie utilizatorii vor descărca aproape 2,3 miliarde de aplicații AI și vor cheltui peste 4,2 miliarde de dolari (aprox. 19,3 miliarde lei) pe acestea. În aceeași perioadă a anului trecut, cheltuielile au fost de 1,83 miliarde de dolari (aprox. 8,4 miliarde lei), ceea ce sugerează o mutare a industriei de la „creștere cu orice preț” către monetizare . În același timp, raportul notează că atât ritmul descărcărilor, cât și cel al cheltuielilor încetinesc, un posibil semn de maturizare a pieței, chiar dacă valorile absolute continuă să urce. Încrederea în brand începe să conteze în utilizare Un alt semnal operațional important: utilizatorii sunt „din ce în ce mai dispuși” să treacă de la un asistent la altul, iar anumite evenimente pot accelera migrarea. Ca exemplu, raportul menționează că acordul încheiat în februarie de OpenAI cu Departamentul Apărării al SUA a declanșat un vârf măsurabil al dezinstalărilor, sugerând că pentru o parte dintre utilizatori contează nu doar funcțiile, ci și încrederea în companie și alinierea la anumite valori. Utilizatori și abonamente: două modele diferite de tracțiune Sensor Tower indică și o diferențiere între popularitate și capacitatea de a transforma utilizarea în venituri recurente: ChatGPT ar fi ajuns la un miliard de utilizatori activi lunar , cu o creștere de 200 de milioane din februarie; Gemini are 662 de milioane de utilizatori activi lunar, iar Claude 245 de milioane . Pe partea de monetizare, Claude iese în evidență: 13% dintre utilizatorii Anthropic plătesc un abonament , o rată de conversie prezentată drept un reper relevant pentru investitori atunci când evaluează cât de sustenabile sunt veniturile companiilor din AI. În paralel, raportul estimează că timpul petrecut în aplicațiile AI va urca de la 17,2 miliarde de ore în prima jumătate din 2025 la aproximativ 36 de miliarde de ore în prima jumătate a acestui an, pe fondul utilizării tot mai frecvente pentru productivitate și al apetitului mai mare pentru funcții premium, în special în SUA. [...]

Indisponibilitatea chatbotului Claude a creat întreruperi operaționale pentru utilizatori și echipe care îl folosesc în fluxuri de lucru , iar situația a fost urmărită în timp real de CNET , într-un material de tip „live” despre starea serviciului. Din informațiile disponibile în pagina CNET, subiectul este o posibilă cădere (outage) a lui Claude, asistentul de inteligență artificială dezvoltat de Anthropic , și actualizările privind disponibilitatea acestuia. Textul extras din sursă nu include însă detalii concrete despre cauză, durată, amploare sau momentul exact al incidentului, ci mai ales elemente de navigație și conținut general al site-ului. De ce contează pentru companii și utilizatori O întrerupere a unui chatbot folosit la scară largă are impact direct în zona operațională: întârzieri în activități care depind de generare de text, analiză, suport intern sau automatizări. Pentru organizațiile care au integrat astfel de instrumente în procese, chiar și o indisponibilitate temporară poate însemna blocaje și costuri indirecte (timp pierdut, replanificare, trecerea pe soluții alternative). Ce se știe și ce nu se știe din sursa disponibilă Pe baza conținutului furnizat din pagina CNET: Se știe : subiectul este verificarea statusului „Claude este indisponibil?” și „cele mai recente informații”. Nu se știe (din textul extras) : confirmarea oficială a incidentului, intervalul orar, regiunile afectate, numărul utilizatorilor impactați, cauza tehnică sau estimarea de remediere. În lipsa acestor detalii în materialul disponibil aici, nu se poate cuantifica impactul sau stabili cu certitudine starea serviciului la un anumit moment. [...]

Amazon își bazează recuperarea în AI pe cipuri proprii și pe „pariul” Anthropic, mizând pe venituri din cloud indiferent de câștigător , potrivit The Next Web . Șeful diviziei de AI a companiei, Peter DeSantis , a recunoscut că modelele Amazon „nu au fost chiar în avangardă” pentru cele mai mari și mai solicitante sarcini și spune că speră ca Amazon să fie „în discuția” despre modelele de top „în anul care vine”. Declarația, făcută pentru CNBC (link în sursă), este relevantă pentru piață nu doar ca poziționare tehnologică, ci ca semnal despre cum încearcă Amazon să transforme decalajul față de OpenAI și Anthropic într-un avantaj economic: să monetizeze infrastructura (AWS) și cipurile proprii, chiar și atunci când clienții aleg modele concurente. Strategia „dublă”: marketplace de modele și propriile modele Amazon rulează în paralel două direcții. Pe de o parte, Bedrock – „piața” de modele din AWS – permite clienților să acceseze, printr-un singur serviciu, modele de la OpenAI, Anthropic, Meta și Mistral. În această configurație, Amazon poate genera venituri indiferent ce model devine dominant, pentru că încasează din consumul de cloud. Pe de altă parte, compania își dezvoltă propriile modele. The Next Web notează că Nova2, modelul intern lansat în decembrie, a atras aproximativ 50.000 de clienți, dar nu a egalat capabilitățile Claude (Anthropic) sau GPT-5.5 (OpenAI) pentru cele mai solicitante utilizări din mediul enterprise și cercetare – context care explică „franchețea” lui DeSantis. „Plasa” pentru investitori: expunere la Anthropic și venituri AWS În paralel cu dezvoltarea internă, Amazon și-a consolidat expunerea la Anthropic: a angajat investiții de până la 33 miliarde dolari (aprox. 152 mld. lei), inclusiv un acord de 25 miliarde dolari (aprox. 115 mld. lei) semnat în aprilie, care oferă Anthropic acces la până la cinci gigawați de capacitate de calcul pe cipurile Trainium ale Amazon. În schimb, Anthropic s-a angajat să cheltuiască peste 100 miliarde dolari (aprox. 460 mld. lei) pe AWS în următorul deceniu. Structura arată de ce Amazon poate câștiga financiar chiar dacă modelele sale rămân în urma liderilor: profită atât din participația în Anthropic, cât și din veniturile de cloud generate de consumul Anthropic. Publicația mai arată că rezultatele Amazon din T1 2026 au fost umflate de un câștig de 16,8 miliarde dolari (aprox. 77 mld. lei) legat de Anthropic, în timp ce fluxul de numerar liber a scăzut cu 95%. Planul de recuperare: Trainium, date proprii și scală de inginerie Pentru a reduce decalajul, DeSantis indică trei pârghii: cipuri AI proprii, date de antrenare proprietare (din operațiunile de retail și logistică) și capacitatea de execuție a unei echipe care acoperă modele de frontieră, proiectare de siliciu și cercetare în zona cuantică. The Next Web notează că cipurile Trainium alimentează deja majoritatea sarcinilor de inferență (rulare a modelelor) din Bedrock, iar Trainium3 – așteptat mai târziu în acest an – ar urma să aducă o performanță de patru ori mai mare decât generația anterioară. Rămâne însă o întrebare deschisă, în absența unor repere măsurabile: dacă cipurile proprii și datele interne pot compensa avansul de mai mulți ani al laboratoarelor care au investit miliarde în antrenarea modelelor de frontieră. DeSantis a indicat un orizont de „anul care vine”, dar fără benchmark-uri (teste standardizate) care să permită evaluarea progresului. [...]

Administrația SUA a amânat includerea DeepSeek pe „Entity List”, o decizie care menține, cel puțin temporar, accesul utilizatorilor și companiilor americane la tehnologia firmei chineze, în pofida acuzațiilor de sprijin pentru operațiuni militare și de informații ale Chinei , potrivit Tom's Hardware . Miza este una de reglementare cu efecte directe în piață: „Entity List” (lista de entități a Departamentului Comerțului din SUA) limitează sever posibilitatea instituțiilor și companiilor americane de a face afaceri cu firmele incluse. Conform unui raport citat de Reuters , DeepSeek și peste o sută de alte companii chineze ar fi fost pregătite pentru includere încă de anul trecut, însă Casa Albă a evitat actualizarea listei pentru a nu escalada tensiunile comerciale cu Beijingul, inclusiv în contextul vizitei de stat de trei zile a președintelui Donald Trump în China. Ce ar fi însemnat „Entity List” pentru companii și utilizatori În material se arată că un comitet interagenții ar fi recomandat includerea startupului chinez după ce un oficial senior al Departamentului de Stat ar fi susținut că firma sprijină operațiuni militare și de informații ale Chinei. Pe aceeași listă ar fi urmat să intre și producătorul chinez de memorii CXMT, ceea ce ar fi extins impactul dincolo de zona de software și modele de inteligență artificială. Pentru piața americană, o astfel de decizie ar fi avut consecințe operaționale imediate, deoarece ar fi afectat atât companiile care folosesc sau testează modele ale DeepSeek, cât și lanțuri de aprovizionare unde apar produse ale CXMT. De ce amânarea contează acum Tom’s Hardware notează că, în ciuda îngrijorărilor de securitate, DeepSeek câștigă popularitate în rândul utilizatorilor americani, fiind folosit ca alternativă la modele „de vârf” mai scumpe ale OpenAI și Anthropic . În paralel, CXMT ar începe să câștige tracțiune, inclusiv prin faptul că Corsair ar folosi cipuri DRAM de la compania chineză pentru piața din China, pe fondul penuriei care a afectat livrările unor producători precum Micron, Samsung și SK hynix. În acest context, o actualizare a listei ar lovi nu doar entitățile vizate, ci și companii și utilizatori americani care depind de aceste produse sau le folosesc pentru a-și reduce costurile. Context: acuzații suplimentare și riscul de represalii Materialul mai menționează că Anthropic a acuzat DeepSeek și alte două modele chineze „frontier” că ar fi „distilat” (adică ar fi extras comportamente/capabilități dintr-un model mai mare pentru a antrena unul mai mic) modelul Claude, folosind 16 milioane de „schimburi” realizate prin 24.000 de conturi frauduloase, potrivit unei postări pe X . Compania americană susține că astfel de practici pot elimina mecanisme de siguranță și pot alimenta utilizări militare, de informații sau de supraveghere. Separat, sunt amintite și relatări potrivit cărora DeepSeek ar fi folosit companii-paravan pentru a încerca să obțină cipuri Nvidia interzise la export, detaliate într-un alt material Tom’s Hardware despre încercări de a achiziționa cipuri Nvidia interzise . Pe fond, publicația plasează decizia într-o logică mai largă a restricțiilor și controalelor la export folosite de SUA pentru a limita accesul Chinei la tehnologie avansată. Totodată, este invocat riscul de represalii din partea Beijingului, inclusiv prin controlul asupra exporturilor de pământuri rare, materiale importante pentru industria semiconductorilor, subiect tratat de Tom’s Hardware într-un articol despre controlul Chinei asupra pământurilor rare și despre penuria resimțită de producătorii de cipuri . În lipsa unei actualizări oficiale a listei, situația rămâne deschisă: raportul citat indică faptul că includerea DeepSeek și a altor firme este pregătită, dar blocată politic pe termen scurt, tocmai din cauza potențialului de escaladare economică și comercială. [...]

Dezvoltarea rapidă a AI ar putea duce la deficit de forță de muncă, nu la șomaj în masă , susține Jeff Bezos , potrivit Economedia . Mesajul are relevanță economică directă: dacă productivitatea crește mai repede decât disponibilitatea oamenilor, companiile pot ajunge să concureze mai dur pentru angajați, în timp ce apar roluri noi care mută accentul de la execuție la coordonare și decizie. Bezos a făcut declarațiile miercuri, la o conferință de tehnologie organizată la Paris, unde a respins ideea că inteligența artificială va „face oamenii inutili” și a argumentat că, dimpotrivă, AI poate amplifica capacitatea de producție și eficiența în multe domenii. În viziunea sa, societatea este limitată de resursa umană, iar AI ar reduce barierele care frânează munca oamenilor. „Știu că există o mare îngrijorare (…) că AI va face ca oamenii să devină inutili (…) Nu sunt deloc de acord (…) Și cred, de fapt, că AI-ul va crea un deficit de forță de muncă.” Context: temerile privind automatizarea rămân puternice Declarațiile vin pe fondul unei anxietăți persistente legate de automatizare. Un sondaj Ipsos/Reuters citat în material arată că aproximativ jumătate dintre americani cred că avansul inteligenței artificiale ar putea duce la pierderea locurilor de muncă pentru mulți angajați. În același timp, extinderea tehnologiilor AI începe să schimbe structura pieței muncii, inclusiv prin apariția unor ocupații noi. Ce tipuri de joburi apar deja în „economia AI” Economedia notează două exemple de roluri emergente: „Vibecoders” : programatori care folosesc instrumente AI (precum GitHub Copilot, Claude sau Cursor) pentru a dezvolta aplicații fără a scrie integral codul manual. Accentul se mută spre arhitectura și direcția proiectului, în timp ce o parte din execuție este automatizată. „Prompt engineer” : specialist care formulează instrucțiuni pentru modele de AI astfel încât acestea să genereze rezultate precise și relevante; rolul pune mai mult accent pe creativitate, logică și comunicare decât pe programare avansată. Informațiile sunt preluate de Economedia dintr-un material citat de Mediafax , fără detalii suplimentare despre amploarea acestor roluri sau ritmul în care se generalizează în companii. [...]