Inteligență artificială30 mai 2026
Groq încearcă să strângă 650 milioane de dolari pentru businessul său de inference cloud - runda este garantată de doi investitori după acordul de 20 mld. dolari cu Nvidia
Groq încearcă să se refinanțeze cu 650 milioane dolari (aprox. 2,99 miliarde lei) pentru a-și susține cloudul de inferență , după un acord atipic prin care Nvidia a plătit 20 miliarde dolari (aprox. 92 miliarde lei) către investitori și a atras o parte din inginerii-cheie ai companiei, potrivit The Next Web . Miza economică este dacă Groq mai poate construi un avantaj de cost într-o piață în care prețul pe „token” (unitate de text generat) este împins în jos, iar Nvidia își optimizează accelerat propriile platforme pentru inferență. Finanțarea de 650 milioane dolari ar urma să vină de la investitori existenți și să fie direcționată către businessul de „inference cloud” (servicii de calcul pentru rularea modelelor AI după ce utilizatorul trimite un prompt). Publicația notează că runda este, practic, „garantată”: Disruptive și Infinitium s-au angajat să acopere finanțarea dacă alți investitori nu își exercită drepturile pro-rata (adică participarea proporțională pentru a-și menține ponderea). Ce a rămas din Groq după acordul de 20 miliarde dolari cu Nvidia Acordul din decembrie, descris ca „not-acqui-hire” (o tranzacție care nu este o achiziție completă, dar include plăți către investitori și transfer de oameni-cheie), a avut câteva efecte directe: Nvidia a plătit investitorii Groq în numerar, la un nivel care ar fi echivalat cu cea mai mare achiziție din istoria Nvidia, dacă ar fi fost o preluare integrală. Nvidia a licențiat tehnologia hardware a Groq. Mai mulți ingineri seniori au plecat la Nvidia. Groq nu a fost absorbită, dar a rămas „resetată” financiar și slăbită la nivel de leadership tehnic, concentrându-se acum pe un model mai îngust: inferență ca serviciu. Conducerea este asigurată interimar de CEO-ul Adam Winter și CFO-ul Matt Eng, conform aceleiași surse. De ce contează: inferența e piața mare, dar marjele sunt sub presiune The Next Web argumentează că inferența a devenit o piață mai mare decât antrenarea modelelor, pentru că fiecare interogare către un chatbot sau fiecare acțiune a unui „agent” AI consumă calcul de inferență. În acest context, Groq pariază pe propriul hardware LPU (Language Processing Unit), proiectat special pentru acest tip de sarcină, cu promisiunea unei viteze mai mari (măsurată în „tokens per second”) și a unui cost mai mic decât GPU-urile generaliste. Problema este că economia inferenței se înăsprește: publicația menționează că DeepSeek a redus permanent cu 75% prețul pentru V4 Pro, ceea ce comprimă veniturile pe token de care depind furnizorii de cloud de inferență. În paralel, Nvidia își împinge înainte platformele Blackwell și viitoarea Vera Rubin tocmai pentru a reduce diferențele de performanță la inferență care au creat oportunități pentru jucători specializați precum Groq. Ce urmează Runda de 650 milioane dolari este, în esență, un pariu că hardware-ul dedicat inferenței își păstrează avantajul chiar și într-un mediu cu prețuri în scădere și cu Nvidia accelerând optimizările. Întrebarea centrală, potrivit analizei, este dacă Groq poate să-și refacă rapid forța de inginerie la nivel senior, să scaleze operațional cloudul de inferență și să rămână competitivă la cost în fața a două presiuni simultane: îmbunătățirile Nvidia și ieftinirile agresive ale furnizorilor de modele. [...]