Inteligență artificială17 iun. 2026
Laboratoarele AI din China mută tot mai mult antrenarea modelelor pe cipuri locale - Huawei Ascend și Moore Threads apar în proiecte, pe fondul restricțiilor SUA
Laboratoarele chineze de IA mută tot mai mult antrenarea pe cipuri locale, dar „înlocuirea Nvidia” rămâne departe , arată o trecere în revistă publicată de South China Morning Post , pe fondul restricțiilor americane la export și al presiunii Beijingului pentru autosuficiență tehnologică. Deși modelele chinezești au devenit mai competitive față de cele din SUA, hardware-ul de IA al Chinei rămâne în urmă, iar cipurile locale sunt folosite pe scară largă mai ales la „inference” (rularea modelului deja antrenat pentru a răspunde la întrebări), nu la pre-antrenare, etapa cea mai consumatoare de putere de calcul. Publicația notează că niciunul dintre modelele de top din China nu este cunoscut ca fiind pre-antrenat pe „siliciu” autohton, însă tot mai multe echipe încearcă să mute etape mai timpurii ale antrenării pe infrastructură locală. Potrivit economistului Natixis Gary Ng, această tranziție poate încetini dezvoltarea pe termen scurt față de rivalii americani, dar ar contribui, în timp, la construirea unui lanț intern complet de aprovizionare pentru IA, „destul de rar la nivel global”. Unde se vede, concret, trecerea pe cipuri chinezești Articolul inventariază cinci exemple recente, care acoperă etape diferite din ciclul de viață al unui model (pre-antrenare, post-antrenare și inferență): Zhipu AI – GLM-Image : model de generare de imagini, open-source, dezvoltat împreună cu Huawei și antrenat pe serverul Ascend Atlas 800T A2 (cu acceleratorul Ascend 910) și framework-ul MindSpore, potrivit companiei. Zhipu susține că este primul model multimodal „state-of-the-art” antrenat integral pe cipuri domestice, cu nuanța că modelele de imagini cer, de regulă, mai puțină putere de calcul decât modelele lingvistice mari (LLM). (Context despre companie: Zhipu AI ) Meituan – LongCat-2.0-Preview : compania a invitat utilizatorii să testeze un model „trillion-parameter” și a afirmat că atât antrenarea, cât și inferența au fost făcute integral pe un „cluster de calcul domestic”. Meituan nu a precizat ce acceleratoare a folosit, menționând doar că etapa de antrenare a necesitat 50.000–60.000 de cipuri locale, iar modelul nu a fost încă lansat oficial publicului. (Context: Meituan ) ModelBest – modele ușoare „on-device” : start-up-ul a publicat BitCPM-CANN, un model ternar de 1,58 biți, în patru dimensiuni (0,5–8 miliarde de parametri), proiectat să comprime „greutățile” (weights) pentru eficiență fără memorie fizică suplimentară. Modelul ar fi fost antrenat pe hardware Ascend și poartă numele arhitecturii CANN (Compute Architecture for Neural Networks), echivalentul local al CUDA (setul de instrumente software al Nvidia). Compania mai spune că a antrenat pe Ascend și MiniCPM5-1B, care ar fi depășit seria Qwen a Alibaba într-un clasament Artificial Analysis pentru modele open-weights sub 2 miliarde de parametri. (Context: ModelBest ) DeepSeek-V4-Pro – post-antrenare pe Ascend 910C : o echipă de cercetare de la Huawei și Shenzhen Loop Area Institute afirmă că a folosit cipuri Ascend 910C pentru post-antrenarea „full-parameter” a modelului flagship de 1,6 trilioane de parametri, pe un cluster cu cel puțin 1.000 de cipuri Huawei. Publicația subliniază însă că post-antrenarea este mult mai puțin intensă computațional decât pre-antrenarea. (Context: DeepSeek-V4-Pro ) Universitatea Peking – EvoPhys-World : un „world model” 5D care simulează mișcări în spații fizice și a urcat pe primul loc în benchmark-ul WorldScore al Universității Stanford. Echipa spune că a antrenat modelul folosind GPU-ul MTT S5000 de la Moore Threads și platforma Musa, alternativă la CUDA. Moore Threads susține că performanța la „training throughput” (viteza de procesare în timpul învățării) a fost aproape la nivelul unor cipuri „mainstream” globale nenumite și cu o calitate a inferenței aproape identică. (Context: Moore Threads Technology ) De ce contează pentru piață Imaginea de ansamblu este una de substituție graduală, pe segmente , nu de înlocuire rapidă a Nvidia: China pare să avanseze în folosirea cipurilor locale la inferență și, punctual, la post-antrenare sau la antrenarea unor modele mai „ușoare”, în timp ce pre-antrenarea modelelor de vârf rămâne, cel puțin din informațiile publice, un prag încă neatins pe scară largă cu hardware autohton. În termeni operaționali, miza imediată este dacă ecosistemele software alternative la CUDA (precum CANN și Musa) și capacitatea de a construi clustere mari cu cipuri locale pot reduce dependența de acceleratoarele americane, chiar cu costuri de eficiență pe termen scurt. [...]