DeepSeek, un laborator de cercetare AI relativ necunoscut din China, a devenit rapid subiectul principal în Silicon Valley, odată cu lansarea modelului său open source DeepSeek-R1. Potrivit unui studiu realizat de companie, DeepSeek-R1 depășește modelele de top din industrie, precum OpenAI o1, pe mai multe repere de matematică și raționament. Modelul s-a remarcat prin performanță, costuri reduse și deschiderea către colaborarea globală, punând presiune pe giganții occidentali din domeniul AI.
Un efect neașteptat al războiului tehnologic SUA-China
Succesul DeepSeek evidențiază o consecință surprinzătoare a restricțiilor de export impuse de SUA, care au limitat accesul companiilor chineze la hardware avansat. În lipsa posibilității de a scala masiv prin achiziția de cipuri performante, DeepSeek a găsit o alternativă: îmbunătățirea structurii de bază a modelelor AI și utilizarea mai eficientă a resurselor disponibile.
„Spre deosebire de multe firme chineze de AI care depind de hardware avansat, DeepSeek a prioritizat optimizarea software-ului pentru a maximiza resursele”, explică Marina Zhang, profesor asociat la Universitatea de Tehnologie din Sydney. „Adoptând metode open source, compania a atras expertiză colectivă și a încurajat inovația colaborativă, accelerând dezvoltarea tehnologiilor de vârf.”
Cine se află în spatele DeepSeek?
DeepSeek a început ca Fire-Flyer, o ramură de cercetare a High-Flyer, unul dintre cele mai performante fonduri de investiții quantitative din China. Fondat în 2015, High-Flyer a acumulat rapid succes, devenind primul fond quant din China care a strâns peste 100 de miliarde de RMB (aproximativ 15 miliarde de dolari).
În 2023, Liang Wenfeng, un expert cu studii avansate în informatică, a decis să folosească resursele High-Flyer pentru a fonda DeepSeek, cu scopul de a dezvolta modele avansate și, în cele din urmă, inteligență generală artificială. „Nu există o justificare comercială imediată pentru DeepSeek”, a declarat Liang într-un interviu. „Este vorba despre curiozitate științifică și dorința de a rezolva cele mai dificile probleme din lume.”
O echipă tânără și ambițioasă
DeepSeek se remarcă și prin strategia sa de recrutare. Liang a angajat în principal doctoranzi din universități de top din China, precum Universitatea Peking și Universitatea Tsinghua. Mulți dintre aceștia aveau deja lucrări publicate în reviste prestigioase, dar nu aveau experiență industrială.
„Majoritatea pozițiilor noastre tehnice sunt ocupate de oameni care au absolvit în ultimii doi ani”, a spus Liang. Strategia a creat un mediu colaborativ, în care cercetătorii tineri au avut libertatea de a experimenta cu proiecte neconvenționale, folosind resurse de calcul generoase.
Această nouă generație de cercetători chinezi este determinată să depășească obstacolele tehnologice impuse de SUA, combinând ambiția personală cu un sentiment de patriotism.
Inovație născută din criză
Restricțiile SUA asupra exportului de cipuri, precum Nvidia H100, au forțat DeepSeek să devină mai inovator. Cu un stoc inițial de 10.000 de cipuri A100, compania a optimizat arhitectura modelului său pentru a maximiza eficiența.
„Au folosit trucuri inginerești, cum ar fi scheme personalizate de comunicare între cipuri și utilizarea inovatoare a abordării „mixture of experts”, reducând semnificativ consumul de resurse”, explică Wendy Chang, analist la Mercator Institute for China Studies.
Un viitor promițător
DeepSeek este una dintre puținele companii de top din China care nu depinde de finanțarea giganților tehnologici locali, precum Baidu, Alibaba sau ByteDance. În plus, modelul său open source atrage contribuții globale, accelerând progresul.
Succesul DeepSeek demonstrează că performanța de vârf poate fi atinsă și cu resurse limitate, iar normele actuale ale industriei AI pot fi optimizate. Compania deschide calea pentru noi strategii în construirea modelelor AI, punând presiune asupra liderilor globali să-și regândească abordările.
DeepSeek nu doar că ridică standardele tehnologice, dar și redefinește inovația globală, oferind un exemplu clar al potențialului născut din provocări.