La inteligencia artificial de DeepSeek ha sido entrenada con potentes chips de NVIDIA
DeepSeek lanza su modelo V3 de inteligencia artificial como código abierto, revelando su innovadora estrategia de desarrollo en un contexto de restricciones tecnológicas.
La reciente publicación del modelo V3 de la inteligencia artificial (IA) de DeepSeek como código abierto ha permitido un mayor entendimiento sobre la estrategia de desarrollo de esta empresa china. A través de este acceso a su modelo, los ingenieros de DeepSeek revelan los detalles que han llevado a conformar un sistema de IA eficiente y innovador.
DeepSeek ha afirmado que su modelo ha sido entrenado utilizando 2.048 chips H800 de NVIDIA; sin embargo, algunos analistas especulan que la empresa ha contado en realidad con una infraestructura que incluye hasta 50.000 GPUs H100 adquiridas a través de intermediarios. Esta conjetura surge a raíz de las sanciones impuestas por el Gobierno de EE. UU., que han dificultado a las empresas chinas el acceso a GPUs más potentes. Desde noviembre de 2023, NVIDIA tampoco ha podido suministrar su chip H800 a clientes en China, complicando aún más el acceso a tecnología avanzada.
La tecnología CUDA (Compute Unified Device Architecture) ha sido fundamental en el crecimiento de NVIDIA en los últimos años. La mayoría de los proyectos de IA actuales están implementados sobre esta plataforma, que facilita a los desarrolladores trabajar con sus GPUs. Por su parte, Huawei ha desarrollado CANN (Compute Architecture for Neural Networks), una alternativa que, hasta ahora, no ha logrado captar una porción significativa del mercado dominado por CUDA.
A pesar de la popularidad de CUDA, DeepSeek ha optado por utilizar PTX (Parallel Thread Execution) como base para el desarrollo de su IA. Aunque esta decisión representa un mayor nivel de complejidad técnica, PTX permite optimizaciones más eficientes en comparación con CUDA, lo que resulta en un mejor aprovechamiento de los recursos de las GPUs H800.
Los ingenieros de DeepSeek han implementado una estrategia donde asignan solo 20 SM (Streaming Multiprocessors) de cada GPU a la comunicación entre servidores, reservando los 112 SM restantes para los cálculos. Esta metodología ha permitido construir un modelo de IA que se distingue por su eficiencia, demostrando la capacidad de adaptación de la empresa ante la escasez de recursos debido a las sanciones estadounidenses.
El desarrollo de DeepSeek no solo resalta un logro significativo en la ingeniería de inteligencia artificial, sino que también puede cambiar la forma en que los desarrolladores abordan sus proyectos en el futuro, mostrando cómo las empresas chinas están encontrando formas de prosperar en medio de las restricciones tecnológicas internacionales.