DeepSeek enfrenta escepticismo sobre el costo real de su modelo de lenguaje R1

DeepSeek ha generado controversia al presentar su modelo de lenguaje R1, enfrentando dudas sobre los verdaderos costos y sus capacidades ante la censura.

Publicado: 05-02-2025 10:05

En las últimas semanas, DeepSeek, una empresa china, ha captado la atención del mundo de la inteligencia artificial con su modelo de lenguaje R1, diseñado para impulsar una aplicación similar a ChatGPT. Este desarrollo resulta sorprendente, considerando que las empresas chinas no han tenido acceso a procesadores con tecnología estadounidense, considerados esenciales para el avance de la inteligencia artificial. A pesar de estas restricciones, DeepSeek logró entrenar un modelo de lenguaje, lo que ha generado un gran interés.

Sin embargo, la compañía también ha suscitado controversia en torno al costo de su desarrollo. DeepSeek afirmó haber invertido únicamente 6 millones de dólares en la creación del modelo R1, cifra que fue recibida con escepticismo. Un análisis de SemiAnalysis reveló que esta cantidad corresponde únicamente a los costos de las GPU utilizadas en la fase de preentrenamiento, sin incluir gastos significativos como material, personal o investigación y desarrollo.

Los costos reales del desarrollo del R1 podrían ascender a unos 1.6 mil millones de dólares, debido a que la empresa utilizó las GPUs Nvidia H100, que son altamente demandadas por empresas de inteligencia artificial. Esto refleja el hecho de que el costo de formar un modelo de este tipo es significativamente mayor de lo que DeepSeek inicialmente divulgó, lo que reduce la percepción de su tecnología como una innovación revolucionaria.

Además de la controversia en torno a los costos, el modelo R1 tiene limitaciones importantes. Adherido a las estrictas reglas de censura chinas, el modelo evita responder a preguntas sobre temas sensibles, lo que disminuye su funcionalidad en contextos más amplios. Por si fuera poco, el sistema ha sido criticado por deficiencias en la seguridad, ya que las bases de datos que almacenaban conversaciones de usuarios estuvieron expuestas temporalmente a través de Internet.

En resumen, aunque el R1 presenta cierto nivel de eficiencia y rendimiento, los desafíos en términos de costos, censura y seguridad sugieren que el avance de DeepSeek en el ámbito de la inteligencia artificial no es tan innovador como se había presentado inicialmente.