Modelo R1 de DeepSeek alcanza 671 mil millones de parámetros tras 2.8 millones de horas de GPU
DeepSeek lanza su modelo de lenguaje R1, generando tanto expectativas por su capacidad como preocupaciones por la privacidad y manejo de datos de usuarios.
DeepSeek ha lanzado su nuevo modelo de lenguaje R1, que ha llamado la atención del mercado tras registrar una notable caída en las acciones de diversas empresas de inteligencia artificial, como Nvidia. Con un impresionante total de 671 mil millones de parámetros, el modelo R1 solo requirió 2.8 millones de horas de GPU para su entrenamiento, lo que lo coloca como uno de los más significativos del sector.
Sinh embargo, su lanzamiento también ha generado inquietudes relacionadas con la privacidad de los usuarios. DeepSeek ha revelado que registra extensos datos de sus usuarios, incluidos pulsaciones de teclas, contraseñas, direcciones de correo electrónico y fechas de nacimiento, que son almacenados en servidores ubicados en China. Además, cualquier contenido que los usuarios ingresen en el modelo R1, desde textos hasta archivos subidos, podría ser recogido por la empresa. También se menciona que pueden retener documentos de identificación, como licencias de conducir, en caso de contacto con el servicio.
El alcance de la recopilación de datos de DeepSeek se detalla con la recolección de información sobre el hardware utilizado por los usuarios, incluyendo direcciones IP, modelos de teléfonos y lenguajes. También se registran patrones de pulsaciones, lo que indica un seguimiento exhaustivo de las interacciones del usuario. La acumulación de datos se ve reforzada por el uso de cookies, una técnica tradicional de rastreo en internet.
Con la capacidad de operar en diversas plataformas gracias a ser un modelo de código abierto, el R1 ofrece potenciales beneficios en cuanto a privacidad. Sin embargo, DeepSeek proporciona acceso en línea a su modelo a través de su sitio web y aplicación móvil, lo que implica que gestionan los datos de los usuarios que interactúan en línea. La empresa es transparente respecto al tipo de datos que recopila, almacenando casi toda la información en sus servidores en China, un hecho que podría suscitar preocupaciones sobre la seguridad de la información personal.
Existen temores sobre la posibilidad de que DeepSeek venda los datos de sus usuarios a empresas de publicidad. La compañía admite que podría recibir información sobre los usuarios y sus acciones en sitios web y aplicaciones externas, así como en tiendas, lo que le permitiría conocer de cerca las actividades de sus usuarios. Este contexto despierta ecos de las críticas que recibió TikTok durante la administración Biden acerca de la posible influencia del gobierno chino sobre los datos de ciudadanos estadounidenses.
La controversia generada por el R1 no solo podría colocarlo bajo el escrutinio de las autoridades, sino que también pone a DeepSeek en una posición tensa con respecto a otras empresas del sector. Potencialmente, esto podría aumentar las fricciones en un mercado ya competitivo y marcado por la vigilancia de la privacidad y el manejo de datos.