DeepSeek hace público el código de sus modelos de IA
- Redacción IT NOW
- 24 feb
- 2 Min. de lectura
La compañía china compartirá cinco repositorios de código en la plataforma X, prometiendo "progresos pequeños pero sinceros" y un enfoque de total transparencia.

El anuncio llega poco después de que DeepSeek revolucionara la industria global de la IA con el lanzamiento de su modelo de razonamiento R1, que se destacó por ofrecer un rendimiento comparable al de los modelos occidentales, pero a una fracción del costo de desarrollo. A diferencia de muchas empresas de IA en China, que prefieren modelos cerrados y están más enfocadas en la monetización rápida, DeepSeek sigue un enfoque diferente, más orientado a la colaboración y la comunidad.
Liang Wenfeng, el fundador de DeepSeek, explicó en una rara entrevista en julio pasado que la compañía no prioriza la comercialización de sus modelos de IA. En cambio, ve el código abierto como una oportunidad para ganar respeto y crear poder blando, con el convencimiento de que contribuir al ecosistema global de código abierto aporta una sensación única de logro.
"Que otros sigan tu innovación es un gran motivo de satisfacción", afirmó Liang. "De hecho, el código abierto es más un comportamiento cultural que comercial, y nuestra contribución nos ha ganado respeto."
El código abierto liberado esta vez no solo permitirá a otros desarrollar sobre los modelos ya compartidos, sino que también ofrecerá una infraestructura robusta para respaldar estos modelos, mejorando aún más el impacto de DeepSeek en el sector de la IA.
La reciente liberación de un algoritmo llamado Native Sparse Attention (NSA), que optimiza la eficiencia en el entrenamiento de contextos largos, también pone de relieve la capacidad innovadora de DeepSeek. Desde el mes pasado, la base de usuarios de la compañía ha crecido exponencialmente, superando a competidores como Douban, convirtiéndose en el servicio de chatbot más popular de China con 22,2 millones de usuarios activos diarios.
Comments