top of page

DeepSeek lanzó en silencio una nueva versión de V3 y es dolor de cabeza para OpenAI

Puede ejecutarse apenas en una Mac Studio y cuenta con una velocidad de procesamiento de más de 20 tokens por segundo, un avance que marca un punto de inflexión en la IA generativa.



La inteligencia artificial (IA) está en constante evolución, y un nuevo jugador está sacudiendo los cimientos de la industria: DeepSeek V3-0324. Este modelo de lenguaje de gran escala, desarrollado por la startup china DeepSeek, no solo ofrece un rendimiento comparable al de los líderes del sector, sino que lo hace con una filosofía radicalmente diferente: acceso abierto y eficiencia sin precedentes.


A diferencia de los estrenos estratégicamente orquestados de OpenAI o Anthropic, DeepSeek V3-0324 apareció sin anuncios grandilocuentes ni estudios detallados. Simplemente fue publicado en Hugging Face, con un README vacío y un conjunto de pesos listos para descargar. Sin embargo, su impacto ha sido inmediato.


Con 685 mil millones de parámetros, pero operando de manera optimizada con solo 37 mil millones activos por tarea, DeepSeek V3-0324 logra una eficiencia excepcional. Su arquitectura Mixture-of-Experts (MoE) redefine la forma en que estos modelos procesan la información, permitiendo un rendimiento superior sin requerir infraestructura costosa.


Una de las mayores sorpresas de DeepSeek V3-0324 es su capacidad para ejecutarse en hardware de consumo, como la Mac Studio con chip M3 Ultra y 512GB de RAM. Con una velocidad de procesamiento de más de 20 tokens por segundo en configuración de 4 bits, este avance marca un punto de inflexión en la IA generativa, eliminando la dependencia de centros de datos costosos y potentes GPUs de NVIDIA.


Esto no solo reduce los costos de acceso a IA avanzada, sino que también plantea un desafío para empresas como OpenAI, cuyos modelos se mantienen bajo un esquema cerrado y dependiente de infraestructuras propietarias.


Además de su arquitectura MoE, incorpora Multi-Head Latent Attention (MLA) y Multi-Token Prediction (MTP), lo que le permite manejar contextos extensos con mayor coherencia y generar varios tokens simultáneamente, mejorando su velocidad en un 80% respecto a modelos tradicionales.


Esta eficiencia también tiene implicaciones en sostenibilidad: mientras que los modelos cerrados requieren enormes consumos energéticos en centros de datos, DeepSeek V3-0324 puede operar con un gasto energético considerablemente menor, desafiando los paradigmas actuales sobre infraestructura de IA.


La estrategia de DeepSeek refleja una tendencia creciente en China: la adopción de modelos de IA abiertos frente al enfoque cerrado de Silicon Valley. Empresas como Baidu, Alibaba y Tencent también están avanzando hacia la apertura de sus modelos, facilitando la innovación y reduciendo la dependencia de hardware restringido por sanciones internacionales.


Esta filosofía ha acelerado la evolución del ecosistema de IA en China, permitiendo que startups y desarrolladores construyan soluciones sin barreras de acceso. En contraste, empresas como OpenAI y Anthropic siguen un modelo de negocio basado en licencias y suscripciones, lo que podría volverse insostenible ante la proliferación de alternativas gratuitas y de alto rendimiento.


El Próximo Paso: IA con Razonamiento Avanzado


DeepSeek V3-0324 podría ser solo la antesala de un modelo aún más poderoso. Se rumorea que la compañía lanzará pronto DeepSeek-R2, un modelo enfocado en razonamiento avanzado que podría competir directamente con el esperado GPT-5 de OpenAI.


Si esta tendencia se consolida, podríamos estar ante un cambio fundamental en el mercado de la inteligencia artificial. La disponibilidad de modelos avanzados sin restricciones podría democratizar el acceso a herramientas de IA de alto nivel, alterando la dinámica de poder entre las grandes tecnológicas y los desarrolladores independientes.


DeepSeek V3-0324 representa mucho más que una mejora incremental: es un símbolo de la creciente rivalidad entre dos enfoques opuestos en la evolución de la IA. Mientras Silicon Valley apuesta por la exclusividad y el control, China avanza con modelos abiertos que prometen revolucionar el acceso y la eficiencia en este campo.

Si los modelos de DeepSeek continúan evolucionando a este ritmo, la industria podría verse obligada a redefinir sus estrategias. En un mundo donde la inteligencia artificial es cada vez más crucial para la innovación y la economía, el acceso libre podría convertirse en el factor decisivo para determinar quién liderará la próxima era de la tecnología.


Comentarios


itnow-03.png

© Derechos reservados

Connecta B2B - 2025

Políticas de privacidad

ACERCA DE NOSOTROS

IT NOW es un espacio multiplataforma y un núcleo para conectar negocios que se compone de varios elementos: su sitio web con noticias de TI relevantes en la región, un newsletter semanal, su multiplataforma de redes sociales, por último, sus eventos enfocados en las verticales de TI y en donde destaca el aclamado Tech Day, la gira de actualización tecnológica más importante de la región.

24 / 7 Actualizaciones en nuestras Redes Sociales
  • Facebook
  • Instagram
  • LinkedIn
  • YouTube
  • X
  • RSS
bottom of page