Mistral 3 redefine la eficiencia para IA en dispositivos locales

Malka Mekler
4 dic 2025
3 min de lectura

Las variantes de 3B, 8B y 14B generan menos tokens, integran capacidades multimodales y alcanzan precisiones de referencia como el 85% en AIME 2025 en su versión reasoning.

La evolución de los modelos abiertos de inteligencia artificial entra en una nueva fase con el lanzamiento de Mistral 3, una familia que busca escalar el rendimiento técnico tanto en centros de datos como en despliegues en el borde. Según Mistral, esta generación introduce una combinación de arquitecturas densas y un nuevo modelo de mezcla de expertos que apunta a mejorar capacidad, eficiencia y soporte multimodal dentro del ecosistema open-source.

La compañía anunció Mistral Large 3 como su modelo más avanzado hasta ahora, construido con un enfoque de mezcla de expertos que opera con 41 mil millones de parámetros activos sobre un total de 675 mil millones. Desarrollado desde cero en 3.000 GPUs NVIDIA H200, el modelo incorpora mejoras de preentrenamiento y postentrenamiento que lo colocan al nivel de los sistemas instruccionales abiertos más competitivos, con capacidad para comprender imágenes y sostener conversaciones multilingües con alta precisión. Según la firma, su desempeño lo posiciona en el segundo lugar de la categoría de modelos open-source no orientados al razonamiento en el ranking de LMArena.

La accesibilidad técnica es una de las prioridades de esta generación. Para facilitar despliegues, Mistral colaboró con NVIDIA, Red Hat y vLLM en un paquete de optimizaciones que permiten ejecutar Large 3 en formatos comprimidos como NVFP4, compatibles con sistemas Blackwell NVL72 y con nodos estándar de 8×A100 o 8×H100. NVIDIA integró kernels especializados para atención y mezcla de expertos, además de soporte para ejecución de baja precisión en TensorRT-LLM y SGLang. Este trabajo conjunto habilita inferencias más rápidas, mayor eficiencia energética y manejo de contextos extensos en cargas de alta demanda.

Junto con el modelo de gran escala, la compañía presentó la serie Ministral 3 —versiones de 3B, 8B y 14B parámetros— orientada a entornos locales y dispositivos de borde. Estas variantes incorporan capacidades multimodales, soporte multilingüe y versiones base, instruct y reasoning, todas bajo licencia Apache 2.0. Según Mistral, los modelos instruct generan menos tokens para completar tareas sin sacrificar calidad, lo que reduce costos en aplicaciones reales, mientras que los modelos reasoning priorizan la precisión y alcanzan resultados competitivos, como un 85% en AIME 2025 para el modelo de 14B.

La integración con la infraestructura de NVIDIA también abarca despliegues optimizados en DGX Spark, equipos RTX, laptops y dispositivos Jetson, lo que permite ejecutar los modelos desde centros de datos hasta robots o aplicaciones industriales. Esta consistencia operativa es uno de los enfoques clave de la empresa para impulsar la adopción de IA abierta a gran escala.

Tanto Mistral Large 3 como la línea Ministral ya están disponibles en plataformas como Mistral AI Studio, Amazon Bedrock, Azure Foundry, Hugging Face y otros proveedores. Mistral confirmó que una versión especializada en razonamiento de Large 3 está en camino. Además, la compañía ofrece entrenamiento personalizado para organizaciones que buscan adaptar los modelos a tareas específicas o mejorar rendimiento sobre datos propios.

Con esta familia, la compañía afirma que busca impulsar un ecosistema de IA transparente y escalable, capaz de trabajar con texto, imágenes y lógica compleja en más de 40 idiomas, y de cubrir desde cargas empresariales distribuidas hasta casos de uso en el borde donde la eficiencia energética y la compresión avanzada son determinantes. Según Mistral, la apertura del modelo y las nuevas optimizaciones apuntan a habilitar desarrollos más rápidos, personalizados y accesibles para toda la comunidad técnica.

Mistral 3 redefine la eficiencia para IA en dispositivos locales

Las variantes de 3B, 8B y 14B generan menos tokens, integran capacidades multimodales y alcanzan precisiones de referencia como el 85% en AIME 2025 en su versión reasoning.

Le puede interesar: Mistral también lanzó su AI Studio

Entradas relacionadas

Comentarios

24 / 7 Actualizaciones en nuestras Redes Sociales