Mistral: La Alternativa Europea a ChatGPT
Mistral, una startup con base en París, se ha convertido en una alternativa europea a ChatGPT. Recientemente, la empresa ha levantado una ronda de financiación de 500 millones de euros, elevándola al estatus de unicornio.
Sobre Mistral
Mistral se ha centrado en el desarrollo de tecnología de inteligencia artificial y aprendizaje automático, y su producto estrella es el modelo de lenguaje de última generación que han lanzado recientemente. Puedes conocer más sobre Mistral en su página oficial.
El Modelo de Mistral
El mismo día que Google nos presentó su modelo Gemini, o más bien un vídeo trucado del mismo, el equipo de Mistral liberó su nuevo modelo a través de BitTorrent.
El modelo propuesto por Mistral es un mix de expertos, también conocido como modelo MoE (Mixture of Experts). Consiste en tener 8 modelos de 7B de parámetros cada uno. Cada uno de estos 8 modelos se ha entrenado para tener un mejor comportamiento en una cualidad concreta. A la hora de generar los tokens, en base al prompt, el modelo decide a qué submodelo o submodelos debe generar el token. Al parecer, GPT-4 tiene un enfoque similar.
¿Qué son los Modelos MoE?
Los modelos MoE son una técnica de aprendizaje automático que combina las predicciones de varios modelos (los “expertos”) para producir una predicción final. La idea es que diferentes modelos pueden ser buenos en diferentes partes del espacio de entrada, y la combinación de sus predicciones puede dar lugar a un modelo más preciso y eficiente.
Rendimiento del Modelo
En los benchmarks, el modelo de Mistral parece superar tanto a GPT 3.5 como a Llama 70B, lo que demuestra la eficacia y eficiencia de su enfoque.
Acceso al Modelo
Además de poder acceder al modelo a través de BitTorrent, también es posible usarlo directamente en Hugging Face.
Pero esto no es todo, Mistral ha lanzado su propio servicio mediante API para poder acceder al modelo de manera similar a como lo hace OpenAI.
Sin duda, esta es una gran noticia para todos. La competencia es buena, y si encima es made in Europe, mejor. Personalmente, ya he solicitado acceso a la API (que actualmente está en modo whitelist). En cuanto tenga la oportunidad de probarla, compartiré mis impresiones.