A Xiaomi lançou oficialmente o MiMo, o seu primeiro modelo de linguagem de código aberto centrado em tarefas de raciocínio como a matemática e a programação. O protótipo foi anunciado recentemente, marcando a entrada da empresa chinesa no competitivo sector da Inteligência Artificial (IA).
O MiMo (MiMo-7B) é um modelo de linguagem com 7 mil milhões de parâmetros, desenvolvido do zero pela equipa Xiaomi LLM-Core. Apesar de ser relativamente pequeno em comparação com outros modelos de IA, como o Qwen-32B da Alibaba, o MiMo demonstrou desempenho superior em tarefas de raciocínio matemático e programação, superando modelos amplamente conhecidos como o o1-mini da OpenAI.
Destaques técnicos do MiMo
Modelo compacto
- Com apenas 7 mil milhões de parâmetros, o MiMo supera modelos maiores em tarefas específicas.
Treino
- Foi treinado desde o início com ênfase no raciocínio, utilizando estratégias de pré-treino e pós-treino, incluindo aprendizagem por reforço.
Código aberto
- Está disponível sob licença Apache 2.0 no GitHub, promovendo transparência e colaboração na comunidade GitHub.
Desempenho competitivo
- Alcança resultados comparáveis a modelos como o o1-mini da OpenAI e o Qwen-32B da Alibaba, mesmo com um tamanho significativamente menor.
Com o lançamento do MiMo, a Xiaomi junta-se a outras gigantes tecnológicas chinesas, como a Alibaba e a DeepSeek, na corrida pela liderança em Inteligência Artificial. Este movimento reflecte o investimento da empresa na área da IA, que será certamente aproveitado na área dos smartphones e veículos eléctricos.
O MiMo está disponível publicamente no GitHub e também na plataforma Hugging Face.
Fonte: Sapo