Investigadores da Microsoft, em colaboração com um especialista da Universidade da Academia Chinesa de Ciências, apresentaram um novo modelo de Inteligência Artificial (IA) que funciona em unidade central de processamento (CPU) convencionais, sem depender de unidades de processamento gráfico (GPU).
A proposta destaca-se por utilizar uma arquitectura de 1 bit – um modelo que, segundo os criadores, pode representar um avanço importante na redução do consumo de energia e de recursos computacionais. O trabalho foi publicado num artigo científico no arXiv, um repositório onde cientistas e pesquisadores de todo o mundo publicam versões preliminares dos seus estudos sem revisão por pares.
Baptizado de BitNet b1.58 2B4T, o modelo foi projectado para operar com um ambiente de execução próprio, o bitnet.cpp, e tem o diferencial de usar pesos codificados com apenas três valores: -1, 0 e 1. Isso permite cálculos com operações simples, como adição e subtracção, facilitando o uso de CPU comum em vez de depender de grandes centros de dados com altos custos de energia.
Tradicionalmente, os modelos de linguagem utilizam pesos representados por números de ponto flutuante (geralmente 8 ou 16 bits), o que exige alto poder de processamento e grande quantidade de memória. A proposta da Microsoft elimina essa necessidade ao reduzir os dados processados para apenas um bit, tornando o modelo mais leve e menos exigente em termos de hardware.
De acordo com o site Tecnoblog, durante os testes, o novo modelo demonstrou desempenho compatível com outras IA da mesma categoria rodando em GPU, chegando a superar algumas delas em eficiência. A expectativa é que a simplificação da arquitectura possibilite a execução de modelos avançados em dispositivos pessoais, como notebooks ou mesmo smartphones, sem a necessidade de conexão à Internet ou servidores externos.
Se os resultados apresentados se confirmarem fora do ambiente de teste, a tecnologia poderá representar uma grande mudança na forma como utilizamos os modelos de IA no dia-a-dia. Para além de reduzir significativamente o consumo de energia, esta abordagem permitiria que o processamento fosse feito localmente, preservando a privacidade dos utilizadores e reduzindo a dependência dos serviços em nuvem.
Ao dispensar GPU e grandes estruturas de dados, a Microsoft está a apontar para uma possível democratização da utilização de modelos de linguagem. A execução de assistentes de IA localmente, em dispositivos comuns, poderá abrir espaço para novas aplicações em ambientes com acesso limitado à infra-estrutura tecnológica tradicional.