A Google continua a intensificar a concorrência no domínio da Inteligência Artificial (IA) com o lançamento do Imagen 3, um novo gerador de imagens que a empresa afirma ser o mais avançado até à data.
Disponível gratuitamente para os utilizadores dos Estados Unidos, o Imagen 3 promete redefinir os padrões da arte gerada pela Inteligência Artificial, ultrapassando outras ferramentas como o Midjourney e o DALL-E 3.
De acordo com um estudo publicado pela própria empresa, o Imagen 3 é capaz de criar imagens de alta qualidade a partir de simples instruções textuais, utilizando um modelo de difusão latente para obter uma maior precisão. Este novo modelo destaca-se pela sua capacidade de lidar com avisos complexos e captar detalhes subtis, como ângulos de câmara específicos, composições elaboradas e iluminação precisa, aspectos que colocam desafios a outros sistemas de IA.
Entre as principais melhorias do Imagen 3 está a sua compreensão avançada dos comandos do utilizador, o que lhe permite criar imagens com detalhes mais nítidos e menos imperfeições visuais. Isto facilita a utilização da ferramenta, eliminando a necessidade de um conhecimento técnico aprofundado para obter resultados de alta qualidade.
Segundo o portal Sapo, a Google também reforçou as medidas de segurança do novo modelo. Em resposta a controvérsias anteriores, o Imagen 3 inclui protecções mais rigorosas para evitar a criação de conteúdos ofensivos ou ilegais. Além disso, a ferramenta não permite a criação de imagens de figuras públicas ou de qualquer material relacionado com armas.
De momento, a Imagen 3 está disponível através da ferramenta ImageFX e da Vertex AI para todos os utilizadores residentes nos EUA. A empresa espera em breve alargar a acessibilidade desta tecnologia às suas outras plataformas, como o gerador de texto Gemini, o Workspace e os Anúncios.