Inteligência Artificial

Como eu treinei uma IA para gerar imagens de mim mesmo por menos de R$ 10

22 de outubro de 2024

Fábio Figueiroa

Um dos aspectos mais legais da revolução da IA é a geração de imagens e vídeos.

Alguns meses atrás, o Flux, um modelo open-source para gerar imagens, foi lançado e chamou muita atenção online porque conseguia fazer imagens realistas de um jeito incrível.

Hoje, o Flux é um dos modelos que compete diretamente com o Midjourney, e tem duas vantagens importantes: ele é mais barato e a API é mais fácil de usar.

Para testar tudo isso, decidi me desafiar: gerar novas imagens de mim mesmo a partir das minhas fotos.

Segui o tutorial do Generative AI Pub e, em menos de uma hora e com menos de R$ 10, consegui resultados bem legais. Abaixo está um exemplo de uma das imagens que criei.

Para fazer o mesmo, você vai precisar:

Pelo menos 10 fotos suas, claras e em boa definição
Uma conta no Replicate
Um método de pagamento para treinar o modelo de IA (o custo ficará entre R$ 5 e R$ 10)

Se você já tem tudo isso, vamos começar!

Treinando o Flux no Replicate

Passo 1: Prepare suas fotos de treinamento

A primeira coisa a fazer é preparar suas fotos. Reúna pelo menos 10 fotos suas — pode ser um mix de selfies e fotos espontâneas que você já tem no celular.

Essas fotos precisam mostrar seu rosto bem claramente, e quanto mais variedade você tiver nos ângulos e na iluminação, melhor.

Pense em fotos ao ar livre, em diferentes momentos do dia, para ajudar o Flux a aprender melhor e ser mais criativo.

Você pode usar fotos nos formatos WebP, JPG ou PNG
Escolha fotos em HD, de preferência com resolução de pelo menos 1024×1024
Os nomes dos arquivos e a proporção não importam, então pode ser do jeito que estão

Quanto mais diversas forem suas fotos, melhores serão os resultados. Claro, usar mais fotos pode fazer o treinamento demorar mais, mas vale a pena para ter aquelas imagens perfeitas!

Depois de reunir suas fotos, coloque todas em um arquivo zip (sem senha). Você pode dar qualquer nome ao arquivo zip.

Passo 2: Escolha uma Palavra-Chave Única

Agora precisamos escolher uma “palavra-chave” — uma palavra única que você vai usar para identificar suas imagens ao gerar novas.

Não use palavras genéricas como “homem” ou “cachorro”.

Em vez disso, use algo mais pessoal, como o seu nome, por exemplo: “AntonioJose”.

Aqui estão algumas dicas para escolher sua palavra-chave:

Deve ser algo único, como MEUNOME. Pense nisso como uma placa de carro personalizada.
Não deve ser uma palavra que já exista, como “dog” ou “cyberpunk”.
Não deve ser algo como “TOK”, pois isso pode causar conflitos se você quiser combinar vários modelos.
Tanto faz usar maiúsculas ou minúsculas, mas letras maiúsculas podem ajudar a destacar a palavra do resto do texto.

Guarde essa palavra-chave, pois você vai precisar dela quando formos treinar o modelo.

Passo 3: Treine o Modelo de Imagem Flux

Agora vem a parte mais divertida: treinar o modelo! Entre na sua conta do Replicate e, na aba “Explore”, procure pelo “flux-dev-lora-trainer”.

Na seção “Create training”, você vai definir onde o modelo será salvo. Pode usar um modelo que já exista ou criar um novo.

No nosso exemplo, vamos criar um novo modelo chamado “ffmedia-flux” para treinar com minhas próprias fotos.

Ah, e não se esqueça de definir a visibilidade como “privada” para que ninguém mais tenha acesso ao seu modelo.

Na seção de imagens de entrada, faça o upload do arquivo zip com suas fotos.

Depois disso, escolha a palavra-gatilho que definimos no passo 2.

Deixe os outros campos como estão e clique em “Create training”. Pronto, agora é só esperar!

Lembre-se: o treinamento só vai começar se você adicionar um método de pagamento.

O processo de treinamento leva cerca de 20 minutos, mas pode variar dependendo da fila. Para acompanhar o progresso, vá até a página “Trainings” e selecione o modelo que está em treinamento.

Quando o treinamento acabar, você verá uma mensagem dizendo que deu tudo certo.

Gerando Imagens

Agora chegou a hora de testar o modelo!

Clique em “Run trained model” para começar. Quando adicionar seu prompt, não esqueça de incluir sua palavra-chave para mostrar a imagem que você treinou e ver o resultado incrível nas fotos.

Você já pode começar a gerar suas imagens personalizadas. Vamos tentar um exemplo!

Na geração de imagem acima, eu usei como palavra chave “fabioffmedia” e pedi para o gerador de imagem me colocar passeando na China.

Usei o prompt em inglês porque esses sistemas de imagem funcionam melhor com a língua. Se tiver dificuldades com inglês, experimente usar o Google Tradutor.

E agora é só brincar!

Abaixo, algumas imagens que eu gerei de mim mesmo.