Como eu treinei uma IA para gerar imagens de mim mesmo por menos de R$ 10

Um dos aspectos mais legais da revolução da IA é a geração de imagens e vídeos.

Alguns meses atrás, o Flux, um modelo open-source para gerar imagens, foi lançado e chamou muita atenção online porque conseguia fazer imagens realistas de um jeito incrível.

Hoje, o Flux é um dos modelos que compete diretamente com o Midjourney, e tem duas vantagens importantes: ele é mais barato e a API é mais fácil de usar.

Para testar tudo isso, decidi me desafiar: gerar novas imagens de mim mesmo a partir das minhas fotos.

Segui o tutorial do Generative AI Pub e, em menos de uma hora e com menos de R$ 10, consegui resultados bem legais. Abaixo está um exemplo de uma das imagens que criei.

Para fazer o mesmo, você vai precisar:

  • Pelo menos 10 fotos suas, claras e em boa definição
  • Uma conta no Replicate
  • Um método de pagamento para treinar o modelo de IA (o custo ficará entre R$ 5 e R$ 10)

Se você já tem tudo isso, vamos começar!

Treinando o Flux no Replicate

Passo 1: Prepare suas fotos de treinamento

A primeira coisa a fazer é preparar suas fotos. Reúna pelo menos 10 fotos suas — pode ser um mix de selfies e fotos espontâneas que você já tem no celular.

Essas fotos precisam mostrar seu rosto bem claramente, e quanto mais variedade você tiver nos ângulos e na iluminação, melhor.

Pense em fotos ao ar livre, em diferentes momentos do dia, para ajudar o Flux a aprender melhor e ser mais criativo.

  • Você pode usar fotos nos formatos WebP, JPG ou PNG
  • Escolha fotos em HD, de preferência com resolução de pelo menos 1024×1024
  • Os nomes dos arquivos e a proporção não importam, então pode ser do jeito que estão

Quanto mais diversas forem suas fotos, melhores serão os resultados. Claro, usar mais fotos pode fazer o treinamento demorar mais, mas vale a pena para ter aquelas imagens perfeitas!

Depois de reunir suas fotos, coloque todas em um arquivo zip (sem senha). Você pode dar qualquer nome ao arquivo zip.

Passo 2: Escolha uma Palavra-Chave Única

Agora precisamos escolher uma “palavra-chave” — uma palavra única que você vai usar para identificar suas imagens ao gerar novas.

Não use palavras genéricas como “homem” ou “cachorro”.

Em vez disso, use algo mais pessoal, como o seu nome, por exemplo: “AntonioJose”.

Aqui estão algumas dicas para escolher sua palavra-chave:

  • Deve ser algo único, como MEUNOME. Pense nisso como uma placa de carro personalizada.
  • Não deve ser uma palavra que já exista, como “dog” ou “cyberpunk”.
  • Não deve ser algo como “TOK”, pois isso pode causar conflitos se você quiser combinar vários modelos.
  • Tanto faz usar maiúsculas ou minúsculas, mas letras maiúsculas podem ajudar a destacar a palavra do resto do texto.

Guarde essa palavra-chave, pois você vai precisar dela quando formos treinar o modelo.

Passo 3: Treine o Modelo de Imagem Flux

Agora vem a parte mais divertida: treinar o modelo! Entre na sua conta do Replicate e, na aba “Explore”, procure pelo “flux-dev-lora-trainer”.

Na seção “Create training”, você vai definir onde o modelo será salvo. Pode usar um modelo que já exista ou criar um novo.

No nosso exemplo, vamos criar um novo modelo chamado “ffmedia-flux” para treinar com minhas próprias fotos.

Ah, e não se esqueça de definir a visibilidade como “privada” para que ninguém mais tenha acesso ao seu modelo.

Na seção de imagens de entrada, faça o upload do arquivo zip com suas fotos.

Depois disso, escolha a palavra-gatilho que definimos no passo 2.

Deixe os outros campos como estão e clique em “Create training”. Pronto, agora é só esperar!

Lembre-se: o treinamento só vai começar se você adicionar um método de pagamento.

O processo de treinamento leva cerca de 20 minutos, mas pode variar dependendo da fila. Para acompanhar o progresso, vá até a página “Trainings” e selecione o modelo que está em treinamento.

Quando o treinamento acabar, você verá uma mensagem dizendo que deu tudo certo.

Gerando Imagens

Agora chegou a hora de testar o modelo!

Clique em “Run trained model” para começar. Quando adicionar seu prompt, não esqueça de incluir sua palavra-chave para mostrar a imagem que você treinou e ver o resultado incrível nas fotos.

Você já pode começar a gerar suas imagens personalizadas. Vamos tentar um exemplo!

Na geração de imagem acima, eu usei como palavra chave “fabioffmedia” e pedi para o gerador de imagem me colocar passeando na China.

Usei o prompt em inglês porque esses sistemas de imagem funcionam melhor com a língua. Se tiver dificuldades com inglês, experimente usar o Google Tradutor.

E agora é só brincar!

Abaixo, algumas imagens que eu gerei de mim mesmo.

Lutando Kung Fu

Como professor

Eu na realidade (kkkk, usei no prompt o termo “bodybuilder)

Compartilhe com seus amigos!

Novos

Mais antigos

Oi, me chamo Fábio. Leia meus textos e minhas ideias abaixo.

Assine a minha newsletter sobre IA e fique por dentro das novidades.

Continue vendo