Um dos aspectos mais legais da revolução da IA é a geração de imagens e vídeos.
Alguns meses atrás, o Flux, um modelo open-source para gerar imagens, foi lançado e chamou muita atenção online porque conseguia fazer imagens realistas de um jeito incrível.
Hoje, o Flux é um dos modelos que compete diretamente com o Midjourney, e tem duas vantagens importantes: ele é mais barato e a API é mais fácil de usar.
Para testar tudo isso, decidi me desafiar: gerar novas imagens de mim mesmo a partir das minhas fotos.
Segui o tutorial do Generative AI Pub e, em menos de uma hora e com menos de R$ 10, consegui resultados bem legais. Abaixo está um exemplo de uma das imagens que criei.
Para fazer o mesmo, você vai precisar:
- Pelo menos 10 fotos suas, claras e em boa definição
- Uma conta no Replicate
- Um método de pagamento para treinar o modelo de IA (o custo ficará entre R$ 5 e R$ 10)
Se você já tem tudo isso, vamos começar!
Treinando o Flux no Replicate
Passo 1: Prepare suas fotos de treinamento
A primeira coisa a fazer é preparar suas fotos. Reúna pelo menos 10 fotos suas — pode ser um mix de selfies e fotos espontâneas que você já tem no celular.
Essas fotos precisam mostrar seu rosto bem claramente, e quanto mais variedade você tiver nos ângulos e na iluminação, melhor.
Pense em fotos ao ar livre, em diferentes momentos do dia, para ajudar o Flux a aprender melhor e ser mais criativo.
- Você pode usar fotos nos formatos WebP, JPG ou PNG
- Escolha fotos em HD, de preferência com resolução de pelo menos 1024×1024
- Os nomes dos arquivos e a proporção não importam, então pode ser do jeito que estão
Quanto mais diversas forem suas fotos, melhores serão os resultados. Claro, usar mais fotos pode fazer o treinamento demorar mais, mas vale a pena para ter aquelas imagens perfeitas!
Depois de reunir suas fotos, coloque todas em um arquivo zip (sem senha). Você pode dar qualquer nome ao arquivo zip.
Passo 2: Escolha uma Palavra-Chave Única
Agora precisamos escolher uma “palavra-chave” — uma palavra única que você vai usar para identificar suas imagens ao gerar novas.
Não use palavras genéricas como “homem” ou “cachorro”.
Em vez disso, use algo mais pessoal, como o seu nome, por exemplo: “AntonioJose”.
Aqui estão algumas dicas para escolher sua palavra-chave:
- Deve ser algo único, como MEUNOME. Pense nisso como uma placa de carro personalizada.
- Não deve ser uma palavra que já exista, como “dog” ou “cyberpunk”.
- Não deve ser algo como “TOK”, pois isso pode causar conflitos se você quiser combinar vários modelos.
- Tanto faz usar maiúsculas ou minúsculas, mas letras maiúsculas podem ajudar a destacar a palavra do resto do texto.
Guarde essa palavra-chave, pois você vai precisar dela quando formos treinar o modelo.
Passo 3: Treine o Modelo de Imagem Flux
Agora vem a parte mais divertida: treinar o modelo! Entre na sua conta do Replicate e, na aba “Explore”, procure pelo “flux-dev-lora-trainer”.
Na seção “Create training”, você vai definir onde o modelo será salvo. Pode usar um modelo que já exista ou criar um novo.
No nosso exemplo, vamos criar um novo modelo chamado “ffmedia-flux” para treinar com minhas próprias fotos.
Ah, e não se esqueça de definir a visibilidade como “privada” para que ninguém mais tenha acesso ao seu modelo.
Na seção de imagens de entrada, faça o upload do arquivo zip com suas fotos.
Depois disso, escolha a palavra-gatilho que definimos no passo 2.
Deixe os outros campos como estão e clique em “Create training”. Pronto, agora é só esperar!
Lembre-se: o treinamento só vai começar se você adicionar um método de pagamento.
O processo de treinamento leva cerca de 20 minutos, mas pode variar dependendo da fila. Para acompanhar o progresso, vá até a página “Trainings” e selecione o modelo que está em treinamento.
Quando o treinamento acabar, você verá uma mensagem dizendo que deu tudo certo.
Gerando Imagens
Agora chegou a hora de testar o modelo!
Clique em “Run trained model” para começar. Quando adicionar seu prompt, não esqueça de incluir sua palavra-chave para mostrar a imagem que você treinou e ver o resultado incrível nas fotos.
Você já pode começar a gerar suas imagens personalizadas. Vamos tentar um exemplo!
Na geração de imagem acima, eu usei como palavra chave “fabioffmedia” e pedi para o gerador de imagem me colocar passeando na China.
Usei o prompt em inglês porque esses sistemas de imagem funcionam melhor com a língua. Se tiver dificuldades com inglês, experimente usar o Google Tradutor.
E agora é só brincar!
Abaixo, algumas imagens que eu gerei de mim mesmo.