Como gerar imagens com I.A de graça com Stable Diffusion

Neste artigo vou mostrar a melhor e mais fácil forma de usar o Stable Diffusion online com o Google Colab, de maneira que não precise de um computador muito potente e também que não precise pagar nada.

O que é o Stable Diffusion?

O Stable Diffusion é um modelo de Deep Learning mais especificamente um modelo de latent diffusion criada pela Stability AI que cria imagens a partir de texto, semelhante ao DALLE 2 e ao MidJourney, com a vantagem de ser Open Source e portanto de graça, qualquer um pode usar e alterar o modelo, Stable diffusion pode ser útil também para edição de imagens com técnicas de InPainting, OutPainting e gerar imagens a partir de outra imagen.

O Stable Diffusion pode ser executado em alguns computadores potentes, com uma GPU de pelomenos 8GB de VRAM, mas também tem como rodar na núvem, sem a necessidade de um computador muito forte.

O que é o Google Colab?

O Google Colab é uma plataforma que roda códigos Python em forma de Jupyter Notebooks na nuvem, ela permite e que os usuários executem treinamentos de machine learning e computação de alto desempenho, dessa você pode rodar algoritmos muito pesados sem ter que usar o processamento da sua máquina. Colab também facilita a colaboração em tempo real entre os usuários, permitindo que eles compartilhem facilmente códigos e notebooks.

Interface Automatic1111

O Stable Diffusion criado originalmente pela Stability AI não possui interface gráfica, que dificulta o uso pela maioria das pessoas, portanto um programador chamado Automatic1111 criou uma interface gráfica web que deixa tudo mais simples e visual.

Rodando o Stable Diffusion com Google Colab

Este Jupyter NoteBook contém um código que roda o Stable Diffusion com a interface gráfica Automatic1111.

Para usar este NoteBook, primeiro é preciso configurar, vá até https://huggingface.co/join e crie uma conta, ela é necessária para ter acesso ao modelo do Stable Diffusion.

Agora vá até o modelo do Stable Diffusion em https://huggingface.co/runwayml/stable-diffusion-v1-5 e aceite os termos.

E por ultimo pegue o Token do hugging face em https://huggingface.co/settings/tokens e coloque esse Token no campo Token do Notebook.

Agora é só clicar em todos os botões de Play na ordem, em um momento o NoteBook vai pedir acesso ao seu Google Drive, aceite pois ele vai baixar o modelo do Stable Diffusion e guardar lá.

Depois que todas as caixas foram executadas, na ultima caixa vai ser mostrado o URL público da interface da aplicação na nuvem, basta acessar esse URL que você será redirecionado ao AUTOMATIC1111.

Basta colocar seu input na caixa acima e clicar em Generate, meu input foi “A photo of a dog in mars” ou seja, “Uma foto de um cachorro em marte”, tenha em mente que o interpretador de texto do Stable Diffusion funciona melhor em Inglês então escreva em inglês.

O melhor resultado foi

Você pode brincar com os parâmetros, ver o que cada um faz, mas que tal em estilo de anime? “A photo of a dog in mars, anime”, cfg 15

Mas e se usarmos um prompt mais complexo? “A golden retriever in a space suit in mars, highly detailed, digital painting, artstation, concept art, sharp focus, illustration, art by greg rutkowski and alphonse mucha”

--

--

Love podcasts or audiobooks? Learn on the go with our new app.

Get the Medium app

A button that says 'Download on the App Store', and if clicked it will lead you to the iOS App store
A button that says 'Get it on, Google Play', and if clicked it will lead you to the Google Play store