Visão geral da automação
Fluxo completo de ponta a ponta
Cliente manda mensagem no WhatsApp
↓
WAHA recebe a mensagem
↓
n8n processa (fluxo automático)
↓
Gemini gera resposta (IA)
↓
(opcional) gera áudio
↓
WAHA envia resposta no WhatsApp
Tudo rodando em VPS na nuvem, 24h por dia, mesmo com seu PC desligado.
Passo a passo completo
Criar servidor na nuvem (VPS)
Provedores recomendados: Contabo, Hetzner, DigitalOcean. Configuração mínima: 2 CPU, 4GB RAM, Ubuntu 22.04.
Acessar servidor via SSH (Windows/PowerShell)
ssh root@IP_DO_SERVIDOR Exemplo: ssh root@123.45.67.89
Digite a senha da VPS quando solicitado.
Instalar Docker (obrigatório)
apt update && apt upgrade -y apt install -y ca-certificates curl gnupg install -m 0755 -d /etc/apt/keyrings curl -fsSL https://download.docker.com/linux/ubuntu/gpg | tee /etc/apt/keyrings/docker.asc chmod a+r /etc/apt/keyrings/docker.asc echo \ "deb [arch=$(dpkg --print-architecture) signed-by=/etc/apt/keyrings/docker.asc] https://download.docker.com/linux/ubuntu \ $(. /etc/os-release && echo "$VERSION_CODENAME") stable" | \ tee /etc/apt/sources.list.d/docker.list apt update apt install -y docker-ce docker-ce-cli containerd.io docker-buildx-plugin docker-compose-plugin
docker --version
Criar estrutura do projeto
mkdir whatsapp-ia cd whatsapp-ia nano docker-compose.yml
Configurar WAHA + n8n no Docker Compose
version: "3.8"
services:
waha:
image: devlikeapro/waha
container_name: waha
restart: always
ports:
- "3000:3000"
n8n:
image: n8nio/n8n
container_name: n8n
restart: always
ports:
- "5678:5678"
environment:
- GENERIC_TIMEZONE=America/Sao_Paulo
- N8N_BASIC_AUTH_ACTIVE=true
- N8N_BASIC_AUTH_USER=admin
- N8N_BASIC_AUTH_PASSWORD=123456
volumes:
- n8n_data:/home/node/.n8n
volumes:
n8n_data:
Salvar no nano: CTRL + X, Y, ENTER.
Subir os serviços
docker compose up -d
Acessar painéis
n8n: http://IP:5678 Login: admin / 123456 WAHA: http://IP:3000
Conectar WhatsApp no WAHA
Crie sessão no WAHA, escaneie o QR Code com seu WhatsApp e finalize a conexão.
Pegar API Key do Gemini (grátis)
Criar workflow no n8n
1) Node Webhook (POST, path: whatsapp).
2) WAHA envia payload como:
{
"body": "oi",
"from": "5511999999999"
}
3) Node HTTP Request para Gemini:
POST
https://generativelanguage.googleapis.com/v1beta/models/gemini-pro:generateContent?key=SUA_API_KEY
{
"contents": [
{
"parts": [
{
"text": "Responda como um vendedor profissional: {{$json.body}}"
}
]
}
]
}
4) Capturar resposta em: candidates[0].content.parts[0].text.
Transformar texto em áudio (opcional)
Opções gratuitas/parciais: Google TTS via API ou ElevenLabs (plano free).
https://texttospeech.googleapis.com/v1/text:synthesize
Enviar resposta de volta no WhatsApp
Texto:
POST http://waha:3000/api/sendText
{
"chatId": "{{$json.from}}",
"text": "{{$json.resposta}}"
}
Áudio:
POST /sendVoice Body com base64 do áudio
Conectar WAHA com webhook do n8n
http://n8n:5678/webhook/whatsapp
O que você terá no final
✅ Cliente manda mensagem ✅ IA responde automaticamente ✅ Resposta em texto ✅ Resposta em áudio ✅ Funciona 24h ✅ Sem celular ligado
Se quiser usar a Focry sem limite
Ative uma solução mais rápida e prática para automatizar seu WhatsApp sem montar toda essa infraestrutura.
Ir para focry.com.br