IA de Atendimento e Agendamento: como funciona por dentro

A diferença entre um chatbot de respostas prontas e uma IA que consulta a agenda real e cria o agendamento. Por dentro do RAG por clínica, das ferramentas que a IA executa e de onde ela passa a conversa para um humano.
Como funciona uma IA que atende e agenda de verdade no WhatsApp
Existe uma diferença grande entre um "chatbot de respostas prontas" e uma IA que realmente atende: a segunda entende a conversa, consulta a agenda real e cria o agendamento dentro do sistema. Neste artigo eu explico, de forma técnica, como a IA de atendimento do Iter Clinic funciona por dentro — e, principalmente, onde ela para e devolve a conversa para um humano.
O cérebro: uma base de conhecimento isolada por clínica
Cada clínica tem a sua própria base de conhecimento vetorizada — o que se chama de RAG (retrieval-augmented generation). Quando o paciente envia uma mensagem, o sistema transforma o texto em um vetor e busca, por similaridade semântica, apenas os trechos de conhecimento daquela clínica: preços, procedimentos, horários de funcionamento e regras de atendimento. Isso garante duas coisas ao mesmo tempo: a IA responde com o "DNA" da sua clínica, e o conhecimento de uma clínica nunca aparece na conversa de outra.
As ferramentas reais que a IA executa
O ponto que separa um bot de uma IA de atendimento é este: ela não apenas escreve texto, ela executa ações no sistema.
- Verificar disponibilidade — consulta a agenda real do profissional ou da sala antes de oferecer um horário. Ela não "chuta" um horário livre.
- Criar agendamento — marca de fato na agenda, com paciente, profissional, serviço e horário.
- Buscar paciente — reconhece se o número que está falando já pertence a um paciente cadastrado e personaliza o atendimento.
- Registrar lead — se for um contato novo, ele entra no CRM já com a origem marcada (WhatsApp), alimentando a taxa de conversão por canal.
- Escalar para humano — quando o assunto foge do escopo, ela sinaliza e passa a conversa para a equipe.
Por que a IA "espera" alguns segundos antes de responder
Paciente real não escreve um parágrafo perfeito. Ele manda "oi", depois "queria marcar", depois "uma limpeza de pele", depois "pode ser quinta?" — quatro mensagens em dez segundos. Um bot comum responde quatro vezes, atravessando a fala do paciente. A IA do Iter Clinic usa um mecanismo de debounce: ela aguarda um pequeno intervalo configurável após a última mensagem, junta tudo em um único contexto e responde uma vez só, de forma coerente. Esse atraso é processado fora da função serverless, num serviço dedicado, justamente para não segurar recursos à toa.
Quando a IA fala e quando ela fica em silêncio
A IA só responde quando todas estas condições são verdadeiras ao mesmo tempo: o atendimento por IA está ligado para a clínica, a clínica tem o módulo contratado, a IA está ligada para aquela conversa específica e o horário atual está dentro dos períodos de atividade configurados (no fuso de Brasília). Isso significa que, no instante em que um atendente humano assume um contato, ele desliga a IA só daquela conversa com um clique — sem afetar as outras.
Onde a IA não deve agir sozinha (e isso é proposital)
Uma IA honesta também precisa saber o que não fazer. A IA de atendimento qualifica, tira dúvidas de logística, informa preços e agenda. Ela não dá opinião clínica, não sugere diagnóstico e não substitui a avaliação do profissional de saúde. Esse limite é uma decisão de projeto: o papel dela é tirar da equipe o trabalho repetitivo de marcar e confirmar, liberando o humano para o que exige julgamento.
É essa combinação — conhecimento isolado por clínica, ferramentas que executam de verdade e limites claros — que transforma a IA de um "atendente automático" genérico em uma recepcionista que realmente trabalha pela sua clínica 24 horas por dia.
