Optimus Data Technology
Engenharia de Integração, IA e Sistemas Críticos

Arquitetura do Pêndulo

IA aplicada com pragmatismo: determinismo onde possível, linguagem natural onde necessário.

Introdução

O Pêndulo é uma plataforma digital voltada ao relacionamento entre cidadãos e mandatos parlamentares municipais. Seu objetivo é simples e operacional: permitir que informações oficiais das câmaras municipais sejam consultadas diretamente na fonte, de forma acessível e auditável.

Na prática, isso significa: consultas públicas de dados legislativos, acesso facilitado a informações de votação e documentos oficiais, atendimento automatizado via canais populares (ex.: WhatsApp) e redução de dependência de intermediários.

Do ponto de vista técnico, o Pêndulo não foi concebido como “uma aplicação de IA”. Ele é uma plataforma de integração e dados que utiliza IA apenas onde ela agrega valor real. A premissa central é:

IA é um componente do projeto, não o cérebro do projeto.

Sumário

1) Princípios arquitetônicos

O Pêndulo foi projetado com cinco premissas:

  • Determinismo sempre que possível
  • Auditabilidade das decisões
  • Baixo custo operacional (CPU-only quando viável)
  • Soberania de dados
  • IA como componente, não como núcleo

Em ambientes governamentais, previsibilidade tende a ser mais importante do que “criatividade”.

2) Visão geral da arquitetura

Diagrama simplificado

Visão em camadas (alto nível):

                 WhatsApp / Web
                        │
                        ▼
              Gateway / Orquestrador
                        │
        ┌───────────────┼────────────────┐
        ▼               ▼                ▼
 Interpretador     Gerador de Query     Camada IA
 (NER + regras)    (SQL determinístico) (RAG + LLM)
        │               │                │
        ▼               ▼                ▼
 Catálogos         Banco relacional    Banco vetorial
 Redis cache       Dados oficiais      Documentos

Intenção do desenho

  • Resolver consultas estruturadas com determinismo (mais rápido e barato).
  • Acionar IA apenas quando há ganho real (texto longo, semântica, documentos).
  • Preservar rastreabilidade: decisão → dados → resposta.
  • Operar bem em ambientes restritos (CPU-only e recursos locais).

3) Camadas do sistema

Frontend conversacional

  • WhatsApp como canal principal
  • Linguagem natural + menus guiados
  • Baixa fricção de acesso

Gateway / Orquestração

  • Controle de fluxo
  • Logs e observabilidade
  • Validações e rate limiting

Resolvers

  • Interpretador (NER + regras)
  • Gerador de query (SQL)
  • Cache (Redis)

4) Interpretador determinístico (NER específico)

Grande parte das consultas do Pêndulo é estruturada (ranking, votos por bairro, filtros por cidade/ano/turno). Nesses casos, usar LLM tende a ser mais caro, mais lento e menos previsível.

Por isso, o Pêndulo privilegia um interpretador determinístico com: normalização, catálogos, reconhecimento específico de entidades e validações cruzadas.

Saída típica

intenção: consultar_votos
entidades: candidato=Sonaira, cidade=Franco da Rocha
filtros: ano=2024, top=10, ordem=asc

Isso permite responder com exatidão e rastreabilidade, especialmente quando a resposta depende de dados estruturados.

5) Gerador de queries

Para respostas numéricas e estruturadas, o SQL funciona como “motor de verdade”: consultas parametrizadas, agregações corretas, limites explícitos e possibilidade de reprodução.

SQL determinístico Parametrização segura Agregação Auditabilidade Cache (Redis)

Quando a pergunta é estruturada, SQL supera LLM em precisão, custo e previsibilidade.

6) Camada IA (RAG + LLM)

Quando a IA entra

  • Perguntas com ambiguidade semântica
  • Interpretação de documentos (normas, atas, regimentos)
  • Geração de texto longo com coerência
  • Contexto não estruturado

Componentes típicos

  • Banco vetorial (embeddings)
  • RAG (recuperação de trechos relevantes)
  • LLM local (quando viável) ou LLM paga (quando necessário)
  • Políticas de segurança e avaliação

O objetivo da camada IA é reduzir alucinações e apoiar respostas contextualizadas com base em fontes controladas. A IA não substitui validação, catálogo, regras e banco relacional.

7) WhatsApp como frontend

O WhatsApp impõe um canal linear e com pouco espaço para instruções longas. Por isso, o Pêndulo adota um padrão híbrido: prompt orientado + menus/atalhos, com confirmações quando o risco de ambiguidade é alto.

  • Prompts guiados e objetivos
  • Confirmação de entidades quando necessário
  • Redução de “chat livre” para operações críticas
  • Conversa como comando estruturado

8) Trade-offs arquitetônicos

LLM local (CPU-only)

Vantagens

  • Soberania e privacidade
  • Custo mais previsível
  • Menor dependência externa

Desvantagens

  • Latência maior
  • Qualidade limitada sem modelos maiores
  • Operação/tuning mais complexos

LLM paga (API)

Vantagens

  • Melhor qualidade e coerência
  • Menor latência
  • Menos manutenção operacional

Desvantagens

  • Custo variável
  • Dependência do fornecedor
  • Restrições regulatórias e contratuais

Decisão prática

No Pêndulo, a LLM paga é acionada apenas quando: (1) o ganho de qualidade compensa o custo, (2) a tarefa é semântica/textual, e (3) não existe alternativa determinística aceitável.

9) Anti-patterns evitados

  • Usar LLM como banco de dados
  • Gerar números via IA
  • Depender exclusivamente de prompts
  • Ausência de validação/catálogo de entidades
  • “Chat livre” para operações críticas

Conclusão

O Pêndulo demonstra que soluções com IA não exigem “mais IA”, mas melhor arquitetura: entender a pergunta, estruturar o contexto, usar determinismo primeiro e acionar IA apenas quando necessário.

Esse equilíbrio resulta em sistemas mais confiáveis, mais rápidos, mais baratos e auditáveis — especialmente em uso público.