Conteúdo Técnico · Optimus Data Technology

Introdução

O Pêndulo é uma plataforma digital voltada ao relacionamento entre cidadãos e mandatos parlamentares municipais. Seu objetivo é simples e operacional: permitir que informações oficiais das câmaras municipais sejam consultadas diretamente na fonte, de forma acessível e auditável.

Na prática, isso significa: consultas públicas de dados legislativos, acesso facilitado a informações de votação e documentos oficiais, atendimento automatizado via canais populares (ex.: WhatsApp) e redução de dependência de intermediários.

Do ponto de vista técnico, o Pêndulo não foi concebido como “uma aplicação de IA”. Ele é uma plataforma de integração e dados que utiliza IA apenas onde ela agrega valor real. A premissa central é:

IA é um componente do projeto, não o cérebro do projeto.

1) Princípios arquitetônicos

O Pêndulo foi projetado com cinco premissas:

Determinismo sempre que possível
Auditabilidade das decisões
Baixo custo operacional (CPU-only quando viável)
Soberania de dados
IA como componente, não como núcleo

Em ambientes governamentais, previsibilidade tende a ser mais importante do que “criatividade”.

2) Visão geral da arquitetura

Diagrama simplificado

Visão em camadas (alto nível):

                 WhatsApp / Web
                        │
                        ▼
              Gateway / Orquestrador
                        │
        ┌───────────────┼────────────────┐
        ▼               ▼                ▼
 Interpretador     Gerador de Query     Camada IA
 (NER + regras)    (SQL determinístico) (RAG + LLM)
        │               │                │
        ▼               ▼                ▼
 Catálogos         Banco relacional    Banco vetorial
 Redis cache       Dados oficiais      Documentos

Intenção do desenho

Resolver consultas estruturadas com determinismo (mais rápido e barato).
Acionar IA apenas quando há ganho real (texto longo, semântica, documentos).
Preservar rastreabilidade: decisão → dados → resposta.
Operar bem em ambientes restritos (CPU-only e recursos locais).

3) Camadas do sistema

Frontend conversacional

WhatsApp como canal principal
Linguagem natural + menus guiados
Baixa fricção de acesso

Gateway / Orquestração

Controle de fluxo
Logs e observabilidade
Validações e rate limiting

Resolvers

Interpretador (NER + regras)
Gerador de query (SQL)
Cache (Redis)

4) Interpretador determinístico (NER específico)

Grande parte das consultas do Pêndulo é estruturada (ranking, votos por bairro, filtros por cidade/ano/turno). Nesses casos, usar LLM tende a ser mais caro, mais lento e menos previsível.

Por isso, o Pêndulo privilegia um interpretador determinístico com: normalização, catálogos, reconhecimento específico de entidades e validações cruzadas.

Saída típica

intenção: consultar_votos
entidades: candidato=Sonaira, cidade=Franco da Rocha
filtros: ano=2024, top=10, ordem=asc

Isso permite responder com exatidão e rastreabilidade, especialmente quando a resposta depende de dados estruturados.

5) Gerador de queries

Para respostas numéricas e estruturadas, o SQL funciona como “motor de verdade”: consultas parametrizadas, agregações corretas, limites explícitos e possibilidade de reprodução.

SQL determinístico Parametrização segura Agregação Auditabilidade Cache (Redis)

Quando a pergunta é estruturada, SQL supera LLM em precisão, custo e previsibilidade.

6) Camada IA (RAG + LLM)

Quando a IA entra

Perguntas com ambiguidade semântica
Interpretação de documentos (normas, atas, regimentos)
Geração de texto longo com coerência
Contexto não estruturado

Componentes típicos

Banco vetorial (embeddings)
RAG (recuperação de trechos relevantes)
LLM local (quando viável) ou LLM paga (quando necessário)
Políticas de segurança e avaliação

O objetivo da camada IA é reduzir alucinações e apoiar respostas contextualizadas com base em fontes controladas. A IA não substitui validação, catálogo, regras e banco relacional.

7) WhatsApp como frontend

O WhatsApp impõe um canal linear e com pouco espaço para instruções longas. Por isso, o Pêndulo adota um padrão híbrido: prompt orientado + menus/atalhos, com confirmações quando o risco de ambiguidade é alto.

Prompts guiados e objetivos
Confirmação de entidades quando necessário
Redução de “chat livre” para operações críticas
Conversa como comando estruturado

8) Trade-offs arquitetônicos

LLM local (CPU-only)

Vantagens

Soberania e privacidade
Custo mais previsível
Menor dependência externa

Desvantagens

Latência maior
Qualidade limitada sem modelos maiores
Operação/tuning mais complexos

LLM paga (API)