📡 Por que pesquisa ao vivo
Um LLM sozinho responde com o que aprendeu no treino — e o treino tem uma data de corte. Pergunte a ele sobre a empresa do cliente e ele inventa ou usa dado velho. A pesquisa ao vivo resolve isso: a Perplexity busca a empresa na internet no momento em que você roda a Fábrica.
✗ Só o LLM (estático)
- ✗Conhecimento congelado na data de corte
- ✗Inventa números e fatos plausíveis (alucina)
- ✗Não vê a notícia de ontem nem a rodada de ontem
- ✗Recomenda ferramenta que já foi substituída
✓ Com pesquisa ao vivo
- ✓Rodou em junho/2026 → puxa até junho/2026
- ✓Fatos com fonte citável, não chute
- ✓Se o n8n for substituído, ele sabe
- ✓Recomendações se atualizam sozinhas
💡 A frase que define a Fase 1
"É isso que torna tudo atualizado e não estático." A pesquisa ao vivo é o que separa um pacote genérico de um diagnóstico que fala do presente daquela empresa. Sem ela, você entrega um template; com ela, você entrega consultoria.
fatos de hoje
citável
menos alucinação
acompanha o mercado
⚖️ Quick vs Deep e custo
A Fábrica tem dois modos de pesquisa, e você escolhe em tempo real para controlar o custo. O modo quick faz uma avaliação rápida com as queries essenciais; o comprehensive investiga fundo, usando modelos mais caros.
| Modo | Queries | Modelos | Custo | Quando usar |
|---|---|---|---|---|
| Quick | ~9 | sonar | ~US$0,05 | avaliação rápida, lead, demo |
| Comprehensive | ~18 | sonar, sonar-pro, deep-research | ~US$0,50 | estratégia completa, cliente pago |
sonar — o cavalo de carga
Barato e rápido. Faz as queries de prioridade alta do quick mode. É o suficiente para entender o essencial da empresa.
sonar-pro — mais profundo
Respostas mais ricas e mais caras (US$0,015/1K de saída). Entra no comprehensive para as categorias que pedem detalhe.
deep-research — a investigação
Para os temas que valem um mergulho — concorrência e iniciativas de IA. Só no comprehensive, onde o custo se justifica.
💡 Regra de bolso de custo
Comece sempre no quick para qualificar o lead. Suba para comprehensive só quando o cliente está fechado — a diferença de 10× no custo (US$0,05 → US$0,50) ainda é centavos diante do que você cobra pelo pacote.
9 queries · sonar
18 queries · pro/deep
em tempo real
custo < US$1
🗓️ Contexto temporal nas queries
Uma query sem data devolve resultado de qualquer época. A Fábrica injeta a data atual em cada template através do TemporalContext — e define um filtro de recência (day, week, month ou year) por categoria.
// template antes e depois da injeção temporal
# template cru (placeholders)
"{company_name} latest news announcements {current_month_year}"
# renderizado para junho de 2026
"Stripe latest news announcements June 2026"
recency_filter = "month" # só notícias do último mês
✓ Com contexto temporal
- ✓
{current_year}e{current_month_year}viram a data real - ✓Notícias filtradas por
month; setor poryear - ✓"deste mês" significa este mês mesmo
✗ Sem contexto temporal
- ✗Mistura artigo de 2022 com o de ontem
- ✗"últimas notícias" vira um amontoado sem idade
- ✗O diagnóstico nasce desatualizado
💡 Recência por categoria
Notícias e iniciativas de IA pedem month (mudam rápido). Perfil da empresa, setor e regulação aguentam year. Casar a recência com a volatilidade do tema é o que evita ruído.
data nas queries
day/week/month/year
{current_year}
no presente
🗂️ As 9 categorias de query
A pesquisa cobre a empresa por nove lentes. Cada template carrega uma categoria, uma prioridade (1 = mais alta) e uma flag required_for_quick_mode — é ela que decide se a query entra já no modo rápido.
🏢 Empresa
Modelo de negócio, produtos, tamanho, sede. A base do perfil.
📈 Setor
Tamanho de mercado, tendências, desafios e oportunidades.
⚔️ Concorrência
Quem são os rivais e como eles adotam IA.
🧰 Tecnologia
Stack, plataformas e infraestrutura da empresa.
🤖 Iniciativas de IA
Projetos de IA da empresa, adoção e casos de uso do setor.
⚖️ Regulatório
Regras do setor, compliance de IA e privacidade de dados.
📰 Notícias
Anúncios e desenvolvimentos recentes (recência month).
👔 Liderança
CEO, executivos e time de gestão.
💵 Investimento
Rodadas, valuation e investidores.
📊 Quem entra no quick mode
- •Sempre (quick): empresa, setor, concorrência, IA e notícias — as lentes que respondem "o essencial".
- •Só no comprehensive: liderança, investimento, tech stack detalhado e regulatório — o aprofundamento.
- •A prioridade ordena a execução: o que é priority 1 roda primeiro.
empresa→notícias
1 = primeiro
entra no rápido?
empresa inteira
🛟 Agregar e tratar (degradação graciosa)
APIs falham. Uma query estoura, outra bate no rate limit. A Fábrica não trava por isso: o cliente da Perplexity tem retry com backoff exponencial e, se mesmo assim a busca cair, o pipeline segue com os dados parciais.
// política de resiliência do cliente
max_retries = 3 initial_delay = 1.0 # segundos max_delay = 30.0 backoff_multiplier = 2.0 # 1s → 2s → 4s ... rate_limit = 2.0 # pausa entre chamadas Perplexity
✓ Degradação graciosa
- ✓Query falha → segue com dados parciais
- ✓Entregável falha → marca e continua os outros
- ✓Diagrama falha → pula a imagem, mantém o markdown
✗ Sem degradação
- ✗Uma falha derruba a sessão inteira
- ✗Refaz tudo (e paga de novo) por um erro só
- ✗Rate limit vira parede em vez de pausa
💡 Parcial > nada
Um pacote com 8 das 9 categorias ainda é um pacote entregável — você anota a lacuna e segue. Resiliência não é não falhar; é falhar sem desmoronar.
3× com backoff
pausa de 2s
segue mesmo assim
não desmorona
📥 Montar o ResearchOutput
O fim da Fase 1 é um objeto estruturado: o ResearchOutput. Ele junta tudo o que a pesquisa achou e vira o contrato que a Síntese consome — além de ser salvo em research_cache.json para não pesquisar (nem pagar) duas vezes.
// o objeto que fecha a Fase 1
class ResearchOutput:
company_name: str # "Stripe"
raw_research: dict # categoria → achados
sources: list # URLs citáveis
cost: float # quanto custou a pesquisa
Agrega por categoria
Cada resposta da Perplexity é guardada sob a sua categoria em raw_research. A Síntese sabe onde achar "concorrência" ou "dores".
Guarda as fontes
As URLs vão para sources. É o que permite citar e o que dá credibilidade ao pacote final.
Cacheia em disco
Tudo vai para research_cache.json. Rodar de novo a Síntese não dispara nova pesquisa — economia direta.
💡 Saída estruturada é contrato
Quando a Fase 1 entrega um objeto previsível, a Fase 2 fica confiável. O ResearchOutput é a fronteira limpa entre pesquisar e escrever — e o cache transforma centavos em zero na segunda rodada.
objeto previsível
citável
não paga 2×
alimenta a Fase 2
✅ Resumo do módulo
🎯 Missão 4.1 — Pesquisa quick de 1 empresa
Rode a Fase 1 em modo quick para uma empresa que você conhece e olhe o resultado das 9 categorias.
- Peça ao Claude Code: "rode a pesquisa quick da Fábrica para a empresa X".
- Confira que as queries saíram com a data atual injetada.
- Abra o
research_cache.jsone veja as 9 categorias e as fontes. - Anote qual categoria veio mais fraca — é onde o deep mode ajudaria.
Sucesso: um ResearchOutput estruturado, com fontes, por ~US$0,05. O que você ganhou: a matéria-prima factual que alimenta os 15 prompts do próximo módulo.
Próximo módulo:
4.2 — Os 15 prompts de entregáveis (a Fase 2: Avaliação, Planejamento, Implementação, Governança e Recursos)