Módulo 4.1 · Pesquisa ao vivo com Perplexity | Fábrica de Estratégia de IA

📡 Por que pesquisa ao vivo

Um LLM sozinho responde com o que aprendeu no treino — e o treino tem uma data de corte. Pergunte a ele sobre a empresa do cliente e ele inventa ou usa dado velho. A pesquisa ao vivo resolve isso: a Perplexity busca a empresa na internet no momento em que você roda a Fábrica.

✗ Só o LLM (estático)

✗Conhecimento congelado na data de corte
✗Inventa números e fatos plausíveis (alucina)
✗Não vê a notícia de ontem nem a rodada de ontem
✗Recomenda ferramenta que já foi substituída

✓ Com pesquisa ao vivo

✓Rodou em junho/2026 → puxa até junho/2026
✓Fatos com fonte citável, não chute
✓Se o n8n for substituído, ele sabe
✓Recomendações se atualizam sozinhas

💡 A frase que define a Fase 1

"É isso que torna tudo atualizado e não estático." A pesquisa ao vivo é o que separa um pacote genérico de um diagnóstico que fala do presente daquela empresa. Sem ela, você entrega um template; com ela, você entrega consultoria.

Frescor

fatos de hoje

Fontes

citável

Sem chute

menos alucinação

Auto-update

acompanha o mercado

⚖️ Quick vs Deep e custo

A Fábrica tem dois modos de pesquisa, e você escolhe em tempo real para controlar o custo. O modo quick faz uma avaliação rápida com as queries essenciais; o comprehensive investiga fundo, usando modelos mais caros.

Modo	Queries	Modelos	Custo	Quando usar
Quick	~9	`sonar`	~US$0,05	avaliação rápida, lead, demo
Comprehensive	~18	`sonar`, `sonar-pro`, `deep-research`	~US$0,50	estratégia completa, cliente pago

`sonar` — o cavalo de carga

Barato e rápido. Faz as queries de prioridade alta do quick mode. É o suficiente para entender o essencial da empresa.

`sonar-pro` — mais profundo

Respostas mais ricas e mais caras (US$0,015/1K de saída). Entra no comprehensive para as categorias que pedem detalhe.

`deep-research` — a investigação

Para os temas que valem um mergulho — concorrência e iniciativas de IA. Só no comprehensive, onde o custo se justifica.

💡 Regra de bolso de custo

Comece sempre no quick para qualificar o lead. Suba para comprehensive só quando o cliente está fechado — a diferença de 10× no custo (US$0,05 → US$0,50) ainda é centavos diante do que você cobra pelo pacote.

Quick

9 queries · sonar

Deep

18 queries · pro/deep

Escolha

em tempo real

Margem

custo < US$1

🗓️ Contexto temporal nas queries

Uma query sem data devolve resultado de qualquer época. A Fábrica injeta a data atual em cada template através do TemporalContext — e define um filtro de recência (day, week, month ou year) por categoria.

// template antes e depois da injeção temporal

# template cru (placeholders)
"{company_name} latest news announcements {current_month_year}"

# renderizado para junho de 2026
"Stripe latest news announcements June 2026"
recency_filter = "month"   # só notícias do último mês

✓ Com contexto temporal

✓{current_year} e {current_month_year} viram a data real
✓Notícias filtradas por month; setor por year
✓"deste mês" significa este mês mesmo

✗ Sem contexto temporal

✗Mistura artigo de 2022 com o de ontem
✗"últimas notícias" vira um amontoado sem idade
✗O diagnóstico nasce desatualizado

💡 Recência por categoria

Notícias e iniciativas de IA pedem month (mudam rápido). Perfil da empresa, setor e regulação aguentam year. Casar a recência com a volatilidade do tema é o que evita ruído.

Injeção

data nas queries

Recência

day/week/month/year

Placeholders

{current_year}

Frescor

no presente

🗂️ As 9 categorias de query

A pesquisa cobre a empresa por nove lentes. Cada template carrega uma categoria, uma prioridade (1 = mais alta) e uma flag required_for_quick_mode — é ela que decide se a query entra já no modo rápido.

🏢 Empresa

Modelo de negócio, produtos, tamanho, sede. A base do perfil.

📈 Setor

Tamanho de mercado, tendências, desafios e oportunidades.

⚔️ Concorrência

Quem são os rivais e como eles adotam IA.

🧰 Tecnologia

Stack, plataformas e infraestrutura da empresa.

🤖 Iniciativas de IA

Projetos de IA da empresa, adoção e casos de uso do setor.

⚖️ Regulatório

Regras do setor, compliance de IA e privacidade de dados.

📰 Notícias

Anúncios e desenvolvimentos recentes (recência month).

👔 Liderança

CEO, executivos e time de gestão.

💵 Investimento

Rodadas, valuation e investidores.

📊 Quem entra no quick mode

•Sempre (quick): empresa, setor, concorrência, IA e notícias — as lentes que respondem "o essencial".
•Só no comprehensive: liderança, investimento, tech stack detalhado e regulatório — o aprofundamento.
•A prioridade ordena a execução: o que é priority 1 roda primeiro.

9 lentes

empresa→notícias

Prioridade

1 = primeiro

Quick flag

entra no rápido?

Cobertura

empresa inteira

🛟 Agregar e tratar (degradação graciosa)

APIs falham. Uma query estoura, outra bate no rate limit. A Fábrica não trava por isso: o cliente da Perplexity tem retry com backoff exponencial e, se mesmo assim a busca cair, o pipeline segue com os dados parciais.

// política de resiliência do cliente

max_retries        = 3
initial_delay      = 1.0   # segundos
max_delay          = 30.0
backoff_multiplier = 2.0   # 1s → 2s → 4s ...
rate_limit         = 2.0   # pausa entre chamadas Perplexity

Tenta a query. Se falhar, espera (1s, 2s, 4s) e tenta de novo, até 3 vezes.

Esgotou as tentativas? Marca aquela categoria como falha — mas não derruba as outras.

Continua com o que tem. O ResearchOutput nasce com os dados que deram certo. Síntese trabalha com o parcial.

✓ Degradação graciosa

✓Query falha → segue com dados parciais
✓Entregável falha → marca e continua os outros
✓Diagrama falha → pula a imagem, mantém o markdown

✗ Sem degradação

✗Uma falha derruba a sessão inteira
✗Refaz tudo (e paga de novo) por um erro só
✗Rate limit vira parede em vez de pausa

💡 Parcial > nada

Um pacote com 8 das 9 categorias ainda é um pacote entregável — você anota a lacuna e segue. Resiliência não é não falhar; é falhar sem desmoronar.

Retry

3× com backoff

Rate limit

pausa de 2s

Parcial

segue mesmo assim

Robusto

não desmorona

📥 Montar o ResearchOutput

O fim da Fase 1 é um objeto estruturado: o ResearchOutput. Ele junta tudo o que a pesquisa achou e vira o contrato que a Síntese consome — além de ser salvo em research_cache.json para não pesquisar (nem pagar) duas vezes.

// o objeto que fecha a Fase 1

class ResearchOutput:
    company_name: str          # "Stripe"
    raw_research:  dict         # categoria → achados
    sources:       list         # URLs citáveis
    cost:          float        # quanto custou a pesquisa

Agrega por categoria

Cada resposta da Perplexity é guardada sob a sua categoria em raw_research. A Síntese sabe onde achar "concorrência" ou "dores".

Guarda as fontes

As URLs vão para sources. É o que permite citar e o que dá credibilidade ao pacote final.

Cacheia em disco

Tudo vai para research_cache.json. Rodar de novo a Síntese não dispara nova pesquisa — economia direta.

💡 Saída estruturada é contrato

Quando a Fase 1 entrega um objeto previsível, a Fase 2 fica confiável. O ResearchOutput é a fronteira limpa entre pesquisar e escrever — e o cache transforma centavos em zero na segunda rodada.

Estruturado

objeto previsível

Fontes

citável

Cache

não paga 2×

Contrato

alimenta a Fase 2

✅ Resumo do módulo

✓

Pesquisa ao vivo > estático — a Perplexity busca o presente da empresa, com fonte.

✓

Quick vs Deep controla o custo — sonar (~US$0,05) ou sonar-pro/deep-research (~US$0,50).

✓

Contexto temporal e 9 categorias — data injetada, recência por tema, empresa coberta por inteiro.

✓

Degradação graciosa → ResearchOutput — falha sem desmoronar e fecha num objeto cacheável.

🎯 Missão 4.1 — Pesquisa quick de 1 empresa

Rode a Fase 1 em modo quick para uma empresa que você conhece e olhe o resultado das 9 categorias.

Peça ao Claude Code: "rode a pesquisa quick da Fábrica para a empresa X".
Confira que as queries saíram com a data atual injetada.
Abra o research_cache.json e veja as 9 categorias e as fontes.
Anote qual categoria veio mais fraca — é onde o deep mode ajudaria.

Sucesso: um ResearchOutput estruturado, com fontes, por ~US$0,05. O que você ganhou: a matéria-prima factual que alimenta os 15 prompts do próximo módulo.

Próximo módulo:

4.2 — Os 15 prompts de entregáveis (a Fase 2: Avaliação, Planejamento, Implementação, Governança e Recursos)

← Voltar para Trilha Próximo Módulo →