Pular para o conteúdo

Tavily

Tavily

Tavily é uma plataforma de busca e recuperação de informações construída para agentes de IA. Ela oferece endpoints especializados para pesquisa na web, extração de conteúdo de páginas, rastreamento em profundidade de sites e mapeamento de estruturas de URL — tudo com controles precisos de profundidade, domínio e formato. Com a integração Tavily no SquadOS, seus agentes ganham acesso a informações atualizadas da web sem a complexidade de gerenciar scrapers, proxies ou limites de taxa.

Esta ferramenta utiliza chave de API (API_KEY) para conectar.

Você vai precisar dos seguintes campos:

CampoObrigatórioDescrição
api_keySimChave de API gerada no painel Tavily em app.tavily.com, usada para autenticar todas as requisições.
  1. Acesse app.tavily.com/home e crie uma conta (ou faça login se já tiver uma).
  2. No painel, localize a seção API Keys.
  3. Clique no botão ”+” ao lado da seção de API Keys para gerar uma nova chave.
  4. Preencha um nome para a chave, escolha o tipo (Development para até 100 req/min; Production para até 1.000 req/min) e defina um limite mensal opcional de créditos.
  5. Copie a chave gerada — esse é o valor a usar no campo api_key ao conectar no SquadOS.
  1. Acesse Ferramentas no menu lateral (/admin/tools).
  2. Abra a aba Disponíveis e procure por Tavily.
  3. Clique no card para abrir o modal de detalhes e em Conectar.
  4. Você é levado para a página de conexão segura hospedada pela Composio, onde informa a chave de API obtida acima.
  5. Ao concluir, você volta para o SquadOS com a conta conectada e a ferramenta disponível para os agentes. (Detalhes do fluxo em Ferramentas da Organização.)

TAVILY_CRAWL

Realiza rastreamento inteligente de sites com exploração paralela de caminhos e extração de conteúdo. Use quando precisar percorrer e extrair conteúdo de múltiplas páginas de um site seguindo padrões específicos ou instruções em linguagem natural. Suporta controles de profundidade e abrangência, filtragem por domínio e instruções para rastreamento guiado.

NomeTipoObrigatórioDescrição
urlstringSimURL raiz para iniciar o rastreamento. Pode ser fornecida com ou sem protocolo (ex.: docs.tavily.com ou https://docs.tavily.com).
limitintegerNãoTotal de links a processar antes de encerrar o rastreamento.
formatstring ("markdown" | "text")NãoFormato do conteúdo extraído: "markdown" ou "text".
timeoutintegerNãoTempo máximo de espera em segundos para a operação de rastreamento. Intervalo: 10–150.
max_depthintegerNãoProfundidade máxima de rastreamento a partir da URL base. Intervalo: 1–5. Profundidade 1 significa apenas links diretos da URL raiz.
max_breadthintegerNãoNúmero máximo de links a seguir por nível de página.
instructionsstringNãoInstruções em linguagem natural para guiar o rastreador a encontrar páginas ou conteúdos específicos. Usar instruções aumenta o custo para 2 créditos por 10 páginas. Exemplo: "Find all pages about the Python SDK".
select_pathsarrayNãoLista de padrões regex para caminhos de URL específicos a incluir. Exemplo: ['/docs/.*', '/api/.*'].
exclude_pathsarrayNãoLista de padrões regex para caminhos de URL a ignorar. Exemplo: ['/admin/.*', '/private/.*'].
extract_depthstring ("basic" | "advanced")NãoNível de extração: "basic" para extração padrão ou "advanced" para análise mais profunda.
include_usagebooleanNãoSe verdadeiro, inclui informações de uso de créditos na resposta.
allow_externalbooleanNãoSe verdadeiro, inclui links para domínios externos no rastreamento.
include_imagesbooleanNãoSe verdadeiro, inclui imagens nos resultados do rastreamento.
select_domainsarrayNãoLista de padrões regex para filtragem de domínios. Apenas URLs que correspondam a esses padrões serão rastreadas.
exclude_domainsarrayNãoLista de padrões regex para excluir determinados domínios do rastreamento.
include_faviconbooleanNãoSe verdadeiro, inclui as URLs dos favicons nos resultados.
chunks_per_sourceintegerNãoNúmero máximo de trechos de conteúdo por fonte (máx. 500 caracteres cada). Intervalo: 1–5.
NomeTipoObrigatórioDescrição
datastringSimDados retornados pela execução da ação.
errorstringNãoMensagem de erro caso a execução tenha falhado.
successfulbooleanSimIndica se a ação foi executada com sucesso.

TAVILY_EXTRACT

Extrai e analisa o conteúdo de páginas web a partir de URLs especificadas usando o endpoint de extração do Tavily. Use quando precisar recuperar conteúdo limpo e estruturado de páginas, com extração opcional de imagens e reordenação de trechos por relevância em relação a uma consulta.

NomeTipoObrigatórioDescrição
urlsstringSimURL(s) da(s) qual(is) extrair conteúdo. Pode ser uma única URL ou uma lista de URLs.
querystringNãoIntenção do usuário para reordenação dos trechos extraídos. Ajuda a priorizar o conteúdo mais relevante com base na consulta.
formatstring ("markdown" | "text")NãoFormato do conteúdo extraído: "markdown" ou "text". Padrão: "markdown".
timeoutnumberNãoTempo máximo de espera em segundos para a requisição de extração. Deve estar entre 1,0 e 60,0 segundos. Padrão: 30,0.
extract_depthstring ("basic" | "advanced")NãoNível de extração: "basic" para extração padrão ou "advanced" para extração mais aprofundada. Padrão: "basic".
include_usagebooleanNãoSe verdadeiro, inclui informações de uso de créditos na resposta.
include_imagesbooleanNãoSe verdadeiro, inclui uma lista de URLs de imagens encontradas no conteúdo extraído.
include_faviconbooleanNãoSe verdadeiro, inclui a URL do favicon para cada resultado.
chunks_per_sourceintegerNãoNúmero máximo de trechos relevantes a extrair por fonte. Deve estar entre 1 e 5. Padrão: 3.
NomeTipoObrigatórioDescrição
datastringSimDados retornados pela execução da ação.
errorstringNãoMensagem de erro caso a execução tenha falhado.
successfulbooleanSimIndica se a ação foi executada com sucesso.

TAVILY_GET_USAGE

Recupera as estatísticas de uso da chave de API e da conta Tavily. Use quando precisar verificar o consumo de créditos, limites e uso por endpoint para as operações de busca, extração, rastreamento, mapeamento e pesquisa aprofundada.

NomeTipoObrigatórioDescrição
datastringSimDados retornados pela execução da ação.
errorstringNãoMensagem de erro caso a execução tenha falhado.
successfulbooleanSimIndica se a ação foi executada com sucesso.

TAVILY_MAP

Mapeia um site e descobre suas páginas. Use quando precisar escanear um site e obter uma lista estruturada de URLs que ele contém, sem extrair o conteúdo completo de cada página.

NomeTipoObrigatórioDescrição
urlstringSimURL raiz para iniciar o mapeamento (ex.: docs.tavily.com). É o ponto de partida a partir do qual o rastreador descobre e mapeia as páginas.
limitintegerNãoTotal de links a processar antes de encerrar. Mínimo: 1. Padrão: 50.
timeoutintegerNãoNúmero máximo de segundos a aguardar para concluir o mapeamento. Intervalo: 10–150. Padrão: 150.
max_depthintegerNãoQuão longe da URL base o rastreador explora. Intervalo: 1–5. Padrão: 1.
max_breadthintegerNãoNúmero de links a seguir por nível de página. Mínimo: 1. Padrão: 20.
instructionsstringNãoInstruções em linguagem natural para guiar a exploração do rastreador. Usar este parâmetro aumenta o custo para 2 créditos por 10 páginas, em vez de 1.
select_pathsarrayNãoLista de padrões regex para caminhos de URL específicos a incluir (ex.: '/docs/.*' para incluir apenas caminhos de documentação).
exclude_pathsarrayNãoLista de padrões regex para ignorar certos caminhos de URL (ex.: '/admin/.*' para excluir páginas administrativas).
include_usagebooleanNãoSe verdadeiro, inclui detalhes de uso de créditos na resposta. Padrão: falso.
allow_externalbooleanNãoSe verdadeiro, inclui links externos nos resultados. Padrão: verdadeiro.
select_domainsarrayNãoLista de padrões regex para segmentação de domínios. Apenas URLs que correspondam a esses padrões serão incluídas.
exclude_domainsarrayNãoLista de padrões regex para excluir determinados domínios dos resultados do mapeamento.
NomeTipoObrigatórioDescrição
datastringSimDados retornados pela execução da ação.
errorstringNãoMensagem de erro caso a execução tenha falhado.
successfulbooleanSimIndica se a ação foi executada com sucesso.

TAVILY_SEARCH

Realiza uma busca na web via API do Tavily, com controles para profundidade de busca, tipos de conteúdo, quantidade de resultados e filtragem por domínio. Requer uma conexão Tavily ativa (401 indica falha de autenticação). Limite de taxa: ~2 req/s; aplique backoff exponencial em respostas HTTP 429. Os resultados estão aninhados em response_data.results (não é uma lista plana).

NomeTipoObrigatórioDescrição
querystringSimString de consulta para encontrar informações relevantes na web. Não existe filtro de data nativo; incorpore indicadores de tempo diretamente na string de consulta. Para maior abrangência, faça múltiplas consultas focadas em vez de uma consulta ampla.
max_resultsintegerNãoNúmero máximo de resultados de busca a retornar. Valores altos combinados com include_raw_content=true geram payloads muito grandes.
search_depthstring ("basic" | "advanced")NãoProfundidade da busca: "basic" (padrão, 1 crédito de API) ou "advanced" (aprofundada, 2 créditos de API).
include_answerbooleanNãoSe verdadeiro, tenta incluir uma resposta direta à consulta (adequado para perguntas factuais). O campo answer pode ser nulo; use response_data.results como evidência primária.
include_imagesbooleanNãoSe verdadeiro, inclui links para imagens relevantes nos resultados.
exclude_domainsarrayNãoLista de domínios (ex.: ['exclude.com', 'othersite.net']) a excluir dos resultados; resultados desses domínios serão filtrados.
include_domainsarrayNãoLista de domínios específicos (ex.: ['example.com', 'website.org']) para restringir a busca; apenas resultados desses domínios são retornados.
include_raw_contentbooleanNãoSe verdadeiro, inclui o conteúdo bruto dos sites visitados (ex.: HTML ou texto não processado). Sem isso, os resultados podem ser trechos curtos que omitem detalhes importantes.
NomeTipoObrigatórioDescrição
datastringSimDados retornados pela execução da ação.
errorstringNãoMensagem de erro caso a execução tenha falhado.
successfulbooleanSimIndica se a ação foi executada com sucesso.