
Análise competitiva com vetorização — mapeie o território semântico dos seus concorrentes
Como usar embeddings para comparar sites por significado, identificar sobreposição semântica com concorrentes e encontrar território não coberto no mercado.
destaques
- Keyword gap compara palavras. Embedding gap compara significado. Os dois revelam coisas diferentes, e ambos têm lugar numa análise competitiva séria.
- Dois sites podem disputar o mesmo território temático sem compartilhar nenhuma keyword. O modelo vetorial enxerga essa sobreposição; o modelo léxico não.
- A análise por parágrafo vai além do nível de página: revela qual seção específica do concorrente está ganhando em determinada busca.
- Territórios com baixa sobreposição semântica podem ser oportunidade real ou simplesmente não ter demanda. Cruzar com volume de busca antes de agir.
- O centróide semântico de um site revela a direção temática do domínio, antes mesmo de olhar página por página.
o limite do keyword gap tradicional
O keyword gap resolve bem um problema específico: encontrar termos que o concorrente ranqueia e você não cobre. É um ponto de partida legítimo para planejamento de conteúdo.
O que ele não resolve: dois sites podem cobrir exatamente o mesmo problema com vocabulário diferente, e o gap de keyword vai mostrar zero sobreposição. Ou podem compartilhar keywords mas tratar de ângulos completamente distintos, e o gap vai sinalizar competição onde não existe de fato.
A vetorização trabalha no plano do significado, não da string. Você compara o que as páginas dizem, não as palavras que usam. É uma análise complementar, não substituta. O analista que usa os dois tem uma visão mais completa do território.
como funciona a comparação vetorial entre sites
O fluxo parte do crawl. Você rastreia cada site com Screaming Frog (Store HTML ativo), gera um embedding por página e, para cada URL do seu site, calcula a similaridade contra todas as páginas de cada concorrente. O resultado é uma tabela com o melhor match por concorrente para cada página sua.
A interpretação dos scores:
Território em disputa. O concorrente tem uma página que cobre o mesmo assunto que a sua. Vale avaliar qual das duas está mais completa e o que pode ser melhorado.
Território não coberto pelo concorrente. Pode ser oportunidade real de diferenciação, ou simplesmente um tema sem demanda. Cruzar com dados de volume de busca antes de agir.
O iPullRank detalha a análise a nível de parágrafo: em vez de comparar páginas inteiras, você compara seções. Isso revela qual parte específica do conteúdo do concorrente está ganhando em determinada query, e qual gap precisa ser preenchido dentro da sua própria página, não necessariamente em uma página nova.
o que fazer com os dados de sobreposição
Territórios em disputa, onde a similaridade com o concorrente é alta, pedem uma análise de profundidade. A pergunta não é só “temos páginas sobre o mesmo assunto”, mas “qual das duas está cobrindo melhor o tema”. Cobertura semântica mais ampla, estrutura mais clara e dados mais atualizados são critérios que o score vetorial não mede, mas que fazem diferença no resultado.
Territórios descobertos, onde nenhum concorrente tem página com alta similaridade, merecem cautela antes de virar pauta. Baixa sobreposição semântica com concorrentes pode significar oportunidade real ou pode significar que aquele ângulo simplesmente não tem audiência. Verificar no GSC e em ferramentas de volume de busca antes de produzir.
Páginas com alta similaridade com múltiplos concorrentes e baixo tráfego próprio são candidatas naturais a revisão. Se o tema tem demanda e os concorrentes estão ranqueando, o problema provavelmente está na qualidade ou profundidade da cobertura, não na ausência do tema.
centróide competitivo — onde cada site mora semanticamente
Além da comparação página a página, é possível comparar o “centro de gravidade” semântico de cada domínio. O centróide de um site é a média vetorial de todas as suas páginas: o ponto que resume para onde aquele domínio aponta tematicamente.
Comparar centróides de dois sites diz, antes mesmo de olhar para páginas individuais, em que direção temática cada um se posiciona. Um blog especializado tem centróide bem definido e compacto. Um portal generalista tem centróide diluído, com baixo Site Focus Score.
O Screaming Frog v22.0 usa o conceito de “most representative page” para identificar a página mais próxima do centróide de um site. Saber qual é essa página para você e para os concorrentes é um dado estratégico útil: ela resume, em algum sentido, o que cada domínio representa para sistemas de recuperação semântica.
performance e escala
A comparação de todas as páginas de um site contra todas as páginas de um concorrente cresce rapidamente. Dois sites de 5.000 páginas geram 25 milhões de comparações. Para análise exploratória, amostragem de 2.000 páginas por site já revela os padrões principais sem comprometer a qualidade da leitura.
As ferramentas práticas para começar: Screaming Frog v22.0 para crawl e geração de embeddings, Python com sentence-transformers e pandas para montar a matriz de similaridade e exportar os pares relevantes.
considerações finais
Análise competitiva vetorial não substitui keyword gap. Adiciona uma camada que o modelo léxico não enxerga: a sobreposição de significado entre sites que usam vocabulários diferentes, e os territórios temáticos que ninguém no mercado está cobrindo.
O resultado prático é uma visão mais honesta do terreno. Você deixa de perguntar “quem ranqueia para essa keyword” e começa a perguntar “quem está cobrindo esse território de significado melhor do que eu”. São perguntas diferentes, com respostas diferentes, e frequentemente mais acionáveis.

Lucas Cassapula
Sócio & Head de SEO na Wesearch e Co-founder da Mentionflow
Sou sócio da Wesearch e Co-founder da Mentionflow. Trabalho com SEO há quase 10 anos. Geek de carteirinha e viciado em dados. Vivo testando hipóteses, caçando padrões e tirando ideias do papel. Sempre compartilho estudos, testes e automações que envolvam o universo de SEO e GEO.