Conteúdo Duplicado e SEO

O Google procura exibir em seus resultados de busca informação relevante a seus usuários. Que benefício tem uma pessoa ao realizar uma busca no Google e os 10 primeiros resultados forem iguais, cópia de alguma página na internet? Nenhum. Por esse motivo, o índice Google procura oferecer uma variedade de conteúdo exclusivo e diversificado em seus resultados. 

Conteúdo duplicado entre sites ou mesmo dentro de um  mesmo site, então, passa a ser uma preocupação que todo o projeto de SEO deve endereçar. Um bom projeto de SEO, White Hat, deve procurar sempre gerar conteúdo exclusivo, relevante às pessoas pesquisando pelo assunto.

Como acontece a duplicidade

Existem motivos voluntários e involuntários para o surgimento de conteúdo duplicado na internet, como por exemplo:

  • Páginas de impressão - o seu site possui páginas de conteúdo idêntico para páginas de visualização na tela e para impressão, e as duas versões acabam indexadas no Google;
  • Cópia de conteúdo - vários sites institucionais, ao invés de possuírem conteúdo próprio, redigido exclusivamente para o site, copiam conteúdo de outros sites;
  • Scrapers - com o intuito de gerarem rapidamente conteúdo para milhares de páginas, rentabilizando a operação com publicidade Adsense, surgem sites na internet com conteúdo copiado de outros sites na internet. Para isso, utilizam-se de scrapers, robôs que leem o conteúdo da internet atrás de temas específicos e montam automaticamente páginas sobre o assunto;
  • Temas similares - Alguns sites possuem o mesmo rodapé, o mesmo texto institucional no fim de todas as páginas, por exemplo.
  • http://www.meusite.com.br e http://meusite.com.br - O seu servidor web deve tratar as duas versões como uma só, fazendo um redirecionamento permanente de uma versão do site para a outra;

Como identificar conteúdo duplicado

  • Busca Google - Faça uma Busca no Google por um trecho do conteúdo da página entre aspas. Por exemplo, busque no Google por "Faça uma Busca no Google por um trecho do conteúdo da página entre aspas" para saber se esta página já foi copiada.
  • Copyscape - A Ferramenta CopyScape foi desenhada para buscar conteúdo duplicado de uma página. Forneça uma URL e a ferramenta buscará na internet por páginas com trechos duplicados de seu conteúdo, informando o percentual de trechos idênticos e destacando os trechos similares. Possui uma versão gratuita e uma paga, oferecendo mais resultados.
copyscape e conteúdo duplicado

Quanto devo me preocupar com conteúdo duplicado?

Alguns membros da comunidade SEO costumam exagerar a importância de conteúdo duplicado. Aqui na SEO Marketing, desenvolvemos nossos projetos de SEO White Hat com redatores web gerando conteúdo de qualidade e exclusivo. 

A probabilidade de termos problemas com conteúdo duplicado é nula, e o mesmo se aplica para qualquer projeto de SEO de qualidade desenvolvido por outros webmasters. 

Ao mesmo tempo, o algoritmo do Google deve ser o minimamente inteligente para identificar pequenas falhas involuntárias de sites de qualidade. Existem sinais, porém, de que o Google começou a ser menos complacente com esses deslizes. Jill Whallen escreveu um interessante artigo (em inglês) a respeito desse assunto.

Por outro lado, espera-se que o algoritmo do Google consiga interpretar qual o conteúdo original, e exibi-lo dessa forma acima das páginas copiadas. Para isso, um dos fatores utilizados por ele é a data de indexação do conteúdo. 

Quanto mais antigo, maior a probabilidade desse conteúdo ser o original, e com isso ser exibido antes de páginas copiadas. 

Para saber se o seu conteúdo original é de fato o conteúdo considerado original pelo buscador, faça uma busca no Google por um parágrafo de seu conteúdo, iniciando e terminando a busca com aspas. Se o seu site aparecer em primeiro, o Google cumpriu a sua missão!

Algumas soluções e precauções

  • Denunciar - Caso seu conteúdo tenha sido copiado, acesse a Ferramenta Google Search Console e reporte como Spam o site que o copiou. Não é garantido que o Google tome uma ação em relação à denúncia, mas é um primeiro passo. Ao mesmo tempo, a ação do Google pode inclusive já ter sido tomada, caso a empresa tenha identificado automaticamente a duplicidade de conteúdo.
  • Conversar - Em alguns casos, ligar ou enviar um e-mail ao proprietário do site que copiou seu conteúdo resolve o problema, ainda mais se for o seu advogado que realizar a conversa;
  • Seu site - Usando o Copyscape, faça uma busca para cada página de seu site, e veja se páginas do seu próprio site aparecem com conteúdo duplicado, tomando as ações necessárias para corrigir o problema. Redija novo conteúdo ou elimine do índice do Google páginas duplicadas com o Robots.txt;
  • site: - Faça uma busca no Google por site:(url de seu site.com.br) e procure por páginas de conteúdo idêntico;
  • Google Search Console - Acompanhe as informações e analise como os mecanismo de busca veem o seu site;
  • Redirect 301 - Caso o seu site possua páginas duplicadas, como por exemplo a versão com e sem www sendo indexadas, programe em seu servidor um redirecionamento permanente (301) de uma versão para a outra. Veja abaixo como realizar um redirecionamento 301 para servidores Apache;
  • Canonical Tag - Informe ao Google que seu conteúdo não é original. Veja a explicação abaixo;

Redirecionamento 301

Em servidores Apache, o método mais comum de se aplicar o redirecionamento 301 é utilizando o arquivo ".htaccess" . Dentro desse arquivo é inserido um código em expressão regular como por exemplo:

RewriteCond %{HTTP_HOST} ^meusite\.com\.br$ [OR]

RewriteCond %{HTTP_HOST} ^www\.meusite\.com\.br$ [OR]

RewriteCond %{HTTP_HOST} ^meusite\.com\.br\/$

RewriteRule ^index\.html\/?(.*)$ "http\:\/\/www\.meusite\.com\.br\/$1" [R=301,L]

Neste exemplo basta substituir a palavra "meusite" para o nome do seu site.

Canonical Tag

Este é um método mais simples que o anterior, mas também muito eficiente. A utilização da Canonical Tag permite-nos informar ao Google qual a página que possui o conteúdo original, de onde foi copiado o conteúdo. 

Com a sua utilização, podemos copiar trechos ou mesmo páginas inteiras de outras páginas de dentro ou fora de nosso site, sem corrermos o risco de sofrermos alguma penalização por isso. A Canonical Tag é inserida dentro da página que copiou o conteúdo, mais especificamente dentro da tag <head>. Veja o exemplo:

<link rel="canonical" href="www.meusite.com.br"/>

Neste exemplo basta substituir a URL href=”www.meusite.com.br" pela página que possui o conteúdo original, de onde foi copiado o conteúdo.

A SEO Marketing oferece um leque de serviços digitais para aumentar lucrativamente a presença de sua empresa na internet
Serviços
conheça nossos serviços
Logo Seo Marketing
Avenida Ibirapuera, 2033 – 8° andar Conj. 81
Moema – São Paulo - SP - Brasil
SEO SERVIÇOS DE DADOS E APLICAÇÕES NA INTERNET LTDA
CNPJ: 09.171.953/0001-97
hello world!
envelopechevron-down