+34 638350949info@seoparaweb.es

Contenido duplicado: el principal enemigo del posicionamiento web

Tener contenido duplicado en tu web puede penalizar tu posicionamiento web: usa rel canonical, next-prev y redirecciones 301

El contenido duplicado dentro de un mismo sitio web o entre sitios distintos (subdominios, o incluso páginas web ajenas) constituye una de las principales razones de penalización por parte de Google.

Hace ya tiempo que los algoritmos de Google empezaron a controlar la autenticidad del contenido de las páginas web, para limitar lo más posible las violaciones de copyright y el uso indiscriminado de contenido (sobre todo textual) de otros webmasters o blogger, con el fin de retroalimentar páginas webs en tiempo cero.

Este control también afecta a las duplicidades internas de los sitios web, ya que si según lógica:

MÁS PÁGINAS = MÁS CONTENIDO = MÁS ELEMENTOS ÚTILES PARA EL POSICIONAMIENTO

Según los rastreadores de Google:

MÁS PÁGINAS DUPLICADAS = MÁS CONTENIDO DUPLICADO = SITIO MÁS PENALIZABLE

Resulta por lo tanto fundamental evitar el contenido duplicado para conseguir un buen posicionamiento SEO.

TIPOS DE CONTENIDO DUPLICADO Y CÓMO DETECTARLO

Para resolver los posibles problemas de duplicidad en un sitio web, es muy importante entender cuáles son las tipologías más comunes de duplicidad que pueden tener lugar entre un conjunto de páginas.

De hecho, el contenido duplicado no sólo se genera al copiar contenido de otros sitios web (artículos por ejemplo), o utilizar el mismo contenido en más páginas de una misma web. Éstas son duplicidades obvias, que cualquier SEO tiene que evitar a toda costa.

Pero hay otras formas en las que se puede generar contenido duplicado sin que te estés dando cuenta. Aquí va una lista:

1)     Duplicidad por URIs, www.  y símbolo /

Es muy común que la página inicial de una web se pueda mostrar en los navegadores de estas formas:

–        www.misitio.com

–        www.misitio.com/index.html

–        www.misitio.com/

–        misitio.com

–        misitio.com/index.html

–        misitio.com/

Todas estas direcciones apuntan a la misma página, es decir que muestran el mismo contenido. O más en general: si en un sitio se puede llegar a la misma página a través de distintas direcciones URL, todas ellas son duplicidades. Bastará con hacer una prueba manual.

Si escribes en la barra de navegación la dirección de tu web según todas las opciones mencionadas, y cada una te muestra la home sin cambiar automáticamente de URL, entonces estás incurriendo en el más clásico error de contenido duplicado.

2)     Duplicidad de fichas de productos Si el sitio web es una tienda on-line es muy probable que los productos de una línea (o de todas las líneas) tengan una ficha particular.

Si a esa ficha se puede llegar a través distintas URLs, entonces estás cayendo otra vez en contenido duplicado. Por ejemplo: si vendes vinilos online y uno de tu productos se llama “Vinilo estilo oriental”, comprueba si a la ficha de este tipo de vinilo se puede llegar con diferentes URLs:

http://tienda-de-vinilos.com/vinilos/vinilo-estilo-oriental

http://tienda-de-vinilos.com/decoracion/vinilos/vinilo-estilo-oriental

http://tienda-de-vinilos.com/vinilos/estilos/oriental/vinilo-estilo-oriental

Si todas apuntan a la misma ficha, ya sabes…contenido duplicado a ojos de Google!

3)     Duplicidad por paginación de resultados Éste es el tipo de duplicidad típica de los blogs o foros, que reutilizan siempre la misma estructura para presentar el contenido, que cambia solamente a nivel textual.

La presentación del contenido suele ser por páginas (Anterior – Siguiente, o bien Primera – 2 – 3 – 4 – Última), como en cualquier buscador, incluido el propio Google.

El mismo tipo de paginación se suele dar en el comercio electrónico: los resultados de una búsqueda de productos se paginan en lotes de 20/30/50 o lo que sea. Es evidente que no se trata de contenido duplicado en la realidad, pero Google mismo recomienda tomar precauciones.

4)     Cómo encontrar el contenido duplicado en un sitio web Además de los metodos manuales, existen formas más automatizadas para encontrar el contenido duplicado en un sitio web. Aquí te dejo dos herramientas muy buenas:

CÓMO SOLUCIONAR EL PROBLEMA DE CONTENIDO DUPLICADO

Existen distintas formas para solucionar los problemas de contenido duplicado y así evitar penalizaciones por parte de Google.

Bastará con retocar un poco el código de la página web incluyendo unas tags (etiquetas) que informarán a los robots de Google de que el contenido que se encuentra no está duplicado.

CANONICAL: <LINK REL=”CANONICAL” HREF=”…”>

Para duplicidades de URIs, index, www. Nos posicionamos en el <head> de todas las páginas duplicadas y pegamos esta etiqueta

<link rel=”canonical” href=”http://www.mi-pagina-de-referencia.com”>

De esta forma los robots sabrán que tienen que referirse a la página señalada en la etiqueta y no considerarán “duplicado” el contenido de la otra página.

Si el contenido duplicado es generado por la presencia de www. o index.html, es decir que realmente no existe otra página en el servidor con el mismo contenido, bastará incluir el rel=”canonical” en la página index.html.

  • Decirle a Google cuál es nuestra dirección preferida: con o sin WWW.

Que la página web funcione tanto con www.midominio.com como con midominio.com es una clara duplicidad. Por eso Google nos da la posibilidad de comunicarle cuál es el dominio preferido en Webmaster Tools.

Para hacerlo, primero tendrás que crear en la cuenta de Webmasters Tools ambos sitios para administrar: creas un sitio que sea www.midominio.com y lo validas con el archivo que Google te pide descargar y subir a nuestro servidor o bien a través de la cuenta de Analytics asociada.

Una vez validado, creas también el sitio midominio.com y también lo validas. Ahora en cada uno de los sitios hay que entrar en Configuración (desde la ruedecita de ajustes arriba a la derecha) y elegir el dominio preferido.

En otro artículo explico más en detalle esta y otras funcionalidades de Webmaster Tools.

REDIRECCIÓN 301

Las redirecciones 301 también pueden utilizarse para solucionar el problema del subdominio www que genera contenido duplicado con respecto a las mismas páginas sin www.

Esta solución se puede utilizar en lugar de tener que insertar el código rel=”canonical” en cada página, y resulta muy práctica para sitios web de gran tamaño. Cómo sabes, las redirecciones 301 se activan en el archivo htaccess, que está ubicado en la carpeta raíz del servidor donde esté alojado el sitio web. basta con incluir este código para solucionar el problema de las www:

<IfModule mod_rewrite.c>

RewriteCond %{HTTP_HOST} ^www.midominio.com [NC]

RewriteRule ^(.*)$ http://midominio.com/$1 [R=301,L]

</IfModule>

Así le estamos diciendo a todos los User Agents que cuando se encuentren con la URL www.midominio.com (y todas las páginas que dependen de ese dominio, cómo /sobre-nosotros.html, /contacto.html, etc.) redirijan automáticamente a la versión sin www.

Si quieres el resultado contrario, o sea que en la barra de navegación siempre se muestren las www, sólo tienes que intercambiar las dos direcciones.

Si quieres saber más sobre todo su potencial, este artículo sobre redirecciones 301 es lo que estabas buscando.

REL PREV Y REL NEXT PARA PAGINACIONES DE RESULTADOS

Y finalmente, cómo tratar las paginaciones de resultados, las listas de productos generadas por una búsqueda interna y repartidas en más páginas, navegables a través de los típicos botones      First    Previous   3   4    5   Next    Last.

Bastará con insertar un simple código en el head de las páginas, teniendo mucho cuidado en no equivocarte con los números que identifican a cada página.

En la página 1 habremos de poner solamente el link rel next (o sea de la página siguiente), ya que no hay una anterior:

<link rel=’next’ href=’http://midominio.com/page/2>

En la página 2 de los resultados, tendrás que poner un link rel prev y un link rel next, ya que existe una página anterior y otra posterior:

<link rel=’prev’ href=’http://midominio.com/page/1>

<link rel=’next’ href=’http://midominio.com/page/3>

Y así hasta que haya una página posterior a la que hacer referencia. Viceversa, en la última página pegaremos únicamente el link rel prev a la anterior:

<link rel=’next’ href=’http://midominio.com/page/2>

De esta forma Google podrá indexar estas páginas sin considerarlas contenido duplicado.

En WordPress la mayoría de las plantillas modernas para blog o tiendas online ya crean este código automáticamente, así que no te supondrá ningún esfuerzo. Y si no, siempre tienes plugins como Yoast o All in one SEO que se encargarán de hacer el trabajo sucio.

Artículos recomendados
Comentarios
  • jerzy
    Responder

    Muy buen artículo giorgio te seguimos desde madrid

Deja un comentario

Uso de cookies

Este sitio web utiliza cookies para que usted tenga la mejor experiencia de usuario. Si continúa navegando está dando su consentimiento para la aceptación de las mencionadas cookies. Para mayor información consulte nuestros Términos y Condiciones

ACEPTAR