contenu dupliqué

Selon Google, le contenu dupliqué se résume ainsi : "Par contenu en double, on entend généralement des blocs de contenu importants, appartenant à un même domaine ou répartis sur plusieurs domaines, qui sont identiques ou sensiblement similaires"

Le contenu dupliqué

En clair, plusieurs liens existent pour accéder à un contenu qui lui est unique. C’est une grande négligence qui peut avoir des conséquences désastreuses : Retrait du site des résultats de recherches, car considéré comme site « polluant » ou « non-pertinent », perte de valeur du contenu, perte de PageRank.

duplicate-content

www. ou pas ?

Avant de lire ce qui suit, assurez-vous d’avoir consulté les deux premiers volets (PageRank et Contenu) de cette série « Parlons SEO », sinon vous allez vite être perdu.

L’erreur souvent rencontrée sur la toile est l’accès à un site avec le www et sans le www, erreur souvent liée à l’absence de redirection permanente. Nous allons voir les différentes variantes du Duplicate Content et les conséquences que cela aura sur un site.

Nous allons appeler notre site « SiteA ». SiteA est mal conçu et est accessible avec ou sans www. Il n’y a également aucune optimisation SEO et SiteA est également accessible avec ou sans slash. Il y a une tentative d’optimisation du site mais elle a été mal faite donc chaque page à deux liens d’accès, le lien par défaut de la page, et le lien réécrit (dans une tentative d’avoir des liens « lisibles »). Maintenant imaginons que l’on ai envie de consulter la page « A propos » du site en question, voici les liens que Google aura référencé :

http://sitea.com/a-propos
http://sitea.com/a-propos/
http://sitea.com/page-98.html
http://sitea.com/page-98.html/
http://www.sitea.com/a-propos
http://www.sitea.com/a-propos/
http://www.sitea.com/page-98.html
http://www.sitea.com/page-98.html/

Tous ces liens mènent donc à une seule et unique page web. Maintenant imaginons que Google ne fait pas son travail et que toutes ces pages (rappelons qu’il s’agit d’une unique page du site) soient référencées. Voici le résultat obtenu après une recherche avec les mots-clés « siteA à propos » :

Exemple de duplicate content - contenu dupliqué

C’est vraiment pas terrible. Sans compter la perte de valeur de la page en question, qui par exemple au lieu d’avoir un PageRank de 5 (ce qui est vraiment pas mal pour une page interne), aura un PageRank de… 0 ! Et oui, car on divise le PageRank 5 par les 8 liens et non pas par 1 seul lien. 5:1=5 alors que 5:8 c’est déjà beaucoup moins bien.

Bon on a vraiment pris le pire exemple possible, mais même dans le cas d’une duplication www, ça divise une valeur PageRank par 2. Théoriquement, au lieu d’avoir une page d’accueil avec un PR 6 par exemple, on se retrouve avec la page d’accueil avec le www d’un PR 3, et la même page d’accueil sans le www d’un PR 3. Le site sera donc moins bien référencé qu’un concurrent qui lui aura un moins bon PR (car moins de backlinks), 4 par exemple, mais aura optimisé son SEO.

Qu’en pense Google ?

Google pénalise les sites possédant du contenu dupliqué car cela impacte négativement la pertinence des résultats de recherche. Car Google n’aime pas perdre son temps à trier les liens de votre site et décider d’inclure ou pas telle ou telle page. C’est d’ailleurs pour cela qu’une balise nommée « canonical » a été mise en place, dans le but de minimiser l’importance des duplications involontaires. Encore faut-il que cette balise soit correctement utilisée.

L’optimisation du SEO est donc très important et à ne surtout pas négliger pour son référencement.

Référencement, parlons SEO, Acte III : Duplicate Content
Par Référencement, parlons SEO, Acte III : Duplicate Content

Partager ce contenu