Dans le cadre de publication sur Internet, il arrive parfois qu’un article d’un jour entraîne une similitude. Et il se peut que cela arrive avec un autre du lendemain ou des jours suivants. Ceci, est dû aux flux de l’actualité et des informations qui arrivent au jour le jour. Ou même qu’avec plus d’informations, un journaliste décide de réadapter et améliorer un de ses articles. Tout cela peut déboucher sur du contenu dupliqué. Ainsi, ce qui nous intéresse est de savoir ce que Google préconise pour du contenu dupliqué de court terme.[clear]
Si vous deviez gérer du contenu dupliqué de court terme sur un site d’actualités (en publiant une histoire sur deux urls), que recommanderiez-vous pour éviter une pénalité de duplicate content ?
La question concerne principalement les sites d’actualités dont les journalistes ou rédacteurs peuvent traiter une information similaire avec des angles proches les uns des autres, ou tout simplement découpé une histoire en plusieurs pages. Bref, comment gérer un possible contenu dupliqué sur ce type de site d’actualités.
Le conseil est simple dans la vidéo de Matt Cutts pour éviter tout écueil de contenu dupliqué avec des actualités similaires ou relativement proches, il suffit d’ajouter la balise canonique à la page préférée. Pour ce faire l’URL à mettre en avant doit être indiquée dans la section <head> du code :
<link rel="canonical" href="URL"/>
Hiérarchiser le contenu
Pour garder une hiérarchie et éviter la dispersion de page rank, je pense que dans de tels cas, il est préférable de créer une page qui reprend l’ensemble des actualité sur un sujet similaire. S’il s’agit que de 2 articles, ce n’est pas nécessaire, mais dans le cas de plusieurs actualités qui traitent d’un même sujet, cela sera bénéfique.
Une sorte de guide ou une simple page catégorie feront très bien l’affaire. De ce fait tous les articles avec du contenu dupliqué devront renvoyer vers cette page générique. Ainsi, de nombreux sites d’actualités ont déjà adopté cette technique de landing page.