Duplicate content

Duplicate content: wat is het en hoe voorkom je het?
Duplicate content kan een probleem opleveren voor de vindbaarheid van een website in de zoekmachines. Het fenomeen duplicate content treedt op, wanneer (delen van) een website op verschillende plaatsen te vinden zijn. Bijvoorbeeld een productomschrijving die op meerdere pagina’s terugkomt of een volledige website die ook op een ander domein staat. Gelukkig is duplicate content grotendeels te voorkomen.
Verschillende vormen van duplicate content.

Duplicate content kent verschillende verschijningsvormen:

  •  Hetzelfde domein;
  • dezelfde website, en
  • een andere website.

Hetzelfde domein
Veel websites zijn tegenwoordig zowel met als zonder “www.” voor het adres op te vragen, zoals http://www.rankinspector.com en http://rankinspector.com. Ook is er een standaardpagina, bijvoorbeeld http://www.rankinspector.com/index.html (of home.html, default.html, of main.html. Deze pagina’s kunnen verschillende extensies hebben, zoals .php, .asp, etc.). Het probleem is, dat Google de verschillende varianten nog vaak ziet als aparte domeinen of pagina’s, waardoor de inhoud (mits deze voor de verschillende varianten hetzelfde is) als duplicate content wordt gezien.

Dezelfde website
Vaak registreren website-eigenaren (terecht) naast hun domeinnaam zeer sterk gelijkende domeinnamen om te zorgen dat domeinkapers niet eigenaar worden van adressen die voor hen waardevol kunnen zijn. Meestal zijn dit adressen in de trant van bedrijfsnaam.nl, bedrijfsnaam.com, debedrijfsnaam.nl, bedrijfs-naam.nl, etc. Zo heeft de krant De Telegraaf naast http://www.telegraaf.nl ook http://detelegraaf.nl, http://telegraaf.nl, http://telegraaf.com, etc. gereserveerd. Al deze URL’s verwijzen door naar http://www.telegraaf.nl.

Een andere website
Duplicate content op andere websites komt veel voor en is een fenomeen waar vooral nieuwssites, weblogs en bedrijven die persberichten versturen last van hebben. Dezelfde informatie wordt dan één op één overgenomen (gedupliceerd) door een andere website.

Duplicate content voorkomen op hetzelfde domein of dezelfde website
De eerste twee vormen van duplicate content zijn makkelijk te voorkomen met gebruik van een 301 redirect. Een 301 redirect zorgt ervoor dat gebruikers die de ‘verkeerde’ URL intoetsen uitkomen op de juiste plek. Ook worden zoekmachines op deze manier op de hoogte gesteld van de juiste plaats van de content. Op die manier bevindt zich geen duplicate content meer op verschillende plaatsen, maar is er één plek waar de content zich bevindt en waar alle andere URL’s naartoe verwijzen.
Het kan ook zijn dat (te) grote delen van pagina’s van een website op elkaar lijken. Als bijvoorbeeld verschillende producten nagenoeg hetzelfde zijn en de productomschrijvingen op verschillende pagina’s daardoor grotendeels met elkaar overeenkomen, kan dit ook gezien worden als duplicate content. Zoekmachines hanteren hiervoor een bepaald percentage van de content (afgezien van de onderdelen die tot de standaardopmaak behoren) op een pagina. Over het algemeen zijn kleine alinea’s van twee tot drie regels geen probleem. Aangezien het exacte percentage niet bekend is, wordt aangeraden om de unieke content op elke pagina zo uniek mogelijk te maken.

Duplicate content voorkomen op andere websites
Duplicate content op andere websites is helaas moeilijker te voorkomen. Het dupliceren van een bericht is, zeker bij een persbericht, iets dat vaak gebeurt en over het algemeen niet te bestrijden is. Het probleem is dat Google daardoor niet meer weet welke website op die content het hoogst moet scoren in de zoekmachine.

Over het algemeen wordt duplicate content op twee manieren het beste voorkomen: een 301 redirect en originele content, want hoe creatiever de teksten geschreven zijn, des te minder kans is er op duplicate content.

 
 

Pakketten