‘Duplicate content’ is een ‘big no-no’, of toch niet?
Ik krijg nogal eens de vraag, hoe het nu precies met ‘duplicate content’ zit. En ik probeer daar -afhankelijk van het type vraag- altijd een zo goed mogelijk antwoord op te geven.
Nog niet zo gek lang geleden las ik een artikel op de Search Engine Journal blog en naar aanleiding hiervan dacht ik, dat het een goed idee is om nog eens aandacht te besteden aan ‘goede’ en ‘foute’ gevallen van duplicate content.
Voor de duidelijkheid: Dit artikel is geen vertaling of ‘navertelling’ van wat je op Search Engine Journal kan lezen, en ik zou je ook zeker willen aanraden om het artikel daar over Duplicate Content ook zeker te lezen.
In een gesprek met John Mueller van Google wordt aangegeven wat nu eigenlijk allemaal wel en niet waar is met betrekking tot ‘Duplicate Content zorgt voor een negatieve ranking’.
Google rankt geen websites, maar pagina’s
Het is niet de eerste keer dat ik dit zeg en het zal ook zeker niet de laatste keer zijn, maar vaak vergeten mensen één belangrijk punt met betrekking tot Google. Google rankt geen websites, maar webpagina’s. Of met andere woorden, per pagina kijkt Google of de pagina de moeite waard is om in zoekresultaten te laten zien.
Stel nu. Jij hebt 2x een pagina met exact dezelfde inhoud. Bijvoorbeeld omdat je van iedere pagina zowel een ‘scherm vriendelijke’ als een ‘print vriendelijke’ versie hebt.
De juiste manier om dit af te handelen is door in de HTML headers van één pagina (waarschijnlijk de printbare versie) een ‘noindex’ tag te plaatsen. Dat kan je bijvoorbeeld doen met de volgende HTML code, die voor moet komen tussen de <head> en </head> tags:
<meta name="robots" content="noindex">
of indien je een pagina specifiek voor de google bots niet-indexeerbaar wilt maken :
<meta name="googlebot" content="noindex">
Maar stel nu, dat je dit stukje HTML niet toevoegt? Bestraft Google je dan omdat je dubbele content hebt?
Nee hoor. Wanneer Google duplicate content ontdekt, zal slechts één van de resultaten worden getoond. Daarbij zal Google proberen de ‘meest relevante resultaten’ te tonen.
In ons voorbeeld van de ‘screen’ pagina versus de ‘print’ pagina, lijkt dat nogal duidelijk. Wanneer jij op je beeldscherm een pagina opvraagt, zal de ‘screen’ versie van die pagina waarschijnlijk beter bij jouw behoeften passen dan de versie die bedoeld is om afgedrukt te worden.
Meerdere ingangen voor dezelfde inhoud
In het eerste voorbeeld hebben we gekeken naar meerdere versies van dezelfde pagina, waarbij de pagina’s voor verschillende doelen werden gebruikt.
Het is echter ook mogelijk, dat je meerdere ingangen hebt, voor dezelfde inhoud. Wat dan?
Wat bedoel ik hier precies mee? Laten we eens naar een concreet voorbeeld kijken.
Ik kan ervoor kiezen om in mijn blog de categorie op te nemen in de URL. Dus bijvoorbeeld :
https://wordxpression.nl/mijn-categorie/mijn-blog-titel/
Wanneer ik meerdere categorieën associeer met dit artikel is mijn artikel ook onder meerdere url’s bereikbaar. Dus bijvoorbeeld:
https://wordxpression.nl/mijn-eerste-categorie/mijn-blog-titel/
https://wordxpression.nl/mijn-tweede-categorie/mijn-blog-titel/
In beide gevallen krijg ik dus dezelfde pagina te zien. Hoe zal Google daar mee omgaan?
Het meest eerlijke antwoord is ‘dat kan je niet weten’. Maar ondanks dat je het niet kan ‘weten’, is er wel een aantal manieren, waarop je het resultaat kan beïnvloeden.
Canonical URL
De meest directe manier is door een ‘Canonical URL‘ op te geven. Je vertelt dus welke URL de gewenste URL is. Maar dit is slechts een verzoek aan Google om bepaalde pagina’s wel of juist niet te indexeren. Het geeft geen enkele garantie.
Consistente interne doorverwijzingen
Een tweede manier om invloed uit te oefenen welke versie van de pagina getoond gaat worden is consistent door te verwijzen.
Bijvoorbeeld :
https://wordxpression.nl/?p=1234 en
https://wordxpression.nl/mijn-categorie/mijn-pagina/
kunnen beiden verwijzen naar dezelfde pagina en ik kan beide manieren gebruiken voor interne doorverwijzingen. Om het allemaal nog wat complexer te maken kan ik daar ook https://www.wordxpression.nl/?p=1234 in de mix aan toevoegen.
Omdat alle pagina’s dezelfde inhoud hebben, zal Google er maar één tonen. Maar zonder een SEO plugin die default een Canonical URL instelt, is het maar raden, wat er bij Google in de resultaten komt te staan.
Redirects elimineren
Wanneer je om wat voor reden dan ook een URL moet veranderen, dan is het goed om een redirect van de oude URL naar de nieuwe URL te maken, om te voorkomen, dat de pagina niet gevonden kan worden. Bedenk je jezelf alleen wel, dat dit vooral bedoeld is voor mensen die van buiten je website komen.
Je hoeft het niet direct te doen, maar het is een goede gewoonte om van tijd tot tijd eens te zoeken naar URL’s die worden ‘redirect’. Dit kan je bijvoorbeeld doen met een plugin voor het detecteren van ‘broken links’. Vervang in de content alle redirect die naar je eigen website terugleiden.
Bijvoorbeeld. Ik heb ooit de URL
https://wordxpression.nl/dit-is-een-oude-url/
vervangen door
https://wordxpression.nl/dit-is-een-nieuwe-url/
Bij het uitvoeren van een ‘broken link’ check krijg ik een melding, dat in bepaalde pagina’s nog steeds de oude URL staat. Het schept behoorlijk wat duidelijkheid voor Google, wanneer je dit soort interne redirects mettertijd verwijderd.
Duplicate content op meerdere sites
Tot nu toe hebben we gekeken naar duplicate content op één website. Maar hoe zit het nu, wanneer er duplicate content is op verschillende sites?
Hier kunnen we een tweetal situaties onderscheiden. De eerste situatie is wanneer ik zelf controle heb over alle websites met duplicate content. In de tweede situatie heb ik dit niet. De duplicate content is terug te vinden op websites die niet in eigen beheer zijn.
Laten we eens naar deze beide situaties kijken.
Duplicate content op eigen websites
Wanneer ik meerdere websites heb, dan is het eigenlijk heel waarschijnlijk dat in ieder geval een aantal pagina’s op meerdere sites voor zullen komen. Denk hierbij aan zaken als algemene voorwaarden en een privacy statement.
Omdat dit nu ook niet direct de pagina’s zijn waarop we gevonden willen worden, is dit eigenlijk ook absoluut niet bezwaarlijk. Sterker nog, ik zou je met dit soort pagina’s willen adviseren om een ‘no index’ header op te nemen. Hierdoor voorkom je dat Google kostbare ‘indextijd’ verspilt aan pagina’s die mensen toch alleen maar vanuit de site zelf zouden willen bekijken.
Maar er zijn meer situaties, waarin we te maken kunnen krijgen met duplicate content. Laten we er eens naar een aantal kijken.
Meerdere webshops met een overeenkomstig product aanbod
In een recent verleden heb ik het één en ander geschreven over het hebben van meerdere webshops, bediend vanuit één gemeenschappelijk magazijn. In zo’n geval zal het voorkomen, dat je in verschillende webshops hetzelfde product met eenzelfde product omschrijving zal hebben. Kortom, duplicate content… en voor zover Google het kan zien, duplicate content over verschillende sites.
Wat Google hier zal proberen is de zoeker de ‘meest relevante content’ te laten zien. Dat hoeft niet per se de site te zijn, waarheen jij graag je bezoeker zou willen sturen.
De mogelijkheden
Een heel waarschijnlijke reden om één magazijn met meerdere outlets te hebben is dat je verschillende niches wilt kunnen bedienen vanuit niche gerichte sites. Tussen de niche sites is een zekere overlap. Daarnaast heb je een ‘algemene’ site waarop al je producten te koop zijn.
Een beetje de situatie die Coolblue vroeger had.
In zo’n situatie is er een aantal verschillende mogelijkheden.
Probeer zoveel mogelijk verkeer naar je hoofdsite te krijgen
Eén mogelijkheid is natuurlijk zoveel mogelijk verkeer naar je ‘hoofdsite’ te krijgen, de site met het grootste aanbod. Alle producten die in meerdere shops voorkomen verwijzen dus in de ‘canonical URL’ naar hetzelfde product in de hoofdsite.
Probeer zoveel mogelijk verkeer naar je niche sites te krijgen
Het nadeel van een site met veel producten, is dat je vaak langer moet zoeken om de producten ook daadwerkelijk te kunnen vinden. Wanneer iemand op een site binnen een heel specifieke niche wordt gestuurd is de kans dat iemand verder bladert door de site en eventueel meer producten in de winkelwagen doet een stuk groter.
Tenminste… dat is de theorie. Want naar welke niche site kan je iemand het best sturen?
Stel je voor. Ik heb een modeshop. En ik heb kleding voor zowel dames, heren als voor kinderen in allerlei leeftijdsgroepen. Voor iedere categorie heb ik naast een algemene shop ook diverse niche shops.
En iemand is op zoek naar een specifiek model honkbalpet… ik heb die pet zowel in mijn dames, heren en jeugd shops… naar welke shop wil ik dat verkeer hebben?
Dat is zo eenvoudig nog niet.
Wanneer je start met een ‘multistore’ oplossing, is mijn eerste advies om van de twee hierboven één oplossing te implementeren. Het maakt niet uit welke.
Hoogste Average Order Value
Maar regelmatig houd je bij welke shops van jou de hoogste Average Order Value (AOV) hebben. En die shops met de hoogste AOV die neem je natuurlijk op in de ‘canonical URL’ voor dat specifieke product. Hierdoor stuur je jouw klanten naar de sites waar ze geneigd zijn het meest te kopen.
Dat wil je toch?
Meerdere sites gericht op regio
Maar laten eens naar nog een ander voorbeeld kijken. Stel, ik heb twee websites. De éne website richt zich op Nederland, de andere website op België. En op die beide websites heb ik een aantal pagina’s met duplicate content.
Laten we nog een stapje verder gaan. Stel nu, dat mijn Nederlandse site al jaren bestaat en als domein een goede reputatie heeft. Mijn Belgische site is nog maar recentelijk door Google geïndexeerd.
Alles zou erop wijzen, dat -omdat mijn Nederlandse site anciënniteit heeft- dat bij een zoekopdracht de pagina’s van de Nederlandse site getoond zouden worden. En waarschijnlijk zou dat ook gebeuren, tenzij iemand uit België dezelfde vraag zou stellen. Omdat Google ‘weet’, dat de vragensteller in België zit, zijn de resultaten van de Belgische site mogelijk meer relevant, dan dezelfde resultaten van de Nederlandse site.
Duplicate content op sites die je niet allemaal zelf beheert
Het is natuurlijk knap vervelend, wanneer je duplicate content hebt die je deelt met andere websites, die je niet zelf beheert. Indien jij de eigenaar van de content bent, is er een aantal dingen die je kan doen.
Plagiaat
Is de content niet-geoorloofd overgenomen, dan is er natuurlijk sprake van plagiaat. Hier heb ik ruim een jaar geleden een artikel over geschreven wat je enkele handvatten geeft om er mee om te gaan.
Gastblog
Een andere mogelijkheid is natuurlijk dat iemand een blog van jou heeft geplaatst met toestemming. Geef jij toestemming een bestaande blog door jou geschreven te plaatsen, doe dat altijd op de voorwaarde, dat er in de ‘Canonical URL’ verwezen wordt naar jouw originele post.
Liever nog, sta niet toe, dat een ‘gastblog’ zomaar wordt overgenomen, maar biedt aan om een nieuwe blogpost over hetzelfde onderwerp te schrijven.
Want hoe dan ook, wanneer jouw blogpost tweemaal dezelfde inhoud heeft, zal hij slechts eenmaal in de zoekresultaten worden getoond. Wanneer je twee unieke posts hebt, op twee verschillende sites, is de kans dat je rond dit onderwerp wordt gevonden ineens verdubbeld. Tenminste, indien je in je gastblog artikel een link naar jouw website hebt opgenomen.
Product omschrijvingen via een leverancier
Een andere manier om duplicate content te krijgen is wanneer je in je webshop product omschrijvingen gebruikt die door je leverancier worden aangeleverd.
Je kan nu een aantal dingen doen. De eerste mogelijkheid is om in je eigen woorden die aangeleverde content ‘na te vertellen’. Hoewel je hetzelfde zegt, is het geen duplicate content.
Maar wanneer je tientallen nieuwe producten per dag moet toevoegen dan is dat eigenlijk een taak die niet vol valt te houden. Wat zijn mogelijke alternatieven?
Bloggen
Natuurlijk hoeft niet direct jouw product gevonden te worden. Dat kan in veel gevallen zelfs lastig zijn. Want een klant zal vaak zoeken op de naam van het product en de kans is groot, dat in de eerste resultaten alleen de namen van de grote e-commerce websites te vinden zijn.
In mijn artikel over SEO voor webwinkels, wat ik enkele jaren geleden heb geschreven, ga ik hier dieper op in. Wil je weten hoe je succesvolle blogposts schrijft? Kijk dan ook eens naar mijn training over PowerBloggen.
Reviews
Een tweede manier om het ‘beter’ te doen met jouw duplicate content is er voor te zorgen, dat Google jouw duplicate content de ‘best passende’ vindt. Dan kan je onder meer doen door ‘user contributed content’ aan je producten toe te voegen, ofwel, er actief voor te zorgen, dat er reviews worden toegevoegd aan jouw producten. In eerdere blogartikelen heb ik je laten zien, wat je zoal kan doen om reviews voor je producten te krijgen.
Anticipeer op BERT
Een andere manier is door alvast te anticiperen op BERT. Het kan wellicht veel werk zijn om ieder product van een unieke omschrijving te voorzien, maar wat dacht je van een wat uitgebreidere pagina voor de product categorieën?
Wanneer je op je product categorie pagina meer informatie over een specifieke categorie geeft, dan schep je hiermee een context die door BERT gebruikt kan worden om ‘meerwaarde’ aan je producten te geven.
Publiceer video reviews en howto’s
Nog een manier om meer bezoekers naar juist jouw producten te krijgen is door korte video’s te maken waarin je een bepaald product bespreekt of uitlegt hoe je bepaalde handelingen met dat product uit kan voeren. Plaats deze video’s op een YouTube kanaal, maar embed het ook in je product pagina. Ondanks dat de ‘hoofdtekst’ duplicate content is, zal de extra video voor meerwaarde zorgen.
Geldt een video als ‘duplicate content’ wanneer ik hem embed?
Een ander punt waar veel onduidelijkheid over bestaat is of het wel een goed idee is om YouTube video’s op te nemen in een webpagina. Gelukkig spreekt John Mueller in het eerder genoemde artikel hier duidelijke taal over: ‘Embedded’ video -dus video die je vanuit een andere videohosting service laat zien- is net zo waardevol voor Google als video die je vanuit je eigen server of via een CDN als Amazon S3 zou kunnen presenteren.
YouTube video heeft echter een bijkomend voordeel. Wanneer je ook gebruik maakt van schema’s, dan kan jouw video niet alleen gevonden worden op de beperkte omschrijving en trefwoorden die je op YouTube in kan geven, maar kan jouw pagina met embedded video ook als resultaat gevonden worden in de ‘Rich result’ pagina’s van Google. Jouw resultaat wordt dus niet alleen als tekst-resultaat getoond, maar ook als een resultaat met een video erbij.
In de PowerBlogging cursus is hier een heel hoofdstuk aan gewijd!
Samenvattend…
Goed nieuws dus voor je. Duplicate Content zal je de kop niet kosten. Het is dus niet zo, dat jouw complete site ‘naar beneden gaat’ in Google, omdat hier duplicate content op wordt gevonden.
Het kan er wel voor zorgen, dat bepaalde pagina’s die je graag onder de aandacht van je bezoekers zou hebben gebracht moeilijker of niet gevonden worden.
Hierboven vind je echter voldoende informatie om creatief met deze uitdaging om te gaan.
Blijf jij graag op de hoogte van alles wat er speelt rond WordPress, WooCommerce, e-Learning en marketing? Schrijf je dan in op de nieuwsbrief, of meld je aan voor de browser push berichten door op de rode bel linksonder op deze pagina te klikken.
Wil je eens met mij brainstormen over hoe je ook jouw webwinkel beter zichtbaar kan maken in Google? Maak dan eens een afspraak met mij voor een video consult.