Verdwenen pagina’s die je toch kunt zien… wat moet je er mee?
Toevallig maakte ik precies dat vandaag mee, en besloot hier direct een kort blogbericht over te schrijven. Kort, omdat er niet veel over te vertellen valt, en ‘direct’ omdat het in principe maar iets kleins is als onderwerp, maar wel met heel grote gevolgen voor je website.
Maar laten we eerst eens zien wat er aan de hand was, en waarom het zo’n groot probleem is.
Waar is die WP Sitemap voor?
Om te beginnen, eigenlijk is het geen ‘WP Sitemap’ maar een XML sitemap. De reden dat ik het hier voor de duidelijkheid een ‘WP Sitemap’ noem is omdat we het hier hebben over een bestand wat ook daadwerkelijk niet bestaat. Vraagt een dienst namelijk om de XML Sitemap, dan zal de gemiddelde WordPress plugin die hier voor gemaakt is, dit bestand ‘op verzoek’ doorgeven.
Wanneer je dus zelf met een FTP programma naar deze ‘Sitemap’ op zoek zou gaan, zou je dit bestand dus inderdaad niet vinden.
Een andere manier om een sitemap te krijgen is door daadwerkelijk een bestand te hebben met een naam als sitemap.xml of sitemap_index.xml.
Dat laatste is echter minder gebruikelijk en bovendien, als je dat hebt, dan zal je eigenlijk nooit met dit probleem te maken krijgen.
Maar de ‘sitemap’ is een tekstbestand volgens het ‘XML’ formaat, XML is een bestandsformaat wat een beetje lijkt op HTML. In het verleden heeft men zelfs geprobeerd beide formaten te integreren, HTML wat 100% aan de XML specificaties moest voldoen, maar dat is eigenlijk op een grote misser uitgelopen.
Een voorbeeldje van hoe een fragment van zo’n XML bestand er uit zou kunnen zien:
<url>
<loc>https://wordxpression.nl/wordpress-plugins/vijf-plugins-2023/</loc>
<lastmod>2023-01-02T11:52:58+01:00</lastmod>
<image:image>
<image:loc>https://wordxpression.nl/wp-content/uploads/2023/01/travel-concept-background-.jpg</image:loc>
</image:image>
<image:image>
<image:loc>https://wordxpression.nl/wp-content/uploads/2023/01/styler-plugin-03.png</image:loc>
</image:image>
<image:image>
<image:loc>https://wordxpression.nl/wp-content/uploads/2023/01/travel-concept-background-.jpg</image:loc>
</image:image>
<image:image>
<image:loc>https://wordxpression.nl/wp-content/uploads/2023/01/gamipress.png</image:loc>
</image:image>
<image:image>
<image:loc>https://wordxpression.nl/wp-content/uploads/2023/01/stylish-title.png</image:loc>
</image:image>
</url>
Samen met een groot aantal URL’s staat deze URL in zo’n XML bestand. En wat ik hier eigenlijk kan lezen is dat de pagina op de URL locatie https://wordxpression.nl/wordpress-plugins/vijf-plugins-2023/ voor het laatst op 2 januari 2023 is aangepast om 11:52
Wanneer Google dat doorkrijgt, en ze de pagina op 4 januari voor de laatste keer hebben geïndexeerd, weten ze ook, dat ze de pagina niet opnieuw hoeven te bezoeken om te indexeren.
Bovendien kan Google nagaan welke andere media (video, afbeeldingen) op de pagina zijn ingesloten.
Handig voor Google dus om de pagina’s op mijn site te kunnen vinden en niet constant bezig te hoeven gaan om iedere pagina te indexeren.
Een bestand wat dus ook heel belangrijk is voor Google. Om je een indruk te geven, de meeste van mijn blogposts zijn binnen 2 dagen na publicatie terug te vinden in de Google zoekresultaten, omdat Google mijn site alleen bezoekt, wanneer er daadwerkelijk wat nieuws te vinden valt.
Een goede sitemap zorgt dus dat jouw content snel te vinden is.
En het gebrek aan zo’n WP sitemap is dus funest voor je vindbaarheid, omdat Google maar een beperkte tijd voor jouw website heeft, en in die tijd mogelijk alleen pagina’s bezoekt, waarover niets nieuws te melden valt.
Caching
Er is echter nog een tweede reden, dat ik die sitemap zo belangrijk vind. Ik heb een grote site met letterlijk een paar duizend pagina’s. En ik wil die letter snel houden. En daarom laat ik door een extern programma de site regelmatig cachen. En die vindt al die pagina’s dank zij mijn sitemap. Is er geen sitemap, dan werkt mijn caching tool niet. En wordt mijn site traag.
Dus die sitemap is om twee redenen heel belangrijk. En als hij er niet is heb ik een serieus probleem.
Missende pagina’s
Een ander probleem wat je kan hebben is dat bepaalde pagina’s op je site missen. Nou ja, missen… ze zijn er wel, want je kan ze zien in het dashboard, maar wanneer je op de link naar de pagina klikt, krijg je de melding, dat ze er niet zijn.
Wat is er hier aan de hand?
Het probleem is eigenlijk heel makkelijk op te lossen. Het heeft namelijk alles te maken met de ‘permalinks’.
Zo’n ‘permalink’ is een mensvriendelijke vorm van een URL. Dus in plaats van iets als https://wordxpression.nl/?post_id=12345 krijg je iets te zien als https://wordxpression.nl/algemeen/dit-is-een-voorbeeld-van-een-url/
Leest een stuk fijner nietwaar?
Maar omdat iedereen zijn eigen voorkeuren heeft hoe zo’n permalink getoond moet worden, heeft WordPress ervoor gekozen dit instelbaar te maken. En dan moet je natuurlijk wel een administratie bijhouden welk nummertje van een blogpost met welke leesbare URL geassocieerd moet worden.
En daar loopt in WordPress de synchronisatie af en toe fout.
Dan kunnen pagina’s van een bepaald type (bijvoorbeeld alle productpagina’s) of zelfs geen enkele andere pagina dan de homepage van de website getoond worden.
Dat oplossen is echter ook makkelijk genoeg.
Zorg dat je ingelogd bent op WordPress, ga naar het Dashboard en kies vervolgens bij ‘Instellingen’ voor ‘Permalinks’.
Verander niets.
Het enige wat je hoeft te doen is te klikken op de knop ‘Opslaan’.
En dat is echt letterlijk alles wat je hoeft te doen om dit probleem op te lossen. Niets meer en niets minder.