Zorg dat je CARS & BS op orde hebt voordat je migreert.

Deze simpele ezelsbruggetje dekt de zes essentiële databronnen voor het samenstellen van een complete URL-lijst:

  • Crawl
  • Analytics
  • Redirects (bestaande)
  • Sitemap
  • Backlinks
  • Search Console

Verzamel uit alle zes bronnen, en je mist geen enkele belangrijke URL.

URL-verzameltaak Doel
Crawl domein voor HTML-URL’s Ontdek alle live pagina’s
Categoriseer op statuscode Identificeer redirectbehoeften
Verzamel URL’s met backlinks Behoud SEO-waarde
Crawl XML-sitemap Leg gedeclareerde belangrijke pagina’s vast
Exporteer Search Console-gegevens Vind geïndexeerde URL’s
Verzamel analytics-URL’s Identificeer verkeersgenererende pagina’s
Controleer bestaande redirecttabellen Voorkom redirectketens
Verenig alle datasets Creëer uitgebreide redirectlijst

Welke datasets moet ik gebruiken om uitgebreide URL-lijsten samen te stellen?

Best Practice

Een succesvolle websitemigratie vereist het verzamelen van URL’s uit meerdere bronnen om ervoor te zorgen dat geen enkele belangrijke pagina wordt gemist. Vertrouwen op één enkele bron laat gaten achter in je redirectdekking.

Essentiële databronnen

Bron Wat het vastlegt
Domein-crawl Alle ontdekbare HTML-URL’s
XML-sitemap URL’s die je belangrijk hebt verklaard
Google Search Console URL’s die Google kent
Analytics URL’s met daadwerkelijk verkeer
Backlinktools URL’s met externe links
Bestaande redirecttabellen Huidige redirectmappings

De multi-bron benadering

Elke bron legt URL’s vast die de anderen mogelijk missen:

  • Crawlers missen verweesde pagina’s die niet intern gelinkt zijn
  • Sitemaps kunnen verouderd of onvolledig zijn
  • Search Console toont alleen geïndexeerde URL’s
  • Analytics mist pagina’s met nul verkeer
  • Backlinktools richten zich op extern gelinkte pagina’s
Verzamel uit alle beschikbare bronnen en verwijder vervolgens duplicaten. Het is veel beter om redundante data te hebben dan een waardevolle URL te missen die na migratie verkeer of SEO-waarde verliest.

Hoe crawl ik het domein om HTML-URL’s te verzamelen?

Cruciale eerste stap

Begin met het crawlen van je hele domein met een tool als Screaming Frog, Sitebulb of vergelijkbare webcrawlers. Dit ontdekt alle HTML-pagina’s die gelinkt zijn binnen je sitestructuur.

Crawlconfiguratie

Aanbevolen instellingen:

  • Crawldiepte: Onbeperkt (of hoog genoeg om alle pagina’s te bereiken)
  • Respecteer robots.txt: Uitgeschakeld voor migratiedoeleinden (je hebt ALLE URL’s nodig)
  • Volg interne links: Ingeschakeld
  • Crawl buiten startmap: Uitgeschakeld (blijf op je domein)
  • Sla HTML op: Optioneel maar nuttig voor inhoudsvergelijking

Wat te extraheren

Exporteer het volgende uit je crawl:

URL Address
Status Code
Indexability
Canonical URL
Meta Robots
Title

Tips voor grote websites

Voor websites met 100.000+ URL’s:

  1. Segmenteer per subdirectory: Crawl /blog/, /products/, /pages/ afzonderlijk
  2. Gebruik list mode: Voer bekende URL’s direct in plaats van ze te ontdekken
  3. Verhoog geheugentoewijzing: Screaming Frog kan 8GB+ RAM nodig hebben
  4. Laat ’s nachts draaien: Grote crawls kunnen uren duren
⚠️ Crawl de live website
Crawl altijd je huidige productiesite voordat de migratie begint. Het crawlen van een staging- of ontwikkelomgeving mist URL's die alleen in productie bestaan.
Voer je crawl minstens twee keer uit: één keer aan het begin van de migratieplanning en één keer vlak voor de lancering. URL's veranderen tijdens ontwikkeling, en je hebt de meest actuele gegevens nodig.

Hoe moet ik URL’s categoriseren op statuscode?

Essentiële organisatie

Categoriseer na het crawlen alle ontdekte URL’s op hun HTTP-statuscode. Elke categorie vereist verschillende behandeling in je redirectstrategie.

Statuscode-categorieën

200 OK URL’s: Je primaire redirectbronlijst

Subcategorie Beschrijving Actie
Indexeerbaar Kan in zoekresultaten verschijnen Hoge prioriteit redirects
Niet-indexeerbaar Geblokkeerd voor indexering Evalueer redirectbehoefte
Gecanoniseerd Verwijst naar een andere URL Redirect naar canonieke bestemming
NoIndex Meta noindex tag aanwezig Lagere prioriteit redirects
UTM-parameters Marketing tracking-URL’s Meestal uitsluiten van redirects
Filterparameters Faceted navigation-URL’s Meestal uitsluiten van redirects

301/302 Redirect-URL’s: Redirecten al

  • Documenteer bestaande redirectbestemmingen
  • Zorg dat nieuwe redirects naar eindbestemmingen wijzen
  • Voorkom het creëren van redirectketens

404 Not Found URL’s: Kapot maar mogelijk belangrijk

  • Controleer op backlinks die naar deze URL’s wijzen
  • Bekijk Search Console voor geïndexeerde 404’s
  • Kunnen redirects nodig hebben als ze SEO-waarde hebben
Maak aparte spreadsheet-tabbladen of bestanden voor elke statuscodecategorie. Dit maakt het gemakkelijker om verschillende redirectstrategieën op elke groep toe te passen.

Moet ik URL’s met andere statuscodes dan 200 opnemen?

Ja: cruciaal voor volledige dekking

Veel migratieprojecten richten zich alleen op 200-statuspagina’s, maar 301/302 en 404 URL’s zijn even belangrijk voor het behouden van SEO-waarde en gebruikerservaring.

Waarom 301/302 URL’s belangrijk zijn

Bestaande redirects vertegenwoordigen URL’s die ooit waarde hadden:

  • Externe sites kunnen nog steeds naar de oude URL’s linken
  • Zoekmachines kunnen de oude URL’s geïndexeerd hebben
  • Gebruikers kunnen de oude URL’s als bladwijzer hebben opgeslagen

Als je bestaande redirects negeert:

Oude URL → Huidige redirect → Nieuwe site (kapot)

Met juiste afhandeling:

Oude URL → Nieuwe site (direct)

Waarom 404 URL’s belangrijk zijn

Een 404-status betekent niet dat een URL waardeloos is:

404-scenario Redirectbehoefte
Heeft backlinks van externe sites Ja: behoud linkwaarde
Verschijnt in Search Console Ja: Google weet ervan
Toont verkeer in analytics Ja: gebruikers zoeken ernaar
Recent verwijderde content Misschien: evalueer relevantie
Had nooit verkeer of links Nee: veilig om te negeren

404-gegevens verzamelen

Exporteer 404’s uit:

  • Screaming Frog-crawlresultaten
  • Google Search Console-dekkingsrapport
  • Server-toegangslogboeken
  • Analytics (pagina’s met nul pageviews maar sessies)
⚠️ Redirect niet alles
Niet elke 404 heeft een redirect nodig. Focus op 404's die backlinks, zoekvertoningen hebben, of content vertegenwoordigen die is verplaatst in plaats van opzettelijk verwijderde content.
Kruisverwijzing je 404-lijst met Ahrefs- of Search Console-gegevens. Geef prioriteit aan redirects voor 404-URL's die externe backlinks of recente zoekvertoningen hebben.

Welke URL-variaties moet ik in overweging nemen?

Veelvoorkomende migratievalkuil

Dezelfde pagina kan via meerdere URL-variaties worden benaderd. Het missen van een variatie betekent verbroken links en verloren verkeer.

Kritieke URL-variaties

Variatietype Voorbeeld A Voorbeeld B
www vs niet-www www.example.com/page example.com/page
Trailing slash /products/ /products
Hoofdletters /Products/Widget /products/widget
URL-codering /search?q=hello%20world /search?q=hello world
Protocol https:// http://
Indexbestanden /folder/index.html /folder/

Hoe variaties problemen veroorzaken

Externe links en bladwijzers kunnen elke variatie gebruiken:

Backlink gebruikt: example.com/Blog/Post-Title
Je redirect: www.example.com/blog/post-title

Resultaat: 404-fout, redirect komt niet overeen

Alle variaties verzamelen

  1. Controleer backlinkrapporten: Externe sites gebruiken inconsistente formaten
  2. Bekijk serverlogboeken: Zie daadwerkelijk opgevraagde URL’s
  3. Test handmatig: Probeer veelvoorkomende variaties van belangrijke pagina’s
  4. Search Console: Toont URL-variaties die Google is tegengekomen

Standaardisatiestrategie

Beslis over je canonieke formaat en redirect vervolgens alle variaties:

Oud pad Redirect naar
/Products/ /products
/PRODUCTS/ /products
/products /products
/Products /products
Gebruik hoofdletterongevoelige matching als je platform dit ondersteunt. Genereer anders redirects voor alle bekende hoofdlettervariaties van hoogverkeer-URL's.
Behoud SEO-waarde

URL’s met externe backlinks dragen SEO-waarde die via 301-redirects wordt overgedragen. Backlinkanalysetools onthullen welke URL’s deze waarde hebben.

Veelvoorkomende backlinktools

Tool Belangrijkste functie
Ahrefs Site Explorer → Best by Links
Semrush Backlink Analytics → Indexed Pages

Exportproces (algemene stappen)

  1. Voer je domein in in de site-analysefunctie van de tool
  2. Navigeer naar het pagina- of URL-rapport (toont welke pagina’s backlinks ontvangen)
  3. Exporteer de volledige lijst van pagina’s met backlinks
  4. Filter alleen naar de URL’s van je domein

Belangrijke datapunten om vast te leggen

Datapunt Doel
Doel-URL De URL die backlinks ontvangt
Verwijzende domeinen Aantal unieke sites die linken
Totaal aantal backlinks Totaal aantal links
Linkkwaliteitsscore Autoriteitsindicator (varieert per tool)

Prioriteringsraamwerk

Niet alle URL’s met backlinks zijn gelijk:

Verwijzende domeinen Prioriteit Actie
50+ Kritiek Moet redirecten
10-49 Hoog Zou moeten redirecten
2-9 Gemiddeld Redirect indien praktisch
1 Laag Individueel evalueren

De meeste backlinktools tonen links die naar URL’s wijzen die 404 retourneren:

  1. Zoek naar een statuscode-filter of verbroken backlinks-rapport
  2. Filter om alleen 404-URL’s te tonen
  3. Exporteer deze URL’s (ze hebben redirects nodig ondanks dat ze kapot zijn)
⚠️ Backlinks naar niet-bestaande pagina's
Externe sites linken vaak naar URL's die niet meer op je site bestaan. Deze 404-URL's met backlinks moeten worden geredirect naar de meest relevante bestaande pagina om de linkwaarde vast te leggen.
Exporteer maandelijks backlinkgegevens tijdens de migratieplanning. Er verschijnen regelmatig nieuwe backlinks, en je wilt ze allemaal vastleggen voor de lancering.

Waarom zou ik de XML-sitemap crawlen?

Leg gedeclareerde belangrijke URL's vast

Je XML-sitemap vertegenwoordigt URL’s die je expliciet aan zoekmachines hebt verteld dat ze belangrijk zijn. Deze moeten allemaal worden opgenomen in je redirectplanning.

Wat sitemaps onthullen

Sitemap-element Migratiegebruik
URL-lijst Pagina’s die je belangrijk vindt
Laatst gewijzigde datums Recent bijgewerkte content
Prioriteitswaarden Je contenthiërarchie
Wijzigingsfrequentie Contentupdatepatronen

Sitemap-URL’s extraheren

Methode 1: Directe download

https://example.com/sitemap.xml
https://example.com/sitemap_index.xml

Methode 2: Screaming Frog

  1. Mode → List
  2. Upload → Download Sitemap
  3. Voer sitemap-URL in
  4. Crawl om URL’s te valideren

Methode 3: Search Console

  • Sitemaps-rapport toont ingediende URL’s
  • Indexdekkingsrapport toont welke zijn geïndexeerd

Sitemap vs crawlvergelijking

Vergelijk je sitemap-URL’s met crawlresultaten:

Scenario Betekenis Actie
In sitemap, gevonden in crawl Normaal Opnemen in redirects
In sitemap, niet in crawl Verweesde pagina Verifieer dat pagina bestaat, neem op
In crawl, niet in sitemap Ontbreekt in sitemap Opnemen in redirects
Als je sitemap automatisch wordt gegenereerd door je CMS, kan deze actueler zijn dan een crawl. Verzamel altijd beide en verwijder duplicaten.

Hoe exporteer ik URL’s uit Google Search Console?

Ontdek wat Google weet

Google Search Console onthult URL’s die Google heeft ontdekt en geïndexeerd, ongeacht of ze in je crawl of sitemap verschijnen.

URL-gegevens exporteren

Vanuit dekkingsrapport:

  1. Navigeer naar Indexering → Pagina’s
  2. Klik op elke statuscategorie (Geldig, Uitgesloten, etc.)
  3. Exporteer de URL-lijst voor elke categorie

Vanuit prestatierapport:

  1. Navigeer naar Prestaties
  2. Klik op Pagina’s-tabblad
  3. Exporteer om URL’s met vertoningen/klikken te zien

Dekkingscategorieën om te exporteren

Categorie Waarom het belangrijk is
Geldig (geïndexeerd) URL’s die in zoekresultaten verschijnen
Geldig met waarschuwingen Geïndexeerd maar heeft problemen
Uitgesloten - gecrawld niet geïndexeerd Google heeft gevonden maar niet geïndexeerd
Uitgesloten - ontdekt niet geïndexeerd Google weet ervan maar heeft niet gecrawld
Uitgesloten - redirect URL’s die Google als redirect ziet

Prestatiegegevenswaarde

URL’s met zoekvertoningen of klikken zijn bewezen waardevol:

  • Gebruikers vinden ze via zoekopdrachten
  • Google beschouwt ze als relevant voor queries
  • Het verliezen van deze URL’s betekent verkeersverlies

Exporteer de laatste 16 maanden aan gegevens voor het meest complete beeld.

⚠️ Search Console URL-limieten
Search Console-exports zijn beperkt tot 1.000 rijen in de UI. Gebruik de Search Console API of Google's Bulk Data Export (BigQuery) voor complete gegevens op grote sites.
Besteed speciale aandacht aan de categorie "Uitgesloten - Redirect". Deze tonen redirects die Google al heeft gedetecteerd. Zorg dat ze zijn verwerkt in je nieuwe redirectplan.

Aanbevolen tool: SEOGets

Voor een krachtigere manier om met Search Console-gegevens te werken, overweeg SEOGets. Hun indexeringsrapport biedt een meer geavanceerde weergave van je geïndexeerde pagina’s dan de native Search Console-interface, waardoor het gemakkelijker wordt om de URL’s te identificeren en exporteren die je nodig hebt voor redirectplanning.

SEOGets Indexeringsrapport

Hoe verzamel ik URL’s uit analytics?

Identificeer verkeersgenererende pagina's

Analysegegevens tonen welke URL’s daadwerkelijk bezoekersverkeer ontvangen. Dit zijn je hoogste prioriteit redirectkandidaten.

Exporteren vanuit Google Analytics (GA4)

  1. Navigeer naar Rapporten → Betrokkenheid → Pagina’s en schermen
  2. Stel datumbereik in op laatste 12-16 maanden
  3. Exporteer het volledige paginapadrapport

Belangrijke metrics om vast te leggen

Metric Prioriteitsindicator
Sessies Totaal verkeersvolume
Gebruikers Aantal unieke bezoekers
Betrokkenheidspercentage Contentkwaliteitssignaal
Conversies Bedrijfswaarde

Prioriteitsniveaus creëren

Segmenteer URL’s op verkeersvolume:

Maandelijkse sessies Prioriteit Redirectbehandeling
1.000+ Kritiek Moet redirecten, verifieer bestemming
100-999 Hoog Moet redirecten
10-99 Gemiddeld Zou moeten redirecten
1-9 Laag Redirect indien praktisch
0 Laagst Redirect alleen als backlinks bestaan

Vergeet landingspagina’s niet

Filter voor pagina’s waar gebruikers je site betreden:

  • Deze zijn vaak extern gelinkt of als bladwijzer opgeslagen
  • Het verliezen van landingspagina’s heeft onevenredig grote verkeersimpact
  • Geef prioriteit aan redirects voor top landingspagina’s
Vergelijk analytics-URL's met je crawl. Pagina's met verkeer die niet in de crawl zijn gevonden, kunnen verweesde content zijn die nog steeds redirects nodig heeft.

Waar vind ik bestaande 301-redirecttabellen?

Voorkom redirectketens

Voordat je nieuwe redirects creëert, moet je weten welke redirects al bestaan. Het negeren van bestaande redirects creëert ketens die SEO en prestaties schaden.

Veelvoorkomende redirectbronnen

Bron Waar te vinden Exportmethode
CMS Redirect Admin WordPress, Shopify, etc. beheerpaneel Ingebouwde export of database-query
Redirect-plugins Yoast, Redirection, Rank Math Plugin-instellingen → Export
Edge-diensten Cloudflare, Fastly, Netlify Dashboard → Regels → Export
Netwerkplatforms Load balancers, CDN’s Configuratiebestanden
Serverconfiguratie .htaccess, nginx.conf Directe bestandstoegang

CMS-specifieke locaties

WordPress:

  • Redirection-plugin: Tools → Redirection → Export
  • Yoast Premium: SEO → Redirects → Export
  • Database: wp_redirection_items tabel

Shopify:

  • Admin → Content → URL Redirects → Export

Webflow:

  • Site Settings → Publishing → 301 Redirects

Wat te documenteren

Voor elke bestaande redirect, leg vast:

Veld Voorbeeld
Bron-URL /old-page
Doel-URL /new-page
Redirecttype 301 of 302
Locatie Plugin, .htaccess, CDN
Aanmaakdatum 2024-03-15
⚠️ Meerdere redirectbronnen
Veel sites hebben redirects geconfigureerd op meerdere plaatsen (CMS, plugins, server, CDN). Controleer ALLE bronnen om een compleet beeld te krijgen. Het missen van één bron kan onverwacht redirectgedrag veroorzaken.
Consolideer alle bestaande redirects in één document voor de migratie. Dit wordt je referentie voor wat al is afgehandeld en wat mogelijk kan conflicteren met nieuwe redirects.

Wat is een handige manier om redirectketengegevens te gebruiken?

Opruimen voor migratie

Redirectketens ontstaan wanneer de ene redirect naar een andere redirect wijst, wat meerdere hops creëert. Deze schaden SEO en paginasnelheid. Migratie is het perfecte moment om ze te elimineren.

Redirectketens identificeren

In Screaming Frog:

  1. Crawl je site
  2. Filter op Status Code → 3xx
  3. Zoek naar redirects waarbij Redirect URL ook een redirect is

Keten voorbeeld:

/page-a → 301 → /page-b → 301 → /page-c → 200

Dit is een 2-hop keten die zou moeten worden:
/page-a → 301 → /page-c
/page-b → 301 → /page-c

Het ketenoplossingproces

  1. Map alle redirectketens: Documenteer elk A→B→C patroon
  2. Identificeer eindbestemmingen: Vind waar elke keten uiteindelijk leidt
  3. Update bronredirects: Wijs direct naar eindbestemming
  4. Verwijder tussenliggende redirects: Verwijder onnodige hops
  5. Verifieer oplossing: Test dat ketens zijn geëlimineerd

Veelvoorkomende ketenscenario’s

Scenario Voor Na
HTTP naar HTTPS naar pagina http→https→/new http→/new (als HTTPS op serverniveau wordt afgedwongen)
Oude redirect + nieuwe redirect /old→/middle→/new /old→/new, /middle→/new
WWW-normalisatieketen non-www→www→/page non-www→/page (www op DNS-niveau)
⚠️ Ketens verspillen crawlbudget
Zoekmachinebots volgen mogelijk geen lange redirectketens, wat betekent dat pagina's aan het einde van ketens mogelijk niet goed worden gecrawld of geïndexeerd. Google beveelt maximaal 2 hops aan.