Bringen Sie Ihre CARS & BS vor der Migration in Ordnung.

Diese einfache Eselsbrücke deckt die sechs wesentlichen Datenquellen zum Erstellen einer vollständigen URL-Liste ab:

  • Crawl (Crawlen)
  • Analytics (Analysedaten)
  • Redirects (Weiterleitungen - bestehende)
  • Sitemap
  • Backlinks
  • Search Console

Sammeln Sie aus allen sechs Quellen, und Sie werden keine wichtige URL verpassen.

URL-Sammelaufgabe Zweck
Domain nach HTML-URLs crawlen Alle Live-Seiten entdecken
Nach Statuscode kategorisieren Weiterleitungsbedarf identifizieren
URLs mit Backlinks sammeln SEO-Wert bewahren
XML-Sitemap crawlen Deklarierte wichtige Seiten erfassen
Search Console-Daten exportieren Indexierte URLs finden
Analytics-URLs sammeln Traffic-generierende Seiten identifizieren
Vorhandene Weiterleitungstabellen prüfen Weiterleitungsketten verhindern
Alle Datensätze vereinheitlichen Umfassende Weiterleitungsliste erstellen

Welche Datensätze sollte ich verwenden, um umfassende URL-Listen zu erstellen?

Best Practice

Eine erfolgreiche Website-Migration erfordert das Sammeln von URLs aus mehreren Quellen, um sicherzustellen, dass keine wichtige Seite übersehen wird. Die Beschränkung auf eine einzige Quelle hinterlässt Lücken in Ihrer Weiterleitungsabdeckung.

Wesentliche Datenquellen

Quelle Was sie erfasst
Domain-Crawl Alle entdeckbaren HTML-URLs
XML-Sitemap URLs, die Sie als wichtig deklariert haben
Google Search Console URLs, die Google kennt
Analytics URLs mit tatsächlichem Traffic
Backlink-Tools URLs mit externen Links
Vorhandene Weiterleitungstabellen Aktuelle Weiterleitungs-Mappings

Der Multi-Quellen-Ansatz

Jede Quelle erfasst URLs, die die anderen möglicherweise übersehen:

  • Crawler verpassen verwaiste Seiten, die intern nicht verlinkt sind
  • Sitemaps können veraltet oder unvollständig sein
  • Search Console zeigt nur indexierte URLs
  • Analytics verpasst Seiten ohne Traffic
  • Backlink-Tools konzentrieren sich auf extern verlinkte Seiten
Sammeln Sie aus allen verfügbaren Quellen und deduplizieren Sie dann. Es ist weitaus besser, redundante Daten zu haben, als eine hochwertige URL zu verpassen, die nach der Migration Traffic oder SEO-Wert verliert.

Wie crawle ich die Domain, um HTML-URLs zu sammeln?

Kritischer erster Schritt

Beginnen Sie damit, Ihre gesamte Domain mit einem Tool wie Screaming Frog, Sitebulb oder ähnlichen Web-Crawlern zu crawlen. Dies entdeckt alle HTML-Seiten, die in Ihrer Website-Struktur verlinkt sind.

Crawl-Konfiguration

Empfohlene Einstellungen:

  • Crawl-Tiefe: Unbegrenzt (oder hoch genug, um alle Seiten zu erreichen)
  • Robots.txt beachten: Für Migrationszwecke deaktivieren (Sie benötigen ALLE URLs)
  • Internen Links folgen: Aktiviert
  • Außerhalb des Startordners crawlen: Deaktiviert (auf Ihrer Domain bleiben)
  • HTML speichern: Optional, aber nützlich für Inhaltsvergleiche

Was extrahiert werden soll

Exportieren Sie Folgendes aus Ihrem Crawl:

URL-Adresse
Statuscode
Indexierbarkeit
Kanonische URL
Meta-Robots
Titel

Tipps für große Websites

Für Websites mit über 100.000 URLs:

  1. Nach Unterverzeichnis segmentieren: /blog/, /products/, /pages/ separat crawlen
  2. Listenmodus verwenden: Bekannte URLs direkt einspeisen, anstatt sie zu entdecken
  3. Speicherzuweisung erhöhen: Screaming Frog benötigt möglicherweise über 8 GB RAM
  4. Über Nacht laufen lassen: Große Crawls können Stunden dauern
⚠️ Die Live-Site crawlen
Crawlen Sie immer Ihre aktuelle Produktions-Website, bevor die Migration beginnt. Das Crawlen einer Staging- oder Entwicklungsumgebung verpasst URLs, die nur in der Produktion existieren.
Führen Sie Ihren Crawl mindestens zweimal durch: einmal zu Beginn der Migrationsplanung und einmal unmittelbar vor dem Start. URLs ändern sich während der Entwicklung, und Sie benötigen die aktuellsten Daten.

Wie sollte ich URLs nach Statuscode kategorisieren?

Wesentliche Organisation

Kategorisieren Sie nach dem Crawlen alle entdeckten URLs nach ihrem HTTP-Statuscode. Jede Kategorie erfordert eine unterschiedliche Behandlung in Ihrer Weiterleitungsstrategie.

Statuscode-Kategorien

200 OK URLs: Ihre primäre Weiterleitungsquellenliste

Unterkategorie Beschreibung Aktion
Indexierbar Kann in Suchergebnissen erscheinen Weiterleitungen mit hoher Priorität
Nicht indexierbar Von Indexierung blockiert Weiterleitungsbedarf bewerten
Kanonisiert Verweist auf eine andere URL Zum kanonischen Ziel weiterleiten
NoIndex Meta-NoIndex-Tag vorhanden Weiterleitungen mit niedriger Priorität
UTM-Parameter Marketing-Tracking-URLs Normalerweise von Weiterleitungen ausschließen
Filter-Parameter Facettierte Navigations-URLs Normalerweise von Weiterleitungen ausschließen

301/302-Weiterleitungs-URLs: Werden bereits weitergeleitet

  • Vorhandene Weiterleitungsziele dokumentieren
  • Sicherstellen, dass neue Weiterleitungen auf endgültige Ziele verweisen
  • Vermeidung von Weiterleitungsketten

404 Not Found URLs: Defekt, aber möglicherweise wichtig

  • Auf Backlinks prüfen, die auf diese URLs verweisen
  • Search Console auf indexierte 404er überprüfen
  • Benötigen möglicherweise Weiterleitungen, wenn sie SEO-Wert haben
Erstellen Sie separate Tabellenblätter oder Dateien für jede Statuscode-Kategorie. Dies erleichtert die Anwendung unterschiedlicher Weiterleitungsstrategien für jede Gruppe.

Sollte ich URLs mit anderen Statuscodes als 200 einbeziehen?

Ja: Kritisch für vollständige Abdeckung

Viele Migrationsprojekte konzentrieren sich nur auf 200-Status-Seiten, aber 301/302- und 404-URLs sind ebenso wichtig für die Aufrechterhaltung von SEO-Wert und Benutzererfahrung.

Warum 301/302-URLs wichtig sind

Vorhandene Weiterleitungen repräsentieren URLs, die einst Wert hatten:

  • Externe Websites können immer noch auf die alten URLs verlinken
  • Suchmaschinen haben möglicherweise die alten URLs indexiert
  • Benutzer haben möglicherweise die alten URLs als Lesezeichen gespeichert

Wenn Sie vorhandene Weiterleitungen ignorieren:

Alte URL → Aktuelle Weiterleitung → Neue Website (defekt)

Mit ordnungsgemäßer Handhabung:

Alte URL → Neue Website (direkt)

Warum 404-URLs wichtig sind

Ein 404-Status bedeutet nicht, dass eine URL wertlos ist:

404-Szenario Weiterleitungsbedarf
Hat Backlinks von externen Websites Ja: Link-Equity bewahren
Erscheint in Search Console Ja: Google weiß davon
Zeigt Traffic in Analytics Ja: Benutzer suchen danach
Kürzlich gelöschter Inhalt Vielleicht: Relevanz bewerten
Hatte nie Traffic oder Links Nein: Kann sicher ignoriert werden

404-Daten sammeln

404er exportieren aus:

  • Screaming Frog-Crawl-Ergebnissen
  • Google Search Console-Abdeckungsbericht
  • Server-Zugriffsprotokollen
  • Analytics (Seiten mit null Seitenaufrufen, aber Sessions)
⚠️ Nicht alles weiterleiten
Nicht jeder 404er benötigt eine Weiterleitung. Konzentrieren Sie sich auf 404er, die Backlinks, Sucheindrücke haben oder Inhalte repräsentieren, die verschoben wurden, anstatt Inhalte, die absichtlich entfernt wurden.
Vergleichen Sie Ihre 404-Liste mit Ahrefs- oder Search Console-Daten. Priorisieren Sie Weiterleitungen für 404-URLs, die externe Backlinks oder aktuelle Sucheindrücke haben.

Welche URL-Varianten sollte ich berücksichtigen?

Häufige Migrationsfalle

Auf dieselbe Seite kann über mehrere URL-Varianten zugegriffen werden. Das Verpassen einer Variante bedeutet defekte Links und verlorenen Traffic.

Kritische URL-Varianten

Variantentyp Beispiel A Beispiel B
www vs. nicht-www www.example.com/page example.com/page
Trailing Slash /products/ /products
Groß-/Kleinschreibung /Products/Widget /products/widget
URL-Kodierung /search?q=hello%20world /search?q=hello world
Protokoll https:// http://
Index-Dateien /folder/index.html /folder/

Wie Varianten Probleme verursachen

Externe Links und Lesezeichen können jede Variante verwenden:

Backlink verwendet: example.com/Blog/Post-Title
Ihre Weiterleitung: www.example.com/blog/post-title

Ergebnis: 404-Fehler, Weiterleitung nicht übereinstimmend

Alle Varianten sammeln

  1. Backlink-Berichte prüfen: Externe Websites verwenden inkonsistente Formate
  2. Server-Protokolle überprüfen: Tatsächlich angeforderte URLs sehen
  3. Manuell testen: Häufige Varianten wichtiger Seiten ausprobieren
  4. Search Console: Zeigt URL-Varianten, auf die Google gestoßen ist

Standardisierungsstrategie

Entscheiden Sie sich für Ihr kanonisches Format und leiten Sie dann alle Varianten weiter:

Alter Pfad Weiterleiten zu
/Products/ /products
/PRODUCTS/ /products
/products /products
/Products /products
Verwenden Sie groß-/kleinschreibungsunabhängiges Matching, wenn Ihre Plattform dies unterstützt. Andernfalls generieren Sie Weiterleitungen für alle bekannten Groß-/Kleinschreibungsvarianten von URLs mit hohem Traffic.
SEO-Wert bewahren

URLs mit externen Backlinks tragen SEO-Wert, der über 301-Weiterleitungen übertragen wird. Backlink-Analysetools zeigen, welche URLs diesen Wert haben.

Tool Hauptmerkmal
Ahrefs Site Explorer → Best by Links
Semrush Backlink Analytics → Indexed Pages

Exportprozess (Allgemeine Schritte)

  1. Geben Sie Ihre Domain ein in der Website-Analysefunktion des Tools
  2. Navigieren Sie zu dem Seiten- oder URLs-Bericht (zeigt, welche Seiten Backlinks erhalten)
  3. Exportieren Sie die vollständige Liste der Seiten mit Backlinks
  4. Filtern Sie nur auf die URLs Ihrer Domain

Zu erfassende Schlüsseldatenpunkte

Datenpunkt Zweck
Ziel-URL Die URL, die Backlinks erhält
Verweisende Domains Anzahl eindeutiger verlinkender Websites
Gesamt-Backlinks Gesamtzahl der Links
Link-Qualitätsscore Autoritätsindikator (variiert je nach Tool)

Priorisierungsrahmen

Nicht alle URLs mit Backlinks sind gleich:

Verweisende Domains Priorität Aktion
50+ Kritisch Muss weitergeleitet werden
10-49 Hoch Sollte weitergeleitet werden
2-9 Mittel Weiterleiten, wenn praktikabel
1 Niedrig Einzeln bewerten

Die meisten Backlink-Tools zeigen Links, die auf URLs verweisen, die 404 zurückgeben:

  1. Suchen Sie nach einem Statuscode-Filter oder Defekte Backlinks-Bericht
  2. Filtern Sie, um nur 404-URLs anzuzeigen
  3. Exportieren Sie diese URLs (sie benötigen Weiterleitungen, obwohl sie defekt sind)
⚠️ Backlinks zu nicht existierenden Seiten
Externe Websites verlinken oft auf URLs, die auf Ihrer Website nicht mehr existieren. Diese 404-URLs mit Backlinks sollten zur relevantesten vorhandenen Seite weitergeleitet werden, um den Link-Equity zu erfassen.
Exportieren Sie Backlink-Daten monatlich während der Migrationsplanung. Neue Backlinks erscheinen regelmäßig, und Sie möchten sie alle vor dem Start erfassen.

Warum sollte ich die XML-Sitemap crawlen?

Deklarierte wichtige URLs erfassen

Ihre XML-Sitemap repräsentiert URLs, die Sie Suchmaschinen explizit als wichtig mitgeteilt haben. Diese sollten alle in Ihrer Weiterleitungsplanung enthalten sein.

Was Sitemaps offenbaren

Sitemap-Element Migrationsnutzen
URL-Liste Seiten, die Sie als wichtig betrachten
Letzte Änderungsdaten Kürzlich aktualisierte Inhalte
Prioritätswerte Ihre Inhaltshierarchie
Änderungshäufigkeit Inhaltsaktualisierungsmuster

Sitemap-URLs extrahieren

Methode 1: Direkter Download

https://example.com/sitemap.xml
https://example.com/sitemap_index.xml

Methode 2: Screaming Frog

  1. Modus → Liste
  2. Upload → Sitemap herunterladen
  3. Sitemap-URL eingeben
  4. Crawlen, um URLs zu validieren

Methode 3: Search Console

  • Sitemaps-Bericht zeigt eingereichte URLs
  • Indexabdeckung zeigt, welche indexiert sind

Sitemap vs. Crawl-Vergleich

Vergleichen Sie Ihre Sitemap-URLs mit Crawl-Ergebnissen:

Szenario Bedeutung Aktion
In Sitemap, im Crawl gefunden Normal In Weiterleitungen einbeziehen
In Sitemap, nicht im Crawl Verwaiste Seite Überprüfen, ob Seite existiert, einbeziehen
Im Crawl, nicht in Sitemap Fehlt in Sitemap In Weiterleitungen einbeziehen
Wenn Ihre Sitemap automatisch von Ihrem CMS generiert wird, ist sie möglicherweise aktueller als ein Crawl. Sammeln Sie immer beides und deduplizieren Sie.

Wie exportiere ich URLs aus Google Search Console?

Finden, was Google weiß

Google Search Console zeigt URLs, die Google entdeckt und indexiert hat, unabhängig davon, ob sie in Ihrem Crawl oder Ihrer Sitemap erscheinen.

URL-Daten exportieren

Aus Abdeckungsbericht:

  1. Navigieren Sie zu Indexierung → Seiten
  2. Klicken Sie auf jede Statuskategorie (Gültig, Ausgeschlossen usw.)
  3. Exportieren Sie die URL-Liste für jede Kategorie

Aus Leistungsbericht:

  1. Navigieren Sie zu Leistung
  2. Klicken Sie auf den Tab Seiten
  3. Exportieren Sie, um URLs mit Impressionen/Klicks zu sehen

Zu exportierende Abdeckungskategorien

Kategorie Warum sie wichtig ist
Gültig (Indexiert) URLs, die in Suchergebnissen erscheinen
Gültig mit Warnungen Indexiert, aber mit Problemen
Ausgeschlossen - Gecrawlt, nicht indexiert Google gefunden, aber nicht indexiert
Ausgeschlossen - Entdeckt, nicht indexiert Google weiß davon, hat aber nicht gecrawlt
Ausgeschlossen - Weiterleitung URLs, die Google als weiterleitend sieht

Wert der Leistungsdaten

URLs mit Sucheindrücken oder Klicks sind nachweislich wertvoll:

  • Benutzer finden sie über die Suche
  • Google hält sie für relevant für Suchanfragen
  • Der Verlust dieser URLs bedeutet Trafficverlust

Exportieren Sie die Daten der letzten 16 Monate für das vollständigste Bild.

⚠️ Search Console URL-Limits
Search Console-Exporte sind in der Benutzeroberfläche auf 1.000 Zeilen begrenzt. Verwenden Sie die Search Console API oder Googles Bulk Data Export (BigQuery) für vollständige Daten auf großen Websites.
Achten Sie besonders auf die Kategorie "Ausgeschlossen - Weiterleitung". Diese zeigen Weiterleitungen, die Google bereits erkannt hat. Stellen Sie sicher, dass sie in Ihrem neuen Weiterleitungsplan berücksichtigt werden.

Empfohlenes Tool: SEOGets

Für eine leistungsfähigere Möglichkeit, mit Search Console-Daten zu arbeiten, sollten Sie SEOGets in Betracht ziehen. Ihr Indexierungsbericht bietet eine anspruchsvollere Ansicht Ihrer indexierten Seiten als die native Search Console-Oberfläche und erleichtert das Identifizieren und Exportieren der URLs, die Sie für die Weiterleitungsplanung benötigen.

SEOGets Indexing Report

Wie sammle ich URLs aus Analytics?

Traffic-generierende Seiten identifizieren

Analysedaten zeigen, welche URLs tatsächlich Besuchertraffic erhalten. Dies sind Ihre Weiterleitungskandidaten mit höchster Priorität.

Exportieren aus Google Analytics (GA4)

  1. Navigieren Sie zu Berichte → Engagement → Seiten und Bildschirme
  2. Setzen Sie den Datumsbereich auf letzte 12-16 Monate
  3. Exportieren Sie den vollständigen Seitenpfad-Bericht

Zu erfassende Schlüsselmetriken

Metrik Prioritätsindikator
Sitzungen Gesamttraffic-Volumen
Nutzer Anzahl eindeutiger Besucher
Interaktionsrate Signal für Inhaltsqualität
Conversions Geschäftswert

Prioritätsstufen erstellen

Segmentieren Sie URLs nach Traffic-Volumen:

Monatliche Sitzungen Priorität Weiterleitungsbehandlung
1.000+ Kritisch Muss weitergeleitet werden, Ziel überprüfen
100-999 Hoch Muss weitergeleitet werden
10-99 Mittel Sollte weitergeleitet werden
1-9 Niedrig Weiterleiten, wenn praktikabel
0 Am niedrigsten Nur weiterleiten, wenn Backlinks vorhanden sind

Landingpages nicht vergessen

Filtern Sie nach Seiten, auf denen Benutzer Ihre Website betreten:

  • Diese sind oft extern verlinkt oder als Lesezeichen gespeichert
  • Der Verlust von Landingpages hat überproportionale Auswirkungen auf den Traffic
  • Priorisieren Sie Weiterleitungen für Top-Landingpages
Vergleichen Sie Analytics-URLs mit Ihrem Crawl. Seiten mit Traffic, die im Crawl nicht gefunden wurden, können verwaiste Inhalte sein, die dennoch Weiterleitungen benötigen.

Wo finde ich vorhandene 301-Weiterleitungstabellen?

Weiterleitungsketten verhindern

Bevor Sie neue Weiterleitungen erstellen, müssen Sie wissen, welche Weiterleitungen bereits existieren. Das Ignorieren vorhandener Weiterleitungen erzeugt Ketten, die SEO und Leistung beeinträchtigen.

Häufige Weiterleitungsquellen

Quelle Wo zu finden Exportmethode
CMS-Weiterleitungs-Admin WordPress, Shopify usw. Admin-Panel Integrierter Export oder Datenbankabfrage
Weiterleitungs-Plugins Yoast, Redirection, Rank Math Plugin-Einstellungen → Export
Edge-Services Cloudflare, Fastly, Netlify Dashboard → Regeln → Export
Netzwerkplattformen Load Balancer, CDNs Konfigurationsdateien
Server-Konfiguration .htaccess, nginx.conf Direkter Dateizugriff

CMS-spezifische Standorte

WordPress:

  • Redirection-Plugin: Tools → Redirection → Export
  • Yoast Premium: SEO → Redirects → Export
  • Datenbank: wp_redirection_items-Tabelle

Shopify:

  • Admin → Content → URL Redirects → Export

Webflow:

  • Site Settings → Publishing → 301 Redirects

Was zu dokumentieren ist

Erfassen Sie für jede vorhandene Weiterleitung:

Feld Beispiel
Quell-URL /old-page
Ziel-URL /new-page
Weiterleitungstyp 301 oder 302
Standort Plugin, .htaccess, CDN
Erstellungsdatum 2024-03-15
⚠️ Mehrere Weiterleitungsquellen
Viele Websites haben Weiterleitungen an mehreren Stellen konfiguriert (CMS, Plugins, Server, CDN). Prüfen Sie ALLE Quellen, um ein vollständiges Bild zu erhalten. Das Verpassen einer Quelle kann unerwartetes Weiterleitungsverhalten verursachen.