Bringen Sie Ihre CARS & BS vor der Migration in Ordnung.
Diese einfache Eselsbrücke deckt die sechs wesentlichen Datenquellen zum Erstellen einer vollständigen URL-Liste ab:
- Crawl (Crawlen)
- Analytics (Analysedaten)
- Redirects (Weiterleitungen - bestehende)
- Sitemap
- Backlinks
- Search Console
Sammeln Sie aus allen sechs Quellen, und Sie werden keine wichtige URL verpassen.
| URL-Sammelaufgabe | Zweck |
|---|---|
| Domain nach HTML-URLs crawlen | Alle Live-Seiten entdecken |
| Nach Statuscode kategorisieren | Weiterleitungsbedarf identifizieren |
| URLs mit Backlinks sammeln | SEO-Wert bewahren |
| XML-Sitemap crawlen | Deklarierte wichtige Seiten erfassen |
| Search Console-Daten exportieren | Indexierte URLs finden |
| Analytics-URLs sammeln | Traffic-generierende Seiten identifizieren |
| Vorhandene Weiterleitungstabellen prüfen | Weiterleitungsketten verhindern |
| Alle Datensätze vereinheitlichen | Umfassende Weiterleitungsliste erstellen |
Welche Datensätze sollte ich verwenden, um umfassende URL-Listen zu erstellen?
Eine erfolgreiche Website-Migration erfordert das Sammeln von URLs aus mehreren Quellen, um sicherzustellen, dass keine wichtige Seite übersehen wird. Die Beschränkung auf eine einzige Quelle hinterlässt Lücken in Ihrer Weiterleitungsabdeckung.
Wesentliche Datenquellen
| Quelle | Was sie erfasst |
|---|---|
| Domain-Crawl | Alle entdeckbaren HTML-URLs |
| XML-Sitemap | URLs, die Sie als wichtig deklariert haben |
| Google Search Console | URLs, die Google kennt |
| Analytics | URLs mit tatsächlichem Traffic |
| Backlink-Tools | URLs mit externen Links |
| Vorhandene Weiterleitungstabellen | Aktuelle Weiterleitungs-Mappings |
Der Multi-Quellen-Ansatz
Jede Quelle erfasst URLs, die die anderen möglicherweise übersehen:
- Crawler verpassen verwaiste Seiten, die intern nicht verlinkt sind
- Sitemaps können veraltet oder unvollständig sein
- Search Console zeigt nur indexierte URLs
- Analytics verpasst Seiten ohne Traffic
- Backlink-Tools konzentrieren sich auf extern verlinkte Seiten
Wie crawle ich die Domain, um HTML-URLs zu sammeln?
Beginnen Sie damit, Ihre gesamte Domain mit einem Tool wie Screaming Frog, Sitebulb oder ähnlichen Web-Crawlern zu crawlen. Dies entdeckt alle HTML-Seiten, die in Ihrer Website-Struktur verlinkt sind.
Crawl-Konfiguration
Empfohlene Einstellungen:
- Crawl-Tiefe: Unbegrenzt (oder hoch genug, um alle Seiten zu erreichen)
- Robots.txt beachten: Für Migrationszwecke deaktivieren (Sie benötigen ALLE URLs)
- Internen Links folgen: Aktiviert
- Außerhalb des Startordners crawlen: Deaktiviert (auf Ihrer Domain bleiben)
- HTML speichern: Optional, aber nützlich für Inhaltsvergleiche
Was extrahiert werden soll
Exportieren Sie Folgendes aus Ihrem Crawl:
URL-Adresse
Statuscode
Indexierbarkeit
Kanonische URL
Meta-Robots
Titel
Tipps für große Websites
Für Websites mit über 100.000 URLs:
- Nach Unterverzeichnis segmentieren:
/blog/,/products/,/pages/separat crawlen - Listenmodus verwenden: Bekannte URLs direkt einspeisen, anstatt sie zu entdecken
- Speicherzuweisung erhöhen: Screaming Frog benötigt möglicherweise über 8 GB RAM
- Über Nacht laufen lassen: Große Crawls können Stunden dauern
Wie sollte ich URLs nach Statuscode kategorisieren?
Kategorisieren Sie nach dem Crawlen alle entdeckten URLs nach ihrem HTTP-Statuscode. Jede Kategorie erfordert eine unterschiedliche Behandlung in Ihrer Weiterleitungsstrategie.
Statuscode-Kategorien
200 OK URLs: Ihre primäre Weiterleitungsquellenliste
| Unterkategorie | Beschreibung | Aktion |
|---|---|---|
| Indexierbar | Kann in Suchergebnissen erscheinen | Weiterleitungen mit hoher Priorität |
| Nicht indexierbar | Von Indexierung blockiert | Weiterleitungsbedarf bewerten |
| Kanonisiert | Verweist auf eine andere URL | Zum kanonischen Ziel weiterleiten |
| NoIndex | Meta-NoIndex-Tag vorhanden | Weiterleitungen mit niedriger Priorität |
| UTM-Parameter | Marketing-Tracking-URLs | Normalerweise von Weiterleitungen ausschließen |
| Filter-Parameter | Facettierte Navigations-URLs | Normalerweise von Weiterleitungen ausschließen |
301/302-Weiterleitungs-URLs: Werden bereits weitergeleitet
- Vorhandene Weiterleitungsziele dokumentieren
- Sicherstellen, dass neue Weiterleitungen auf endgültige Ziele verweisen
- Vermeidung von Weiterleitungsketten
404 Not Found URLs: Defekt, aber möglicherweise wichtig
- Auf Backlinks prüfen, die auf diese URLs verweisen
- Search Console auf indexierte 404er überprüfen
- Benötigen möglicherweise Weiterleitungen, wenn sie SEO-Wert haben
Sollte ich URLs mit anderen Statuscodes als 200 einbeziehen?
Viele Migrationsprojekte konzentrieren sich nur auf 200-Status-Seiten, aber 301/302- und 404-URLs sind ebenso wichtig für die Aufrechterhaltung von SEO-Wert und Benutzererfahrung.
Warum 301/302-URLs wichtig sind
Vorhandene Weiterleitungen repräsentieren URLs, die einst Wert hatten:
- Externe Websites können immer noch auf die alten URLs verlinken
- Suchmaschinen haben möglicherweise die alten URLs indexiert
- Benutzer haben möglicherweise die alten URLs als Lesezeichen gespeichert
Wenn Sie vorhandene Weiterleitungen ignorieren:
Alte URL → Aktuelle Weiterleitung → Neue Website (defekt)
Mit ordnungsgemäßer Handhabung:
Alte URL → Neue Website (direkt)
Warum 404-URLs wichtig sind
Ein 404-Status bedeutet nicht, dass eine URL wertlos ist:
| 404-Szenario | Weiterleitungsbedarf |
|---|---|
| Hat Backlinks von externen Websites | Ja: Link-Equity bewahren |
| Erscheint in Search Console | Ja: Google weiß davon |
| Zeigt Traffic in Analytics | Ja: Benutzer suchen danach |
| Kürzlich gelöschter Inhalt | Vielleicht: Relevanz bewerten |
| Hatte nie Traffic oder Links | Nein: Kann sicher ignoriert werden |
404-Daten sammeln
404er exportieren aus:
- Screaming Frog-Crawl-Ergebnissen
- Google Search Console-Abdeckungsbericht
- Server-Zugriffsprotokollen
- Analytics (Seiten mit null Seitenaufrufen, aber Sessions)
Welche URL-Varianten sollte ich berücksichtigen?
Auf dieselbe Seite kann über mehrere URL-Varianten zugegriffen werden. Das Verpassen einer Variante bedeutet defekte Links und verlorenen Traffic.
Kritische URL-Varianten
| Variantentyp | Beispiel A | Beispiel B |
|---|---|---|
| www vs. nicht-www | www.example.com/page |
example.com/page |
| Trailing Slash | /products/ |
/products |
| Groß-/Kleinschreibung | /Products/Widget |
/products/widget |
| URL-Kodierung | /search?q=hello%20world |
/search?q=hello world |
| Protokoll | https:// |
http:// |
| Index-Dateien | /folder/index.html |
/folder/ |
Wie Varianten Probleme verursachen
Externe Links und Lesezeichen können jede Variante verwenden:
Backlink verwendet: example.com/Blog/Post-Title
Ihre Weiterleitung: www.example.com/blog/post-title
Ergebnis: 404-Fehler, Weiterleitung nicht übereinstimmend
Alle Varianten sammeln
- Backlink-Berichte prüfen: Externe Websites verwenden inkonsistente Formate
- Server-Protokolle überprüfen: Tatsächlich angeforderte URLs sehen
- Manuell testen: Häufige Varianten wichtiger Seiten ausprobieren
- Search Console: Zeigt URL-Varianten, auf die Google gestoßen ist
Standardisierungsstrategie
Entscheiden Sie sich für Ihr kanonisches Format und leiten Sie dann alle Varianten weiter:
| Alter Pfad | Weiterleiten zu |
|---|---|
| /Products/ | /products |
| /PRODUCTS/ | /products |
| /products | /products |
| /Products | /products |
Wie sammle ich URLs mit Backlinks?
URLs mit externen Backlinks tragen SEO-Wert, der über 301-Weiterleitungen übertragen wird. Backlink-Analysetools zeigen, welche URLs diesen Wert haben.
Gängige Backlink-Tools
| Tool | Hauptmerkmal |
|---|---|
| Ahrefs | Site Explorer → Best by Links |
| Semrush | Backlink Analytics → Indexed Pages |
Exportprozess (Allgemeine Schritte)
- Geben Sie Ihre Domain ein in der Website-Analysefunktion des Tools
- Navigieren Sie zu dem Seiten- oder URLs-Bericht (zeigt, welche Seiten Backlinks erhalten)
- Exportieren Sie die vollständige Liste der Seiten mit Backlinks
- Filtern Sie nur auf die URLs Ihrer Domain
Zu erfassende Schlüsseldatenpunkte
| Datenpunkt | Zweck |
|---|---|
| Ziel-URL | Die URL, die Backlinks erhält |
| Verweisende Domains | Anzahl eindeutiger verlinkender Websites |
| Gesamt-Backlinks | Gesamtzahl der Links |
| Link-Qualitätsscore | Autoritätsindikator (variiert je nach Tool) |
Priorisierungsrahmen
Nicht alle URLs mit Backlinks sind gleich:
| Verweisende Domains | Priorität | Aktion |
|---|---|---|
| 50+ | Kritisch | Muss weitergeleitet werden |
| 10-49 | Hoch | Sollte weitergeleitet werden |
| 2-9 | Mittel | Weiterleiten, wenn praktikabel |
| 1 | Niedrig | Einzeln bewerten |
404-Backlinks nicht vergessen
Die meisten Backlink-Tools zeigen Links, die auf URLs verweisen, die 404 zurückgeben:
- Suchen Sie nach einem Statuscode-Filter oder Defekte Backlinks-Bericht
- Filtern Sie, um nur 404-URLs anzuzeigen
- Exportieren Sie diese URLs (sie benötigen Weiterleitungen, obwohl sie defekt sind)
Warum sollte ich die XML-Sitemap crawlen?
Ihre XML-Sitemap repräsentiert URLs, die Sie Suchmaschinen explizit als wichtig mitgeteilt haben. Diese sollten alle in Ihrer Weiterleitungsplanung enthalten sein.
Was Sitemaps offenbaren
| Sitemap-Element | Migrationsnutzen |
|---|---|
| URL-Liste | Seiten, die Sie als wichtig betrachten |
| Letzte Änderungsdaten | Kürzlich aktualisierte Inhalte |
| Prioritätswerte | Ihre Inhaltshierarchie |
| Änderungshäufigkeit | Inhaltsaktualisierungsmuster |
Sitemap-URLs extrahieren
Methode 1: Direkter Download
https://example.com/sitemap.xml
https://example.com/sitemap_index.xml
Methode 2: Screaming Frog
- Modus → Liste
- Upload → Sitemap herunterladen
- Sitemap-URL eingeben
- Crawlen, um URLs zu validieren
Methode 3: Search Console
- Sitemaps-Bericht zeigt eingereichte URLs
- Indexabdeckung zeigt, welche indexiert sind
Sitemap vs. Crawl-Vergleich
Vergleichen Sie Ihre Sitemap-URLs mit Crawl-Ergebnissen:
| Szenario | Bedeutung | Aktion |
|---|---|---|
| In Sitemap, im Crawl gefunden | Normal | In Weiterleitungen einbeziehen |
| In Sitemap, nicht im Crawl | Verwaiste Seite | Überprüfen, ob Seite existiert, einbeziehen |
| Im Crawl, nicht in Sitemap | Fehlt in Sitemap | In Weiterleitungen einbeziehen |
Wie exportiere ich URLs aus Google Search Console?
Google Search Console zeigt URLs, die Google entdeckt und indexiert hat, unabhängig davon, ob sie in Ihrem Crawl oder Ihrer Sitemap erscheinen.
URL-Daten exportieren
Aus Abdeckungsbericht:
- Navigieren Sie zu Indexierung → Seiten
- Klicken Sie auf jede Statuskategorie (Gültig, Ausgeschlossen usw.)
- Exportieren Sie die URL-Liste für jede Kategorie
Aus Leistungsbericht:
- Navigieren Sie zu Leistung
- Klicken Sie auf den Tab Seiten
- Exportieren Sie, um URLs mit Impressionen/Klicks zu sehen
Zu exportierende Abdeckungskategorien
| Kategorie | Warum sie wichtig ist |
|---|---|
| Gültig (Indexiert) | URLs, die in Suchergebnissen erscheinen |
| Gültig mit Warnungen | Indexiert, aber mit Problemen |
| Ausgeschlossen - Gecrawlt, nicht indexiert | Google gefunden, aber nicht indexiert |
| Ausgeschlossen - Entdeckt, nicht indexiert | Google weiß davon, hat aber nicht gecrawlt |
| Ausgeschlossen - Weiterleitung | URLs, die Google als weiterleitend sieht |
Wert der Leistungsdaten
URLs mit Sucheindrücken oder Klicks sind nachweislich wertvoll:
- Benutzer finden sie über die Suche
- Google hält sie für relevant für Suchanfragen
- Der Verlust dieser URLs bedeutet Trafficverlust
Exportieren Sie die Daten der letzten 16 Monate für das vollständigste Bild.
Empfohlenes Tool: SEOGets
Für eine leistungsfähigere Möglichkeit, mit Search Console-Daten zu arbeiten, sollten Sie SEOGets in Betracht ziehen. Ihr Indexierungsbericht bietet eine anspruchsvollere Ansicht Ihrer indexierten Seiten als die native Search Console-Oberfläche und erleichtert das Identifizieren und Exportieren der URLs, die Sie für die Weiterleitungsplanung benötigen.

Wie sammle ich URLs aus Analytics?
Analysedaten zeigen, welche URLs tatsächlich Besuchertraffic erhalten. Dies sind Ihre Weiterleitungskandidaten mit höchster Priorität.
Exportieren aus Google Analytics (GA4)
- Navigieren Sie zu Berichte → Engagement → Seiten und Bildschirme
- Setzen Sie den Datumsbereich auf letzte 12-16 Monate
- Exportieren Sie den vollständigen Seitenpfad-Bericht
Zu erfassende Schlüsselmetriken
| Metrik | Prioritätsindikator |
|---|---|
| Sitzungen | Gesamttraffic-Volumen |
| Nutzer | Anzahl eindeutiger Besucher |
| Interaktionsrate | Signal für Inhaltsqualität |
| Conversions | Geschäftswert |
Prioritätsstufen erstellen
Segmentieren Sie URLs nach Traffic-Volumen:
| Monatliche Sitzungen | Priorität | Weiterleitungsbehandlung |
|---|---|---|
| 1.000+ | Kritisch | Muss weitergeleitet werden, Ziel überprüfen |
| 100-999 | Hoch | Muss weitergeleitet werden |
| 10-99 | Mittel | Sollte weitergeleitet werden |
| 1-9 | Niedrig | Weiterleiten, wenn praktikabel |
| 0 | Am niedrigsten | Nur weiterleiten, wenn Backlinks vorhanden sind |
Landingpages nicht vergessen
Filtern Sie nach Seiten, auf denen Benutzer Ihre Website betreten:
- Diese sind oft extern verlinkt oder als Lesezeichen gespeichert
- Der Verlust von Landingpages hat überproportionale Auswirkungen auf den Traffic
- Priorisieren Sie Weiterleitungen für Top-Landingpages
Wo finde ich vorhandene 301-Weiterleitungstabellen?
Bevor Sie neue Weiterleitungen erstellen, müssen Sie wissen, welche Weiterleitungen bereits existieren. Das Ignorieren vorhandener Weiterleitungen erzeugt Ketten, die SEO und Leistung beeinträchtigen.
Häufige Weiterleitungsquellen
| Quelle | Wo zu finden | Exportmethode |
|---|---|---|
| CMS-Weiterleitungs-Admin | WordPress, Shopify usw. Admin-Panel | Integrierter Export oder Datenbankabfrage |
| Weiterleitungs-Plugins | Yoast, Redirection, Rank Math | Plugin-Einstellungen → Export |
| Edge-Services | Cloudflare, Fastly, Netlify | Dashboard → Regeln → Export |
| Netzwerkplattformen | Load Balancer, CDNs | Konfigurationsdateien |
| Server-Konfiguration | .htaccess, nginx.conf | Direkter Dateizugriff |
CMS-spezifische Standorte
WordPress:
- Redirection-Plugin: Tools → Redirection → Export
- Yoast Premium: SEO → Redirects → Export
- Datenbank:
wp_redirection_items-Tabelle
Shopify:
- Admin → Content → URL Redirects → Export
Webflow:
- Site Settings → Publishing → 301 Redirects
Was zu dokumentieren ist
Erfassen Sie für jede vorhandene Weiterleitung:
| Feld | Beispiel |
|---|---|
| Quell-URL | /old-page |
| Ziel-URL | /new-page |
| Weiterleitungstyp | 301 oder 302 |
| Standort | Plugin, .htaccess, CDN |
| Erstellungsdatum | 2024-03-15 |