Mettez de l’ordre dans vos CARS & BS avant de migrer. 😂

Ce simple moyen mnémotechnique couvre les six sources de données essentielles pour créer une liste d’URLs complète :

  • Crawl (Exploration)
  • Analytics (Analyse)
  • Redirects (Redirections existantes)
  • Sitemap
  • Backlinks
  • Search Console

Collectez à partir de ces six sources, et vous ne manquerez aucune URL importante.

Tâche de Collecte d’URLs Objectif
Explorer le domaine pour les URLs HTML Découvrir toutes les pages actives
Catégoriser par code de statut Identifier les besoins de redirection
Collecter les URLs avec backlinks Préserver le capital SEO
Explorer le sitemap XML Capturer les pages déclarées importantes
Exporter les données Search Console Trouver les URLs indexées
Collecter les URLs d’analyse Identifier les pages générant du trafic
Auditer les tables de redirection existantes Prévenir les chaînes de redirection
Unifier tous les jeux de données Créer une liste de redirections complète

Quelles Sources de Données Dois-je Utiliser pour Compiler des Listes d’URLs Complètes ?

Bonne Pratique

Une migration de site réussie nécessite de collecter des URLs à partir de plusieurs sources pour garantir qu’aucune page importante ne soit oubliée. Se fier à une seule source laissera des lacunes dans votre couverture de redirection.

Sources de Données Essentielles

Source Ce qu’Elle Capture
Crawl du Domaine Toutes les URLs HTML découvrables
Sitemap XML URLs que vous avez déclarées importantes
Google Search Console URLs connues de Google
Analytics URLs avec du trafic réel
Outils de Backlinks URLs avec des liens externes
Tables de Redirection Existantes Cartographies de redirection actuelles

L’Approche Multi-Sources

Chaque source capture des URLs que les autres pourraient manquer :

  • Les crawlers manquent les pages orphelines non liées en interne
  • Les sitemaps peuvent être obsolètes ou incomplets
  • Search Console ne montre que les URLs indexées
  • Analytics manque les pages sans trafic
  • Les outils de backlinks se concentrent sur les pages liées en externe
Collectez à partir de toutes les sources disponibles, puis dédupliquez. Il vaut bien mieux avoir des données redondantes que de manquer une URL à haute valeur qui perd du trafic ou du capital SEO après la migration.

Comment Explorer le Domaine pour Collecter les URLs HTML ?

Première Étape Critique

Commencez par explorer l’intégralité de votre domaine à l’aide d’un outil comme Screaming Frog, Sitebulb ou des crawlers web similaires. Cela permet de découvrir toutes les pages HTML liées dans la structure de votre site.

Configuration de l’Exploration

Paramètres recommandés :

  • Profondeur d’exploration : Illimitée (ou suffisamment élevée pour atteindre toutes les pages)
  • Respecter robots.txt : Désactiver pour les besoins de migration (vous avez besoin de TOUTES les URLs)
  • Suivre les liens internes : Activé
  • Explorer hors du dossier de départ : Désactivé (rester sur votre domaine)
  • Stocker le HTML : Optionnel mais utile pour la comparaison de contenu

Quoi Extraire

Exportez les éléments suivants depuis votre exploration :

Adresse URL
Code de Statut
Indexabilité
URL Canonique
Meta Robots
Titre

Conseils pour Gérer les Grands Sites

Pour les sites avec plus de 100 000 URLs :

  1. Segmenter par sous-répertoire : Explorer /blog/, /products/, /pages/ séparément
  2. Utiliser le mode liste : Alimenter directement les URLs connues au lieu de les découvrir
  3. Augmenter l’allocation mémoire : Screaming Frog peut nécessiter 8 Go+ de RAM
  4. Exécuter pendant la nuit : Les grandes explorations peuvent prendre des heures
⚠️ Explorez le Site en Production
Explorez toujours votre site de production actuel avant le début de la migration. Explorer un environnement de staging ou de développement manquera les URLs qui n'existent qu'en production.
Exécutez votre exploration au moins deux fois : une fois au début de la planification de migration et une fois juste avant le lancement. Les URLs changent pendant le développement, et vous avez besoin des données les plus récentes.

Comment Catégoriser les URLs par Code de Statut ?

Organisation Essentielle

Après l’exploration, catégorisez toutes les URLs découvertes selon leur code de statut HTTP. Chaque catégorie nécessite une gestion différente dans votre stratégie de redirection.

Catégories de Codes de Statut

URLs 200 OK : Votre liste source principale de redirections

Sous-catégorie Description Action
Indexable Peut apparaître dans les résultats de recherche Redirections prioritaires
Non-Indexable Bloqué de l’indexation Évaluer le besoin de redirection
Canonicalisé Pointe vers une autre URL Rediriger vers la cible canonique
NoIndex Balise meta noindex présente Redirections de priorité inférieure
Paramètres UTM URLs de suivi marketing Généralement exclure des redirections
Paramètres de Filtre URLs de navigation à facettes Généralement exclure des redirections

URLs de Redirection 301/302 : Déjà en redirection

  • Documenter les destinations de redirection existantes
  • S’assurer que les nouvelles redirections pointent vers les destinations finales
  • Éviter de créer des chaînes de redirection

URLs 404 Non Trouvé : Cassées mais potentiellement importantes

  • Vérifier les backlinks pointant vers ces URLs
  • Examiner Search Console pour les 404 indexées
  • Peuvent nécessiter des redirections si elles ont une valeur SEO
Créez des onglets ou fichiers de feuille de calcul séparés pour chaque catégorie de code de statut. Cela facilite l'application de différentes stratégies de redirection à chaque groupe.

Dois-je Inclure les URLs avec des Codes de Statut Autres que 200 ?

Oui : Critique pour une Couverture Complète

De nombreux projets de migration se concentrent uniquement sur les pages avec statut 200, mais les URLs 301/302 et 404 sont tout aussi importantes pour maintenir le capital SEO et l’expérience utilisateur.

Pourquoi les URLs 301/302 Importent

Les redirections existantes représentent des URLs qui avaient autrefois de la valeur :

  • Des sites externes peuvent encore lier vers les anciennes URLs
  • Les moteurs de recherche peuvent avoir les anciennes URLs indexées
  • Les utilisateurs peuvent avoir mis en favoris les anciennes URLs

Si vous ignorez les redirections existantes :

Ancienne URL → Redirection Actuelle → Nouveau Site (cassé)

Avec une gestion appropriée :

Ancienne URL → Nouveau Site (direct)

Pourquoi les URLs 404 Importent

Un statut 404 ne signifie pas qu’une URL est sans valeur :

Scénario 404 Besoin de Redirection
A des backlinks de sites externes Oui : préserver le capital de lien
Apparaît dans Search Console Oui : Google en a connaissance
Montre du trafic dans analytics Oui : les utilisateurs la recherchent
Contenu récemment supprimé Peut-être : évaluer la pertinence
N’a jamais eu de trafic ou de liens Non : sûr d’ignorer

Collecte des Données 404

Exportez les 404 depuis :

  • Résultats d’exploration Screaming Frog
  • Rapport de couverture Google Search Console
  • Logs d’accès serveur
  • Analytics (pages avec zéro pages vues mais des sessions)
⚠️ Ne Redirigez Pas Tout
Tous les 404 ne nécessitent pas une redirection. Concentrez-vous sur les 404 qui ont des backlinks, des impressions de recherche, ou représentent du contenu qui a été déplacé plutôt que du contenu intentionnellement supprimé.
Croisez votre liste de 404 avec les données Ahrefs ou Search Console. Priorisez les redirections pour les URLs 404 qui ont des backlinks externes ou des impressions de recherche récentes.

Quelles Variations d’URLs Dois-je Prendre en Compte ?

Piège Courant de Migration

La même page peut être accessible via plusieurs variations d’URLs. Manquer une variation signifie des liens cassés et du trafic perdu.

Variations d’URLs Critiques

Type de Variation Exemple A Exemple B
www vs non-www www.example.com/page example.com/page
Barre oblique finale /products/ /products
Capitalisation /Products/Widget /products/widget
Encodage URL /search?q=hello%20world /search?q=hello world
Protocole https:// http://
Fichiers index /folder/index.html /folder/

Comment les Variations Causent des Problèmes

Les liens externes et favoris peuvent utiliser n’importe quelle variation :

Le backlink utilise : example.com/Blog/Post-Title
Votre redirection : www.example.com/blog/post-title

Résultat : erreur 404, redirection non correspondante

Collecte de Toutes les Variations

  1. Vérifiez les rapports de backlinks : Les sites externes utilisent des formats incohérents
  2. Examinez les logs serveur : Voyez les URLs réellement demandées
  3. Testez manuellement : Essayez les variations courantes des pages importantes
  4. Search Console : Montre les variations d’URLs rencontrées par Google

Stratégie de Standardisation

Décidez de votre format canonique, puis redirigez toutes les variations :

Ancien Chemin Rediriger Vers
/Products/ /products
/PRODUCTS/ /products
/products /products
/Products /products
Utilisez une correspondance insensible à la casse si votre plateforme le prend en charge. Sinon, générez des redirections pour toutes les variations de casse connues des URLs à fort trafic.
Préserver le Capital SEO

Les URLs avec des backlinks externes portent une valeur SEO qui se transfère via les redirections 301. Les outils d’analyse de backlinks révèlent quelles URLs ont ce capital.

Outil Fonctionnalité Clé
Ahrefs Site Explorer → Best by Links
Semrush Backlink Analytics → Indexed Pages

Processus d’Exportation (Étapes Générales)

  1. Entrez votre domaine dans la fonction d’analyse de site de l’outil
  2. Naviguez vers le rapport de pages ou URLs (montre quelles pages reçoivent des backlinks)
  3. Exportez la liste complète des pages avec backlinks
  4. Filtrez pour les URLs de votre domaine uniquement

Points de Données Clés à Capturer

Point de Données Objectif
URL Cible L’URL recevant des backlinks
Domaines Référents Nombre de sites uniques liant
Total Backlinks Nombre total de liens
Score de Qualité du Lien Indicateur d’autorité (varie selon l’outil)

Cadre de Priorisation

Toutes les URLs avec backlinks ne sont pas égales :

Domaines Référents Priorité Action
50+ Critique Doit rediriger
10-49 Élevée Devrait rediriger
2-9 Moyenne Rediriger si pratique
1 Faible Évaluer individuellement

La plupart des outils de backlinks montrent les liens pointant vers des URLs qui retournent 404 :

  1. Recherchez un filtre de code de statut ou un rapport de backlinks cassés
  2. Filtrez pour montrer uniquement les URLs 404
  3. Exportez ces URLs (elles nécessitent des redirections malgré qu’elles soient cassées)
⚠️ Backlinks vers des Pages Inexistantes
Les sites externes lient souvent vers des URLs qui n'existent plus sur votre site. Ces URLs 404 avec backlinks devraient être redirigées vers la page existante la plus pertinente pour capturer le capital de lien.
Exportez les données de backlinks mensuellement pendant la planification de migration. De nouveaux backlinks apparaissent régulièrement, et vous voulez tous les capturer avant le lancement.

Pourquoi Devrais-je Explorer le Sitemap XML ?

Capturer les URLs Déclarées Importantes

Votre sitemap XML représente les URLs que vous avez explicitement indiquées aux moteurs de recherche comme importantes. Toutes devraient être incluses dans votre planification de redirection.

Ce que les Sitemaps Révèlent

Élément du Sitemap Utilisation pour la Migration
Liste d’URLs Pages que vous considérez importantes
Dates de dernière modification Contenu récemment mis à jour
Valeurs de priorité Votre hiérarchie de contenu
Fréquence de changement Modèles de mise à jour du contenu

Extraction des URLs du Sitemap

Méthode 1 : Téléchargement direct

https://example.com/sitemap.xml
https://example.com/sitemap_index.xml

Méthode 2 : Screaming Frog

  1. Mode → Liste
  2. Upload → Download Sitemap
  3. Entrez l’URL du sitemap
  4. Explorez pour valider les URLs

Méthode 3 : Search Console

  • Le rapport Sitemaps montre les URLs soumises
  • La couverture d’index montre lesquelles sont indexées

Comparaison Sitemap vs Exploration

Comparez vos URLs de sitemap avec les résultats d’exploration :

Scénario Signification Action
Dans sitemap, trouvée dans exploration Normal Inclure dans redirections
Dans sitemap, pas dans exploration Page orpheline Vérifier que la page existe, inclure
Dans exploration, pas dans sitemap Manquante du sitemap Inclure dans redirections
Si votre sitemap est auto-généré par votre CMS, il peut être plus à jour qu'une exploration. Collectez toujours les deux et dédupliquez.

Comment Exporter les URLs depuis Google Search Console ?

Trouver ce que Google Connaît

Google Search Console révèle les URLs que Google a découvertes et indexées, qu’elles apparaissent ou non dans votre exploration ou sitemap.

Exportation des Données d’URLs

Depuis le Rapport de Couverture :

  1. Naviguez vers Indexation → Pages
  2. Cliquez sur chaque catégorie de statut (Valide, Exclue, etc.)
  3. Exportez la liste d’URLs pour chaque catégorie

Depuis le Rapport de Performance :

  1. Naviguez vers Performance
  2. Cliquez sur l’onglet Pages
  3. Exportez pour voir les URLs avec impressions/clics

Catégories de Couverture à Exporter

Catégorie Pourquoi C’est Important
Valide (Indexée) URLs apparaissant dans les résultats de recherche
Valide avec avertissements Indexée mais avec des problèmes
Exclue - Explorée non indexée Google a trouvé mais n’a pas indexé
Exclue - Découverte non indexée Google connaît mais n’a pas exploré
Exclue - Redirection URLs que Google voit comme redirigeant

Valeur des Données de Performance

Les URLs avec des impressions ou clics de recherche sont prouvées précieuses :

  • Les utilisateurs les trouvent via la recherche
  • Google les considère pertinentes pour des requêtes
  • Perdre ces URLs signifie perdre du trafic

Exportez les 16 derniers mois de données pour l’image la plus complète.

⚠️ Limites d'URLs de Search Console
Les exports Search Console sont limités à 1 000 lignes dans l'interface. Utilisez l'API Search Console ou l'Export de Données en Masse de Google (BigQuery) pour des données complètes sur les grands sites.
Portez une attention particulière à la catégorie "Exclue - Redirection". Celles-ci montrent les redirections que Google a déjà détectées. Assurez-vous qu'elles sont prises en compte dans votre nouveau plan de redirection.

Outil Recommandé : SEOGets

Pour une façon plus puissante de travailler avec les données Search Console, envisagez d’utiliser SEOGets. Leur rapport d’indexation fournit une vue plus sophistiquée de vos pages indexées que l’interface native de Search Console, facilitant l’identification et l’export des URLs dont vous avez besoin pour la planification des redirections.

Rapport d’Indexation SEOGets

Comment Collecter les URLs depuis Analytics ?

Identifier les Pages Générant du Trafic

Les données analytics montrent quelles URLs reçoivent réellement du trafic visiteur. Ce sont vos candidates de redirection les plus prioritaires.

Exportation depuis Google Analytics (GA4)

  1. Naviguez vers Rapports → Engagement → Pages et écrans
  2. Définissez la plage de dates aux 12-16 derniers mois
  3. Exportez le rapport complet de chemin de page

Métriques Clés à Capturer

Métrique Indicateur de Priorité
Sessions Volume de trafic global
Utilisateurs Nombre de visiteurs uniques
Taux d’engagement Signal de qualité du contenu
Conversions Valeur commerciale

Création de Niveaux de Priorité

Segmentez les URLs par volume de trafic :

Sessions Mensuelles Priorité Traitement de Redirection
1 000+ Critique Doit rediriger, vérifier destination
100-999 Élevée Doit rediriger
10-99 Moyenne Devrait rediriger
1-9 Faible Rediriger si pratique
0 Plus faible Rediriger uniquement si backlinks existent

N’Oubliez Pas les Pages de Destination

Filtrez pour les pages où les utilisateurs entrent sur votre site :

  • Celles-ci sont souvent liées en externe ou mises en favoris
  • Perdre les pages de destination a un impact disproportionné sur le trafic
  • Priorisez les redirections pour les principales pages de destination
Comparez les URLs analytics avec votre exploration. Les pages avec du trafic qui n'ont pas été trouvées dans l'exploration peuvent être du contenu orphelin qui nécessite quand même des redirections.

Où Trouver les Tables de Redirections 301 Existantes ?

Prévenir les Chaînes de Redirection

Avant de créer de nouvelles redirections, vous devez connaître quelles redirections existent déjà. Ignorer les redirections existantes crée des chaînes qui nuisent au SEO et aux performances.

Sources Courantes de Redirections

Source Où Trouver Méthode d’Export
Admin CMS Redirect WordPress, Shopify, etc. panneau d’admin Export intégré ou requête base de données
Plugins de Redirection Yoast, Redirection, Rank Math Paramètres plugin → Export
Services Edge Cloudflare, Fastly, Netlify Tableau de bord → Règles → Export
Plateformes Réseau Load balancers, CDNs Fichiers de configuration
Config Serveur .htaccess, nginx.conf Accès direct au fichier

Emplacements Spécifiques aux CMS

WordPress :

  • Plugin Redirection : Outils → Redirection → Export
  • Yoast Premium : SEO → Redirects → Export
  • Base de données : table wp_redirection_items

Shopify :

  • Admin → Contenu → Redirections d’URL → Export

Webflow :

  • Paramètres du Site → Publication → Redirections 301

Quoi Documenter

Pour chaque redirection existante, capturez :

Champ Exemple
URL Source /old-page
URL Destination /new-page
Type de Redirection 301 ou 302
Emplacement Plugin, .htaccess, CDN
Date de Création 2024-03-15
⚠️ Sources Multiples de Redirections
De nombreux sites ont des redirections configurées à plusieurs endroits (CMS, plugins, serveur, CDN). Auditez TOUTES les sources pour obtenir une image complète. Manquer une source peut causer un comportement de redirection inattendu.
Consolidez toutes les redirections existantes dans un seul document avant la migration. Cela devient votre référence pour ce qui est déjà géré et ce qui pourrait entrer en conflit avec les nouvelles redirections.

Quelle est une Façon Utile d’Utiliser les Données de Chaînes de Redirection ?

Nettoyer Avant la Migration

Les chaînes de redirection se produisent lorsqu’une redirection pointe vers une autre redirection, créant plusieurs sauts. Celles-ci nuisent au SEO et à la vitesse de page. La migration est le moment parfait pour les éliminer.

Identification des Chaînes de Redirection

Dans Screaming Frog :

  1. Explorez votre site
  2. Filtrez par Code de Statut → 3xx
  3. Recherchez les redirections où l’URL de Redirection est également une redirection

Exemple de chaîne :

/page-a → 301 → /page-b → 301 → /page-c → 200

C'est une chaîne à 2 sauts qui devrait devenir :
/page-a → 301 → /page-c
/page-b → 301 → /page-c

Le Processus de Résolution de Chaîne

  1. Cartographiez toutes les chaînes de redirection : Documentez chaque schéma A→B→C
  2. Identifiez les destinations finales : Trouvez où chaque chaîne mène finalement
  3. Mettez à jour les redirections sources : Pointez directement vers la destination finale
  4. Supprimez les redirections intermédiaires : Supprimez les sauts inutiles
  5. Vérifiez la résolution : Testez que les chaînes sont éliminées

Scénarios de Chaînes Courantes

Scénario Avant Après
HTTP vers HTTPS vers page http→https→/new http→/new (si HTTPS appliqué au serveur)
Ancienne redirection + nouvelle redirection /old→/middle→/new /old→/new, /middle→/new
Chaîne de normalisation WWW non-www→www→/page non-www→/page (www au niveau DNS)
⚠️ Les Chaînes Gaspillent le Budget de Crawl
Les robots des moteurs de recherche peuvent ne pas suivre les longues chaînes de redirection, ce qui signifie que les pages à la fin des chaînes pourraient ne pas être explorées ou indexées correctement. Google recommande un maximum de 2 sauts.
Utilisez vos données de table de redirection existantes pour cartographier toutes les chaînes avant de créer de nouvelles redirections. Mettez à jour votre liste maîtresse de redirections pour que chaque URL source pointe directement vers sa destination finale sur le nouveau site.

Comment Créer un Jeu de Données d’URLs Unifié ?

Étape Finale Critique

Après avoir collecté des URLs de toutes les sources, combinez-les en un seul jeu de données dédupliqué. Cela devient votre liste source maîtresse de redirections.

Le Processus d’Unification

Étape 1 : Standardiser les formats

  • Supprimer les protocoles (https://)
  • Supprimer les domaines (www.example.com)
  • Standardiser les barres obliques finales
  • Convertir en minuscules (si votre site est insensible à la casse)

Étape 2 : Valider via Screaming Frog

Exécutez chaque liste d’URLs via Screaming Frog en Mode Liste :

  1. Mode → Liste
  2. Uploadez votre liste d’URLs
  3. Démarrez l’exploration pour valider chaque URL
  4. Exportez les résultats avec les codes de statut

Cela confirme le statut actuel de chaque URL à travers toutes les sources.

Étape 3 : Combiner et dédupliquer

Source A : 5 000 URLs
Source B : 3 500 URLs
Source C : 8 200 URLs
Source D : 2 100 URLs
─────────────────────
Combiné : 18 800 URLs
Après dédup : 12 400 URLs uniques

Étape 4 : Enrichir avec des métadonnées

Ajoutez des colonnes de chaque source :

URL Statut Backlinks Sessions Dans Sitemap A Redirection
/page-a 200 45 1 200 Oui Non
/page-b 404 12 0 Non Non
/page-c 301 8 340 Oui Oui
Gardez votre jeu de données unifié dans une feuille de calcul ou base de données avec contrôle de version. Vous le référencerez et mettrez à jour tout au long du processus de migration.

Prêt à Cartographier Vos URLs ?

Une fois que vous avez collecté des URLs de toutes les sources et créé votre jeu de données unifié, l’étape suivante est la cartographie des anciennes URLs vers les nouvelles destinations. Si vous avez déjà fait du travail de redirection auparavant, vous savez que c’est traditionnellement la partie la plus chronophage du travail de redirection, mais cela ne doit pas l’être.

Redirects.net utilise des algorithmes de correspondance intelligents pour cartographier automatiquement vos anciennes URLs vers les meilleures destinations sur votre nouveau site. Uploadez votre liste d’URLs unifiée, et obtenez des redirections cartographiées prêtes pour l’implémentation.

Essayez Redirects.net Gratuitement →