Metti in ordine le tue CARS & BS prima di migrare.

Questo semplice acronimo copre le sei fonti di dati essenziali per costruire una lista URL completa:

  • Crawl (Scansione)
  • Analytics
  • Redirects esistenti
  • Sitemap
  • Backlinks
  • Search Console

Raccogli da tutte e sei, e non perderai nessun URL che conta.

Attività di Raccolta URL Scopo
Effettuare il crawling del dominio per URL HTML Scoprire tutte le pagine attive
Categorizzare per codice di stato Identificare le esigenze di redirect
Raccogliere URL con backlink Preservare l’equity SEO
Effettuare il crawling della sitemap XML Catturare le pagine dichiarate importanti
Esportare dati da Search Console Trovare gli URL indicizzati
Raccogliere URL da analytics Identificare le pagine che generano traffico
Verificare le tabelle di redirect esistenti Prevenire catene di redirect
Unificare tutti i dataset Creare una lista completa di redirect

Quali Dataset Dovrei Utilizzare per Compilare Liste URL Complete?

Best Practice

Una migrazione di successo richiede la raccolta di URL da più fonti per garantire che nessuna pagina importante venga persa. Affidarsi a una singola fonte lascerà lacune nella copertura dei redirect.

Fonti di Dati Essenziali

Fonte Cosa Cattura
Crawling del Dominio Tutti gli URL HTML rilevabili
Sitemap XML URL che hai dichiarato importanti
Google Search Console URL di cui Google è a conoscenza
Analytics URL con traffico effettivo
Strumenti per Backlink URL con link esterni
Tabelle di Redirect Esistenti Mappature di redirect attuali

L’Approccio Multi-Fonte

Ogni fonte cattura URL che le altre potrebbero perdere:

  • I crawler perdono le pagine orfane non collegate internamente
  • Le sitemap potrebbero essere obsolete o incomplete
  • Search Console mostra solo gli URL indicizzati
  • Analytics perde le pagine con traffico zero
  • Gli strumenti per backlink si concentrano sulle pagine linkate esternamente
Raccogli da tutte le fonti disponibili, quindi deduplica. È molto meglio avere dati ridondanti che perdere un URL di alto valore che perde traffico o equity SEO dopo la migrazione.

Come Effettuo il Crawling del Dominio per Raccogliere URL HTML?

Primo Passo Critico

Inizia effettuando il crawling dell’intero dominio utilizzando uno strumento come Screaming Frog, Sitebulb o crawler web simili. Questo scopre tutte le pagine HTML collegate all’interno della struttura del tuo sito.

Configurazione del Crawling

Impostazioni consigliate:

  • Profondità di crawling: Illimitata (o abbastanza alta da raggiungere tutte le pagine)
  • Rispetta robots.txt: Disabilita per scopi di migrazione (hai bisogno di TUTTI gli URL)
  • Segui i link interni: Abilitato
  • Effettua crawling fuori dalla cartella iniziale: Disabilitato (rimani sul tuo dominio)
  • Memorizza HTML: Opzionale ma utile per il confronto dei contenuti

Cosa Estrarre

Esporta quanto segue dal tuo crawling:

URL Address
Status Code
Indexability
Canonical URL
Meta Robots
Title

Suggerimenti per Gestire Siti di Grandi Dimensioni

Per siti con oltre 100.000 URL:

  1. Segmenta per sottodirectory: Effettua il crawling di /blog/, /products/, /pages/ separatamente
  2. Usa la modalità lista: Inserisci URL noti direttamente invece di scoprirli
  3. Aumenta l’allocazione di memoria: Screaming Frog potrebbe aver bisogno di 8GB+ di RAM
  4. Esegui durante la notte: I crawling di grandi dimensioni possono richiedere ore
⚠️ Effettua il Crawling del Sito Live
Effettua sempre il crawling del tuo sito di produzione attuale prima che inizi la migrazione. Effettuare il crawling di un ambiente di staging o sviluppo perderà gli URL che esistono solo in produzione.
Esegui il crawling almeno due volte: una all'inizio della pianificazione della migrazione e una immediatamente prima del lancio. Gli URL cambiano durante lo sviluppo e hai bisogno dei dati più aggiornati.

Come Dovrei Categorizzare gli URL per Codice di Stato?

Organizzazione Essenziale

Dopo il crawling, categorizza tutti gli URL scoperti in base al loro codice di stato HTTP. Ogni categoria richiede una gestione diversa nella tua strategia di redirect.

Categorie di Codici di Stato

URL 200 OK: La tua lista principale di sorgenti per redirect

Sottocategoria Descrizione Azione
Indicizzabile Può apparire nei risultati di ricerca Redirect ad alta priorità
Non Indicizzabile Bloccato dall’indicizzazione Valuta la necessità di redirect
Canonicalizzato Punta a un altro URL Reindirizza alla destinazione canonica
NoIndex Tag meta noindex presente Redirect a bassa priorità
Parametri UTM URL di tracciamento marketing Solitamente escludi dai redirect
Parametri di Filtro URL di navigazione sfaccettata Solitamente escludi dai redirect

URL Redirect 301/302: Già in redirect

  • Documenta le destinazioni di redirect esistenti
  • Assicurati che i nuovi redirect puntino alle destinazioni finali
  • Evita di creare catene di redirect

URL 404 Non Trovato: Rotti ma potenzialmente importanti

  • Verifica la presenza di backlink che puntano a questi URL
  • Rivedi Search Console per 404 indicizzati
  • Potrebbero necessitare di redirect se hanno valore SEO
Crea schede separate nei fogli di calcolo o file diversi per ogni categoria di codice di stato. Questo rende più facile applicare diverse strategie di redirect a ciascun gruppo.

Dovrei Includere URL con Codici di Stato Diversi da 200?

Sì: Critico per una Copertura Completa

Molti progetti di migrazione si concentrano solo sulle pagine con stato 200, ma gli URL 301/302 e 404 sono ugualmente importanti per mantenere l’equity SEO e l’esperienza utente.

Perché gli URL 301/302 Contano

I redirect esistenti rappresentano URL che una volta avevano valore:

  • I siti esterni potrebbero ancora linkare agli URL vecchi
  • I motori di ricerca potrebbero avere gli URL vecchi indicizzati
  • Gli utenti potrebbero aver salvato gli URL vecchi nei preferiti

Se ignori i redirect esistenti:

Vecchio URL → Redirect Attuale → Nuovo Sito (rotto)

Con una gestione corretta:

Vecchio URL → Nuovo Sito (diretto)

Perché gli URL 404 Contano

Uno stato 404 non significa che un URL sia inutile:

Scenario 404 Necessità di Redirect
Ha backlink da siti esterni Sì: preserva l’equity dei link
Appare in Search Console Sì: Google lo conosce
Mostra traffico in analytics Sì: gli utenti lo cercano
Contenuto cancellato di recente Forse: valuta la rilevanza
Mai avuto traffico o link No: sicuro da ignorare

Raccogliere Dati sui 404

Esporta i 404 da:

  • Risultati del crawling di Screaming Frog
  • Report di copertura di Google Search Console
  • Log di accesso al server
  • Analytics (pagine con zero visualizzazioni ma sessioni)
⚠️ Non Reindirizzare Tutto
Non tutti i 404 necessitano di un redirect. Concentrati sui 404 che hanno backlink, impressioni di ricerca o rappresentano contenuti che si sono spostati piuttosto che contenuti intenzionalmente rimossi.
Incrocia la tua lista di 404 con i dati di Ahrefs o Search Console. Dai priorità ai redirect per gli URL 404 che hanno backlink esterni o impressioni di ricerca recenti.

Quali Variazioni di URL Dovrei Considerare?

Trabocchetto Comune nelle Migrazioni

La stessa pagina può essere accessibile tramite più variazioni di URL. Perdere qualsiasi variazione significa link rotti e traffico perso.

Variazioni di URL Critiche

Tipo di Variazione Esempio A Esempio B
www vs non-www www.example.com/page example.com/page
Trailing slash /products/ /products
Maiuscole/Minuscole /Products/Widget /products/widget
Codifica URL /search?q=hello%20world /search?q=hello world
Protocollo https:// http://
File index /folder/index.html /folder/

Come le Variazioni Causano Problemi

I link esterni e i preferiti possono utilizzare qualsiasi variazione:

Il backlink usa: example.com/Blog/Post-Title
Il tuo redirect: www.example.com/blog/post-title

Risultato: errore 404, redirect non corrispondente

Raccogliere Tutte le Variazioni

  1. Controlla i report sui backlink: I siti esterni usano formati incoerenti
  2. Rivedi i log del server: Vedi gli URL effettivamente richiesti
  3. Testa manualmente: Prova variazioni comuni di pagine importanti
  4. Search Console: Mostra le variazioni di URL che Google ha incontrato

Strategia di Standardizzazione

Decidi il tuo formato canonico, quindi reindirizza tutte le variazioni:

Percorso Vecchio Reindirizza a
/Products/ /products
/PRODUCTS/ /products
/products /products
/Products /products
Usa la corrispondenza case-insensitive se la tua piattaforma lo supporta. Altrimenti, genera redirect per tutte le variazioni di maiuscole/minuscole note degli URL ad alto traffico.
Preserva l'Equity SEO

Gli URL con backlink esterni portano valore SEO che si trasferisce attraverso i redirect 301. Gli strumenti di analisi dei backlink rivelano quali URL hanno questa equity.

Strumento Caratteristica Chiave
Ahrefs Site Explorer → Best by Links
Semrush Backlink Analytics → Indexed Pages

Processo di Esportazione (Passaggi Generali)

  1. Inserisci il tuo dominio nella funzione di analisi del sito dello strumento
  2. Vai al report di pagine o URL (mostra quali pagine ricevono backlink)
  3. Esporta la lista completa di pagine con backlink
  4. Filtra solo gli URL del tuo dominio

Punti Dati Chiave da Catturare

Punto Dati Scopo
URL di Destinazione L’URL che riceve backlink
Domini Referenti Numero di siti unici che linkano
Backlink Totali Conteggio complessivo dei link
Punteggio di Qualità del Link Indicatore di autorità (varia per strumento)

Framework di Prioritizzazione

Non tutti gli URL con backlink sono uguali:

Domini Referenti Priorità Azione
50+ Critica Deve essere reindirizzato
10-49 Alta Dovrebbe essere reindirizzato
2-9 Media Reindirizza se pratico
1 Bassa Valuta individualmente

La maggior parte degli strumenti per backlink mostra i link che puntano a URL che restituiscono 404:

  1. Cerca un filtro per codice di stato o report backlink rotti
  2. Filtra per mostrare solo URL 404
  3. Esporta questi URL (necessitano di redirect nonostante siano rotti)
⚠️ Backlink a Pagine Non Esistenti
I siti esterni spesso linkano a URL che non esistono più sul tuo sito. Questi URL 404 con backlink dovrebbero essere reindirizzati alla pagina esistente più rilevante per catturare l'equity del link.
Esporta i dati sui backlink mensilmente durante la pianificazione della migrazione. Nuovi backlink appaiono regolarmente e vuoi catturarli tutti prima del lancio.

Perché Dovrei Effettuare il Crawling della Sitemap XML?

Cattura gli URL Dichiarati Importanti

La tua sitemap XML rappresenta gli URL che hai esplicitamente comunicato ai motori di ricerca come importanti. Questi dovrebbero essere tutti inclusi nella pianificazione dei redirect.

Cosa Rivelano le Sitemap

Elemento Sitemap Uso per la Migrazione
Lista URL Pagine che consideri importanti
Date di ultima modifica Contenuti aggiornati di recente
Valori di priorità La tua gerarchia dei contenuti
Frequenza di modifica Pattern di aggiornamento dei contenuti

Estrarre gli URL dalla Sitemap

Metodo 1: Download diretto

https://example.com/sitemap.xml
https://example.com/sitemap_index.xml

Metodo 2: Screaming Frog

  1. Mode → List
  2. Upload → Download Sitemap
  3. Inserisci l’URL della sitemap
  4. Effettua il crawling per validare gli URL

Metodo 3: Search Console

  • Il report Sitemap mostra gli URL inviati
  • La copertura dell’indice mostra quali sono indicizzati

Confronto Sitemap vs Crawling

Confronta gli URL della sitemap con i risultati del crawling:

Scenario Significato Azione
Nella sitemap, trovato nel crawling Normale Includi nei redirect
Nella sitemap, non nel crawling Pagina orfana Verifica che la pagina esista, includi
Nel crawling, non nella sitemap Mancante dalla sitemap Includi nei redirect
Se la tua sitemap è generata automaticamente dal tuo CMS, potrebbe essere più aggiornata di un crawling. Raccogli sempre entrambi e deduplica.

Come Esporto gli URL da Google Search Console?

Trova Cosa Google Conosce

Google Search Console rivela gli URL che Google ha scoperto e indicizzato, indipendentemente dal fatto che appaiano nel tuo crawling o sitemap.

Esportare Dati URL

Dal Report di Copertura:

  1. Vai a Indicizzazione → Pagine
  2. Clicca su ogni categoria di stato (Valido, Escluso, ecc.)
  3. Esporta la lista URL per ogni categoria

Dal Report delle Prestazioni:

  1. Vai a Prestazioni
  2. Clicca sulla scheda Pagine
  3. Esporta per vedere gli URL con impressioni/clic

Categorie di Copertura da Esportare

Categoria Perché È Importante
Valido (Indicizzato) URL che appaiono nei risultati di ricerca
Valido con avvisi Indicizzato ma con problemi
Escluso - Scansionato ma non indicizzato Google ha trovato ma non indicizzato
Escluso - Scoperto ma non indicizzato Google conosce ma non ha scansionato
Escluso - Redirect URL che Google vede come redirect

Valore dei Dati sulle Prestazioni

Gli URL con impressioni o clic di ricerca sono comprovati come preziosi:

  • Gli utenti li trovano tramite ricerca
  • Google li considera rilevanti per le query
  • Perdere questi URL significa perdere traffico

Esporta gli ultimi 16 mesi di dati per il quadro più completo.

⚠️ Limiti URL di Search Console
Le esportazioni di Search Console sono limitate a 1.000 righe nell'interfaccia. Usa l'API di Search Console o l'esportazione dati in blocco di Google (BigQuery) per dati completi su siti di grandi dimensioni.
Presta particolare attenzione alla categoria "Escluso - Redirect". Questi mostrano redirect che Google ha già rilevato. Assicurati che siano considerati nel tuo nuovo piano di redirect.

Strumento Consigliato: SEOGets

Per un modo più potente di lavorare con i dati di Search Console, considera l’utilizzo di SEOGets. Il loro report di indicizzazione fornisce una vista più sofisticata delle tue pagine indicizzate rispetto all’interfaccia nativa di Search Console, rendendo più facile identificare ed esportare gli URL necessari per la pianificazione dei redirect.

SEOGets Indexing Report

Come Raccolgo gli URL da Analytics?

Identifica le Pagine che Generano Traffico

I dati di analytics mostrano quali URL ricevono effettivamente traffico di visitatori. Questi sono i tuoi candidati redirect con la massima priorità.

Esportare da Google Analytics (GA4)

  1. Vai a Report → Coinvolgimento → Pagine e schermate
  2. Imposta l’intervallo di date sugli ultimi 12-16 mesi
  3. Esporta il report completo del percorso delle pagine

Metriche Chiave da Catturare

Metrica Indicatore di Priorità
Sessioni Volume complessivo di traffico
Utenti Conteggio visitatori unici
Tasso di coinvolgimento Segnale di qualità del contenuto
Conversioni Valore aziendale

Creare Livelli di Priorità

Segmenta gli URL per volume di traffico:

Sessioni Mensili Priorità Trattamento Redirect
1.000+ Critica Deve essere reindirizzato, verifica destinazione
100-999 Alta Deve essere reindirizzato
10-99 Media Dovrebbe essere reindirizzato
1-9 Bassa Reindirizza se pratico
0 Più Bassa Reindirizza solo se esistono backlink

Non Dimenticare le Landing Page

Filtra per pagine dove gli utenti entrano nel tuo sito:

  • Queste sono spesso linkate esternamente o salvate nei preferiti
  • Perdere le landing page ha un impatto sproporzionato sul traffico
  • Dai priorità ai redirect per le principali landing page
Confronta gli URL di analytics con il tuo crawling. Le pagine con traffico che non sono state trovate nel crawling potrebbero essere contenuti orfani che necessitano comunque di redirect.

Dove Trovo le Tabelle di Redirect 301 Esistenti?

Previeni Catene di Redirect

Prima di creare nuovi redirect, devi sapere quali redirect esistono già. Ignorare i redirect esistenti crea catene che danneggiano SEO e prestazioni.

Fonti Comuni di Redirect

Fonte Dove Trovare Metodo di Esportazione
Admin CMS per Redirect Pannello admin di WordPress, Shopify, ecc. Esportazione integrata o query database
Plugin per Redirect Yoast, Redirection, Rank Math Impostazioni plugin → Esporta
Servizi Edge Cloudflare, Fastly, Netlify Dashboard → Regole → Esporta
Piattaforme di Rete Load balancer, CDN File di configurazione
Configurazione Server .htaccess, nginx.conf Accesso diretto al file

Posizioni Specifiche per CMS

WordPress:

  • Plugin Redirection: Strumenti → Redirection → Esporta
  • Yoast Premium: SEO → Redirect → Esporta
  • Database: tabella wp_redirection_items

Shopify:

  • Admin → Contenuti → Redirect URL → Esporta

Webflow:

  • Impostazioni Sito → Pubblicazione → Redirect 301

Cosa Documentare

Per ogni redirect esistente, cattura:

Campo Esempio
URL di Origine /old-page
URL di Destinazione /new-page
Tipo di Redirect 301 o 302
Posizione Plugin, .htaccess, CDN
Data di Creazione 2024-03-15
⚠️ Fonti Multiple di Redirect
Molti siti hanno redirect configurati in più posti (CMS, plugin, server, CDN). Verifica TUTTE le fonti per ottenere un quadro completo. Perdere una fonte può causare comportamenti di redirect inaspettati.
Consolida tutti i redirect esistenti in un unico documento prima della migrazione. Questo diventa il tuo riferimento per cosa è già gestito e cosa potrebbe entrare in conflitto con i nuovi redirect.

Qual è un Modo Utile per Utilizzare i Dati delle Catene di Redirect?

Pulisci Prima della Migrazione

Le catene di redirect si verificano quando un redirect punta a un altro redirect, creando più salti. Questi danneggiano SEO e velocità della pagina. La migrazione è il momento perfetto per eliminarle.

Identificare le Catene di Redirect

In Screaming Frog:

  1. Effettua il crawling del tuo sito
  2. Filtra per Codice di Stato → 3xx
  3. Cerca redirect dove URL di Redirect è anche un redirect

Esempio di catena:

/page-a → 301 → /page-b → 301 → /page-c → 200

Questa è una catena a 2 salti che dovrebbe diventare:
/page-a → 301 → /page-c
/page-b → 301 → /page-c

Il Processo di Risoluzione delle Catene

  1. Mappa tutte le catene di redirect: Documenta ogni pattern A→B→C
  2. Identifica le destinazioni finali: Trova dove ogni catena porta in definitiva
  3. Aggiorna i redirect di origine: Punta direttamente alla destinazione finale
  4. Rimuovi redirect intermedi: Elimina i salti non necessari
  5. Verifica la risoluzione: Testa che le catene siano eliminate

Scenari Comuni di Catene

Scenario Prima Dopo
HTTP a HTTPS a pagina http→https→/new http→/new (se HTTPS forzato al server)
Vecchio redirect + nuovo redirect /old→/middle→/new /old→/new, /middle→/new
Catena normalizzazione WWW non-www→www→/page non-www→/page (www a livello DNS)
⚠️ Le Catene Sprecano Budget di Crawling
I bot dei motori di ricerca potrebbero non seguire catene di redirect lunghe, il che significa che le pagine alla fine delle catene potrebbero non essere scansionate o indicizzate correttamente. Google raccomanda un massimo di 2 salti.
Usa i dati della tua tabella di redirect esistenti per mappare tutte le catene prima di creare nuovi redirect. Aggiorna la tua lista principale di redirect in modo che ogni URL di origine punti direttamente alla sua destinazione finale sul nuovo sito.

Come Creo un Dataset URL Unificato?

Passo Finale Critico

Dopo aver raccolto gli URL da tutte le fonti, combinali in un unico dataset deduplicato. Questo diventa la tua lista principale di origini per i redirect.

Il Processo di Unificazione

Passo 1: Standardizza i formati

  • Rimuovi i protocolli (https://)
  • Rimuovi i domini (www.example.com)
  • Standardizza i trailing slash
  • Converti in minuscolo (se il tuo sito è case-insensitive)

Passo 2: Valida attraverso Screaming Frog

Esegui ogni lista URL attraverso Screaming Frog in Modalità Lista:

  1. Mode → List
  2. Carica la tua lista URL
  3. Avvia il crawling per validare ogni URL
  4. Esporta i risultati con i codici di stato

Questo conferma lo stato attuale di ogni URL da tutte le fonti.

Passo 3: Combina e deduplica

Fonte A: 5.000 URL
Fonte B: 3.500 URL
Fonte C: 8.200 URL
Fonte D: 2.100 URL
─────────────────────
Combinati: 18.800 URL
Dopo dedup: 12.400 URL unici

Passo 4: Arricchisci con metadati

Aggiungi colonne da ogni fonte:

URL Stato Backlink Sessioni Nella Sitemap Ha Redirect
/page-a 200 45 1.200 No
/page-b 404 12 0 No No
/page-c 301 8 340
Mantieni il tuo dataset unificato in un foglio di calcolo o database con controllo versione. Lo consulterai e aggiornerai durante tutto il processo di migrazione.

Pronto a Mappare i Tuoi URL?

Una volta raccolti gli URL da tutte le fonti e creato il tuo dataset unificato, il passo successivo è mappare i vecchi URL alle nuove destinazioni. Se hai già lavorato con i redirect in passato, sai che questa è tradizionalmente la parte più dispendiosa in termini di tempo del lavoro sui redirect, ma non deve esserlo.

Redirects.net utilizza algoritmi di corrispondenza intelligenti per mappare automaticamente i tuoi vecchi URL alle migliori destinazioni sul tuo nuovo sito. Carica la tua lista URL unificata e ottieni redirect mappati pronti per l’implementazione.

Prova Redirects.net Gratis →