Aturkan CARS & BS anda sebelum anda migrasi. πŸ˜‚

Mnemonik mudah ini merangkumi enam sumber data penting untuk membina senarai URL lengkap:

  • Crawl (Rangkak)
  • Analytics (Analitik)
  • Redirects (Redirect sedia ada)
  • Sitemap (Peta laman)
  • Backlinks (Pautan balik)
  • Search Console (Konsol Carian)

Kumpulkan daripada kesemua enam, dan anda tidak akan terlepas mana-mana URL yang penting.

Tugas Pengumpulan URL Tujuan
Rangkak domain untuk URL HTML Temui semua halaman aktif
Kategorikan mengikut kod status Kenal pasti keperluan redirect
Kumpulkan URL berbacklink Pelihara ekuiti SEO
Rangkak peta laman XML Dapatkan halaman penting yang diisytiharkan
Eksport data Search Console Cari URL yang diindeks
Kumpulkan URL analitik Kenal pasti halaman yang menjana trafik
Audit jadual redirect sedia ada Cegah rantai redirect
Satukan semua set data Cipta senarai redirect komprehensif

Apakah Set Data yang Patut Saya Gunakan untuk Menyusun Senarai URL yang Komprehensif?

Amalan Terbaik

Migrasi laman web yang berjaya memerlukan pengumpulan URL daripada pelbagai sumber untuk memastikan tiada halaman penting yang terlepas. Bergantung kepada satu sumber sahaja akan meninggalkan jurang dalam liputan redirect anda.

Sumber Data Penting

Sumber Apa yang Dirakamkan
Rangkaian Domain Semua URL HTML yang boleh ditemui
Peta Laman XML URL yang anda isytiharkan penting
Google Search Console URL yang Google ketahui
Analitik URL dengan trafik sebenar
Alat Backlink URL dengan pautan luaran
Jadual Redirect Sedia Ada Pemetaan redirect semasa

Pendekatan Pelbagai Sumber

Setiap sumber merakam URL yang mungkin terlepas oleh sumber lain:

  • Perangkak terlepas halaman anak yatim yang tidak dipautkan secara dalaman
  • Peta laman mungkin lapuk atau tidak lengkap
  • Search Console hanya menunjukkan URL yang diindeks
  • Analitik terlepas halaman dengan sifar trafik
  • Alat backlink memberi tumpuan kepada halaman yang dipautkan secara luaran
Kumpul daripada semua sumber yang ada, kemudian nyahpendua. Lebih baik mempunyai data berlebihan daripada terlepas URL bernilai tinggi yang kehilangan trafik atau ekuiti SEO selepas migrasi.

Bagaimana Saya Merangkak Domain untuk Mengumpul URL HTML?

Langkah Pertama Kritikal

Mulakan dengan merangkak keseluruhan domain anda menggunakan alat seperti Screaming Frog, Sitebulb, atau perangkak web yang serupa. Ini akan menemui semua halaman HTML yang dipautkan dalam struktur laman web anda.

Konfigurasi Rangkaian

Tetapan yang disyorkan:

  • Kedalaman rangkaian: Tanpa had (atau cukup tinggi untuk mencapai semua halaman)
  • Hormati robots.txt: Lumpuhkan untuk tujuan migrasi (anda perlukan SEMUA URL)
  • Ikuti pautan dalaman: Didayakan
  • Rangkak di luar folder permulaan: Dilumpuhkan (kekal di domain anda)
  • Simpan HTML: Pilihan tetapi berguna untuk perbandingan kandungan

Apa yang Perlu Diekstrak

Eksport yang berikut daripada rangkaian anda:

Alamat URL
Kod Status
Kebolehindeksan
URL Kanonik
Meta Robots
Tajuk

Petua untuk Mengendalikan Laman Web Besar

Untuk laman web dengan 100,000+ URL:

  1. Segmen mengikut subdirektori: Rangkak /blog/, /products/, /pages/ secara berasingan
  2. Gunakan mod senarai: Suap URL yang diketahui secara langsung dan bukannya menemui
  3. Tingkatkan peruntukan memori: Screaming Frog mungkin memerlukan 8GB+ RAM
  4. Jalankan semalaman: Rangkaian besar boleh mengambil masa berjam-jam
⚠️ Rangkak Laman Web Langsung
Sentiasa rangkak laman web pengeluaran semasa anda sebelum migrasi bermula. Merangkak persekitaran pementasan atau pembangunan akan terlepas URL yang hanya wujud dalam pengeluaran.
Jalankan rangkaian anda sekurang-kurangnya dua kali: sekali pada permulaan perancangan migrasi dan sekali lagi sejurus sebelum pelancaran. URL berubah semasa pembangunan, dan anda memerlukan data yang paling terkini.

Bagaimana Patut Saya Mengkategorikan URL Mengikut Kod Status?

Organisasi Penting

Selepas merangkak, kategorikan semua URL yang ditemui mengikut kod status HTTP mereka. Setiap kategori memerlukan pengendalian berbeza dalam strategi redirect anda.

Kategori Kod Status

URL 200 OK: Senarai sumber redirect utama anda

Subkategori Penerangan Tindakan
Boleh Diindeks Boleh muncul dalam hasil carian Redirect keutamaan tinggi
Tidak Boleh Diindeks Disekat daripada pengindeksan Nilai keperluan redirect
Dikanonikkan Menunjuk ke URL lain Redirect ke sasaran kanonik
NoIndex Tag meta noindex hadir Redirect keutamaan rendah
Parameter UTM URL penjejakan pemasaran Biasanya dikecualikan daripada redirect
Parameter Penapis URL navigasi berfaset Biasanya dikecualikan daripada redirect

URL 301/302 Redirect: Sudah melakukan redirect

  • Dokumentasikan destinasi redirect sedia ada
  • Pastikan redirect baharu menunjuk ke destinasi akhir
  • Elakkan mencipta rantai redirect

URL 404 Not Found: Rosak tetapi berpotensi penting

  • Semak backlink yang menunjuk ke URL ini
  • Semak Search Console untuk 404 yang diindeks
  • Mungkin memerlukan redirect jika mereka mempunyai nilai SEO
Cipta tab atau fail spreadsheet berasingan untuk setiap kategori kod status. Ini memudahkan untuk menggunakan strategi redirect berbeza kepada setiap kumpulan.

Patutkah Saya Sertakan URL dengan Kod Status Selain 200?

Ya: Kritikal untuk Liputan Lengkap

Banyak projek migrasi hanya memberi tumpuan kepada halaman status 200, tetapi URL 301/302 dan 404 sama pentingnya untuk mengekalkan ekuiti SEO dan pengalaman pengguna.

Mengapa URL 301/302 Penting

Redirect sedia ada mewakili URL yang pernah mempunyai nilai:

  • Laman web luaran mungkin masih memaut ke URL lama
  • Enjin carian mungkin mempunyai URL lama yang diindeks
  • Pengguna mungkin telah menanda buku URL lama

Jika anda abaikan redirect sedia ada:

URL Lama β†’ Redirect Semasa β†’ Laman Web Baharu (rosak)

Dengan pengendalian yang betul:

URL Lama β†’ Laman Web Baharu (langsung)

Mengapa URL 404 Penting

Status 404 tidak bermakna URL itu tidak bernilai:

Senario 404 Keperluan Redirect
Mempunyai backlink daripada laman web luaran Ya: pelihara ekuiti pautan
Muncul dalam Search Console Ya: Google mengetahuinya
Menunjukkan trafik dalam analitik Ya: pengguna mencarinya
Kandungan yang baru dipadam Mungkin: nilai relevan
Tidak pernah ada trafik atau pautan Tidak: selamat untuk diabaikan

Mengumpul Data 404

Eksport 404 daripada:

  • Hasil rangkaian Screaming Frog
  • Laporan liputan Google Search Console
  • Log akses pelayan
  • Analitik (halaman dengan sifar paparan halaman tetapi ada sesi)
⚠️ Jangan Redirect Semuanya
Bukan setiap 404 memerlukan redirect. Fokus kepada 404 yang mempunyai backlink, tera carian, atau mewakili kandungan yang dipindahkan dan bukannya kandungan yang sengaja dibuang.
Rujuk silang senarai 404 anda dengan data Ahrefs atau Search Console. Utamakan redirect untuk URL 404 yang mempunyai backlink luaran atau tera carian terkini.

Apakah Variasi URL yang Patut Saya Ambil Kira?

Perangkap Migrasi Biasa

Halaman yang sama boleh diakses melalui pelbagai variasi URL. Terlepas mana-mana variasi bermakna pautan rosak dan kehilangan trafik.

Variasi URL Kritikal

Jenis Variasi Contoh A Contoh B
www vs bukan-www www.example.com/page example.com/page
Garis miring di hujung /products/ /products
Huruf besar /Products/Widget /products/widget
Pengekodan URL /search?q=hello%20world /search?q=hello world
Protokol https:// http://
Fail indeks /folder/index.html /folder/

Bagaimana Variasi Menyebabkan Masalah

Pautan luaran dan tandabuku mungkin menggunakan mana-mana variasi:

Backlink gunakan: example.com/Blog/Post-Title
Redirect anda: www.example.com/blog/post-title

Hasil: Ralat 404, redirect tidak sepadan

Mengumpul Semua Variasi

  1. Semak laporan backlink: Laman web luaran menggunakan format yang tidak konsisten
  2. Semak log pelayan: Lihat URL sebenar yang diminta
  3. Uji secara manual: Cuba variasi biasa halaman penting
  4. Search Console: Menunjukkan variasi URL yang Google jumpa

Strategi Penyeragaman

Tentukan format kanonik anda, kemudian redirect semua variasi:

Laluan Lama Redirect Ke
/Products/ /products
/PRODUCTS/ /products
/products /products
/Products /products
Gunakan padanan tanpa sensitif huruf besar jika platform anda menyokongnya. Jika tidak, hasilkan redirect untuk semua variasi huruf besar yang diketahui bagi URL trafik tinggi.
Pelihara Ekuiti SEO

URL dengan backlink luaran membawa nilai SEO yang dipindahkan melalui 301 redirect. Alat analisis backlink mendedahkan URL mana yang mempunyai ekuiti ini.

Alat Ciri Utama
Ahrefs Site Explorer β†’ Best by Links
Semrush Backlink Analytics β†’ Indexed Pages

Proses Eksport (Langkah Umum)

  1. Masukkan domain anda dalam ciri analisis laman web alat
  2. Navigasi ke laporan halaman atau URL (menunjukkan halaman mana yang menerima backlink)
  3. Eksport senarai lengkap halaman dengan backlink
  4. Tapis kepada URL domain anda sahaja

Titik Data Utama untuk Dirakam

Titik Data Tujuan
URL Sasaran URL yang menerima backlink
Domain Perujuk Bilangan laman web unik yang memaut
Jumlah Backlink Jumlah kiraan pautan keseluruhan
Skor Kualiti Pautan Penunjuk autoriti (berbeza mengikut alat)

Rangka Kerja Keutamaan

Tidak semua URL berbacklink adalah sama:

Domain Perujuk Keutamaan Tindakan
50+ Kritikal Mesti redirect
10-49 Tinggi Patut redirect
2-9 Sederhana Redirect jika praktikal
1 Rendah Nilai secara individu

Kebanyakan alat backlink menunjukkan pautan yang menunjuk ke URL yang mengembalikan 404:

  1. Cari penapis kod status atau laporan backlink rosak
  2. Tapis untuk menunjukkan hanya URL 404
  3. Eksport URL ini (mereka memerlukan redirect walaupun rosak)
⚠️ Backlink ke Halaman Tidak Wujud
Laman web luaran sering memaut ke URL yang tidak lagi wujud di laman web anda. URL 404 dengan backlink ini patut diredirect ke halaman sedia ada yang paling relevan untuk merakam ekuiti pautan.
Eksport data backlink setiap bulan semasa perancangan migrasi. Backlink baharu muncul secara berkala, dan anda mahu merakam semuanya sebelum pelancaran.

Mengapa Patut Saya Merangkak Peta Laman XML?

Rakam URL Penting yang Diisytiharkan

Peta laman XML anda mewakili URL yang telah anda beritahu enjin carian secara eksplisit adalah penting. Semua ini patut dimasukkan dalam perancangan redirect anda.

Apa yang Didedahkan Peta Laman

Elemen Peta Laman Kegunaan Migrasi
Senarai URL Halaman yang anda anggap penting
Tarikh ubah suai terakhir Kandungan yang dikemas kini baru-baru ini
Nilai keutamaan Hierarki kandungan anda
Kekerapan perubahan Corak kemas kini kandungan

Mengekstrak URL Peta Laman

Kaedah 1: Muat turun langsung

https://example.com/sitemap.xml
https://example.com/sitemap_index.xml

Kaedah 2: Screaming Frog

  1. Mode β†’ List
  2. Upload β†’ Download Sitemap
  3. Masukkan URL peta laman
  4. Rangkak untuk mengesahkan URL

Kaedah 3: Search Console

  • Laporan peta laman menunjukkan URL yang diserahkan
  • Liputan indeks menunjukkan yang mana diindeks

Perbandingan Peta Laman vs Rangkaian

Bandingkan URL peta laman anda dengan hasil rangkaian:

Senario Makna Tindakan
Dalam peta laman, dijumpai dalam rangkaian Normal Sertakan dalam redirect
Dalam peta laman, tidak dalam rangkaian Halaman anak yatim Sahkan halaman wujud, sertakan
Dalam rangkaian, tidak dalam peta laman Hilang dari peta laman Sertakan dalam redirect
Jika peta laman anda dijana secara automatik oleh CMS, ia mungkin lebih terkini daripada rangkaian. Sentiasa kumpul kedua-duanya dan nyahpendua.

Bagaimana Saya Mengeksport URL daripada Google Search Console?

Cari Apa yang Google Tahu

Google Search Console mendedahkan URL yang Google telah temui dan indeks, tanpa mengira sama ada ia muncul dalam rangkaian atau peta laman anda.

Mengeksport Data URL

Daripada Laporan Liputan:

  1. Navigasi ke Indexing β†’ Pages
  2. Klik setiap kategori status (Valid, Excluded, dll.)
  3. Eksport senarai URL untuk setiap kategori

Daripada Laporan Prestasi:

  1. Navigasi ke Performance
  2. Klik tab Pages
  3. Eksport untuk melihat URL dengan tera/klik

Kategori Liputan untuk Dieksport

Kategori Mengapa Ia Penting
Valid (Indexed) URL yang muncul dalam hasil carian
Valid dengan amaran Diindeks tetapi mempunyai isu
Excluded - Crawled not indexed Google jumpa tetapi tidak mengindeks
Excluded - Discovered not indexed Google tahu tentang tetapi belum rangkak
Excluded - Redirect URL yang Google lihat sebagai redirect

Nilai Data Prestasi

URL dengan tera atau klik carian adalah terbukti berharga:

  • Pengguna menemuinya melalui carian
  • Google menganggapnya relevan untuk pertanyaan
  • Kehilangan URL ini bermakna kehilangan trafik

Eksport data 16 bulan terakhir untuk gambaran paling lengkap.

⚠️ Had URL Search Console
Eksport Search Console terhad kepada 1,000 baris dalam UI. Gunakan API Search Console atau Bulk Data Export (BigQuery) Google untuk data lengkap di laman web besar.
Beri perhatian khusus kepada kategori "Excluded - Redirect". Ini menunjukkan redirect yang telah dikesan oleh Google. Pastikan ia diambil kira dalam rancangan redirect baharu anda.

Alat yang Disyorkan: SEOGets

Untuk cara yang lebih berkuasa untuk bekerja dengan data Search Console, pertimbangkan untuk menggunakan SEOGets. Laporan Indexing mereka menyediakan pandangan yang lebih canggih tentang halaman yang diindeks berbanding antara muka Search Console asal, memudahkan untuk mengenal pasti dan mengeksport URL yang anda perlukan untuk perancangan redirect.

Laporan Indexing SEOGets

Bagaimana Saya Mengumpul URL daripada Analitik?

Kenal Pasti Halaman Penjana Trafik

Data analitik menunjukkan URL mana yang sebenarnya menerima trafik pengunjung. Ini adalah calon redirect keutamaan tertinggi anda.

Mengeksport daripada Google Analytics (GA4)

  1. Navigasi ke Reports β†’ Engagement β†’ Pages and screens
  2. Tetapkan julat tarikh kepada 12-16 bulan terakhir
  3. Eksport laporan laluan halaman lengkap

Metrik Utama untuk Dirakam

Metrik Penunjuk Keutamaan
Sessions Jumlah trafik keseluruhan
Users Kiraan pengunjung unik
Engagement rate Isyarat kualiti kandungan
Conversions Nilai perniagaan

Mencipta Peringkat Keutamaan

Segmen URL mengikut jumlah trafik:

Sesi Bulanan Keutamaan Rawatan Redirect
1,000+ Kritikal Mesti redirect, sahkan destinasi
100-999 Tinggi Mesti redirect
10-99 Sederhana Patut redirect
1-9 Rendah Redirect jika praktikal
0 Terendah Redirect hanya jika backlink wujud

Jangan Lupa Halaman Pendaratan

Tapis untuk halaman di mana pengguna memasuki laman web anda:

  • Ini sering dipautkan secara luaran atau ditandabuku
  • Kehilangan halaman pendaratan mempunyai impak trafik yang luar biasa
  • Utamakan redirect untuk halaman pendaratan teratas
Bandingkan URL analitik dengan rangkaian anda. Halaman dengan trafik yang tidak dijumpai dalam rangkaian mungkin kandungan anak yatim yang masih memerlukan redirect.

Di Mana Saya Boleh Jumpa Jadual 301 Redirect Sedia Ada?

Cegah Rantai Redirect

Sebelum mencipta redirect baharu, anda mesti tahu redirect apa yang sudah wujud. Mengabaikan redirect sedia ada mencipta rantai yang menjejaskan SEO dan prestasi.

Sumber Redirect Biasa

Sumber Di Mana Menjumpai Kaedah Eksport
Admin Redirect CMS Panel admin WordPress, Shopify, dll. Eksport terbina dalam atau pertanyaan pangkalan data
Plugin Redirect Yoast, Redirection, Rank Math Tetapan plugin β†’ Export
Perkhidmatan Edge Cloudflare, Fastly, Netlify Dashboard β†’ Rules β†’ Export
Platform Rangkaian Pengimbang beban, CDN Fail konfigurasi
Konfigurasi Pelayan .htaccess, nginx.conf Akses fail langsung

Lokasi Khusus CMS

WordPress:

  • Plugin Redirection: Tools β†’ Redirection β†’ Export
  • Yoast Premium: SEO β†’ Redirects β†’ Export
  • Pangkalan data: jadual wp_redirection_items

Shopify:

  • Admin β†’ Content β†’ URL Redirects β†’ Export

Webflow:

  • Site Settings β†’ Publishing β†’ 301 Redirects

Apa yang Perlu Didokumenkan

Untuk setiap redirect sedia ada, rakamkan:

Medan Contoh
URL Sumber /old-page
URL Destinasi /new-page
Jenis Redirect 301 atau 302
Lokasi Plugin, .htaccess, CDN
Tarikh Dicipta 2024-03-15
⚠️ Pelbagai Sumber Redirect
Banyak laman web mempunyai redirect yang dikonfigurasi di pelbagai tempat (CMS, plugin, pelayan, CDN). Audit SEMUA sumber untuk mendapat gambaran lengkap. Terlepas satu sumber boleh menyebabkan tingkah laku redirect yang tidak dijangka.
Satukan semua redirect sedia ada ke dalam satu dokumen sebelum migrasi. Ini menjadi rujukan anda untuk apa yang sudah dikendalikan dan apa yang mungkin bercanggah dengan redirect baharu.

Apakah Cara yang Membantu untuk Menggunakan Data Rantai Redirect?

Bersihkan Sebelum Migrasi

Rantai redirect berlaku apabila satu redirect menunjuk ke redirect lain, mencipta pelbagai lompatan. Ini menjejaskan SEO dan kelajuan halaman. Migrasi adalah masa yang sesuai untuk menghapuskannya.

Mengenal Pasti Rantai Redirect

Dalam Screaming Frog:

  1. Rangkak laman web anda
  2. Tapis mengikut Status Code β†’ 3xx
  3. Cari redirect di mana Redirect URL juga merupakan redirect

Contoh rantai:

/page-a β†’ 301 β†’ /page-b β†’ 301 β†’ /page-c β†’ 200

Ini adalah rantai 2-lompatan yang patut menjadi:
/page-a β†’ 301 β†’ /page-c
/page-b β†’ 301 β†’ /page-c

Proses Penyelesaian Rantai

  1. Petakan semua rantai redirect: Dokumentasikan setiap corak A→B→C
  2. Kenal pasti destinasi akhir: Cari di mana setiap rantai akhirnya membawa
  3. Kemas kini redirect sumber: Tunjuk terus ke destinasi akhir
  4. Buang redirect perantaraan: Padam lompatan yang tidak perlu
  5. Sahkan penyelesaian: Uji bahawa rantai dihapuskan

Senario Rantai Biasa

Senario Sebelum Selepas
HTTP ke HTTPS ke halaman http→https→/new http→/new (jika HTTPS dikuatkuasakan di pelayan)
Redirect lama + redirect baharu /old→/middle→/new /old→/new, /middle→/new
Rantai normalisasi WWW non-www→www→/page non-www→/page (www di peringkat DNS)
⚠️ Rantai Membazir Bajet Rangkaian
Bot enjin carian mungkin tidak mengikuti rantai redirect yang panjang, bermakna halaman di hujung rantai mungkin tidak dirangkak atau diindeks dengan betul. Google mengesyorkan maksimum 2 lompatan.
Gunakan data jadual redirect sedia ada anda untuk memetakan semua rantai sebelum mencipta redirect baharu. Kemas kini senarai redirect induk anda supaya setiap URL sumber menunjuk terus ke destinasi akhirnya di laman web baharu.

Bagaimana Saya Mencipta Set Data URL Bersepadu?

Langkah Akhir Kritikal

Selepas mengumpul URL daripada semua sumber, gabungkan mereka ke dalam satu set data tanpa pendua. Ini menjadi senarai sumber redirect induk anda.

Proses Penyatuan

Langkah 1: Seragamkan format

  • Buang protokol (https://)
  • Buang domain (www.example.com)
  • Seragamkan garis miring di hujung
  • Tukar kepada huruf kecil (jika laman web anda tanpa sensitif huruf besar)

Langkah 2: Sahkan melalui Screaming Frog

Jalankan setiap senarai URL melalui Screaming Frog dalam Mod Senarai:

  1. Mode β†’ List
  2. Upload senarai URL anda
  3. Start rangkaian untuk mengesahkan setiap URL
  4. Eksport hasil dengan kod status

Ini mengesahkan status semasa setiap URL merentasi semua sumber.

Langkah 3: Gabung dan nyahpendua

Sumber A: 5,000 URL
Sumber B: 3,500 URL
Sumber C: 8,200 URL
Sumber D: 2,100 URL
─────────────────────
Gabungan: 18,800 URL
Selepas nyahpendua: 12,400 URL unik

Langkah 4: Perkaya dengan metadata

Tambah lajur daripada setiap sumber:

URL Status Backlink Sesi Dalam Peta Laman Ada Redirect
/page-a 200 45 1,200 Ya Tidak
/page-b 404 12 0 Tidak Tidak
/page-c 301 8 340 Ya Ya
Simpan set data bersepadu anda dalam spreadsheet atau pangkalan data yang dikawal versi. Anda akan merujuk dan mengemas kininya sepanjang proses migrasi.

Bersedia untuk Memetakan URL Anda?

Sebaik sahaja anda telah mengumpul URL daripada semua sumber dan mencipta set data bersepadu anda, langkah seterusnya ialah memetakan URL lama ke destinasi baharu. Jika anda pernah melakukan kerja redirect sebelum ini, anda tahu ini secara tradisinya adalah bahagian yang paling memakan masa dalam kerja redirect, tetapi tidak semestinya begitu.

Redirects.net menggunakan algoritma padanan pintar untuk memetakan URL lama anda secara automatik ke destinasi terbaik di laman web baharu anda. Muat naik senarai URL bersepadu anda, dan dapatkan redirect yang dipetakan sedia untuk pelaksanaan.

Cuba Redirects.net Percuma β†’