Як створити єдиний набір даних URL з декількох джерел?

Пропустіть усі зібрані списки URL через Screaming Frog в режимі списку окремо, а потім об'єднайте перевірені результати в єдиний набір даних без дублікатів для зіставлення редиректів.

Як зібрати всі важливі URL для 301 редиректів у проєкті міграції сайту

Q: Які набори даних я повинен використовувати для складання вичерпних списків URL?

Використовуйте декілька джерел: дані сканування домену, XML-карти сайту, експорт з Google Search Console, дані аналітики, звіти про зворотні посилання з SEO-інструментів та існуючі таблиці редиректів з вашої CMS або периферійних сервісів.

Q: Чи повинен я включати URL з кодами статусу, відмінними від 200?

Так. Включіть редиректи 301/302, щоб уникнути ланцюжків, 404, які можуть мати зворотні посилання або історію пошуку, та всі варіації URL (www проти non-www, кінцеві слеші, використання великих літер), щоб забезпечити повне покриття.

Q: Як корисно використовувати дані про ланцюжки редиректів?

Експортуйте існуючі таблиці редиректів з вашої CMS, плагінів, периферійних сервісів та мережевих платформ. Використовуйте ці дані для виявлення та усунення ланцюжків редиректів перед міграцією, щоб забезпечити чисті, прямі редиректи.

Приведіть свої CARS & BS у порядок перед міграцією. 😂

Ця проста мнемоніка охоплює шість основних джерел даних для створення повного списку URL:

Crawl (Сканування)
Analytics (Аналітика)
Redirects (Редиректи) (існуючі)
Sitemap (Карта сайту)
Backlinks (Зворотні посилання)
Search Console (Консоль пошуку)

Зберіть з усіх шести джерел, і ви не пропустите жодної важливої URL-адреси.

Завдання зі збору URL	Мета
Сканування домену для HTML URL	Виявлення всіх активних сторінок
Категоризація за кодом статусу	Визначення потреб у редиректах
Збір URL із зворотними посиланнями	Збереження SEO-капіталу
Сканування XML-карти сайту	Захоплення заявлених важливих сторінок
Експорт даних Search Console	Пошук проіндексованих URL
Збір URL з аналітики	Визначення сторінок, що генерують трафік
Аудит існуючих таблиць редиректів	Запобігання ланцюжкам редиректів
Об’єднання всіх наборів даних	Створення вичерпного списку редиректів

Які набори даних я повинен використовувати для складання вичерпних списків URL?

Найкраща практика

Успішна міграція сайту вимагає збору URL з декількох джерел, щоб не пропустити жодної важливої сторінки. Покладання на одне джерело призведе до прогалин у покритті редиректами.

Основні джерела даних

Джерело	Що воно захоплює
Сканування домену	Всі доступні для виявлення HTML URL
XML-карта сайту	URL, які ви заявили як важливі
Google Search Console	URL, про які знає Google
Аналітика	URL з фактичним трафіком
Інструменти зворотних посилань	URL з зовнішніми посиланнями
Існуючі таблиці редиректів	Поточні зіставлення редиректів

Підхід з декількома джерелами

Кожне джерело захоплює URL, які інші можуть пропустити:

Сканери пропускають сторінки-сироти, які не пов’язані внутрішньо
Карти сайту можуть бути застарілими або неповними
Search Console показує лише проіндексовані URL
Аналітика пропускає сторінки з нульовим трафіком
Інструменти зворотних посилань фокусуються на сторінках з зовнішніми посиланнями

Збирайте з усіх доступних джерел, а потім видаляйте дублікати. Набагато краще мати надлишкові дані, ніж пропустити високоцінну URL-адресу, яка втратить трафік або SEO-капітал після міграції.

Як мені просканувати домен для збору HTML URL?

Критичний перший крок

Почніть зі сканування всього вашого домену за допомогою такого інструменту, як Screaming Frog, Sitebulb або подібних веб-сканерів. Це виявляє всі HTML-сторінки, які пов’язані всередині вашої структури сайту.

Конфігурація сканування

Рекомендовані налаштування:

Глибина сканування: Необмежена (або достатньо висока, щоб охопити всі сторінки)
Поважати robots.txt: Вимкнено для цілей міграції (вам потрібні ВСІ URL)
Слідувати внутрішнім посиланням: Увімкнено
Сканувати за межами початкової папки: Вимкнено (залишайтеся на своєму домені)
Зберігати HTML: Опціонально, але корисно для порівняння контенту

Що витягувати

Експортуйте наступне зі свого сканування:

URL Address
Status Code
Indexability
Canonical URL
Meta Robots
Title

Поради для обробки великих сайтів

Для сайтів з понад 100 000 URL:

Сегментація за підкаталогами: Скануйте /blog/, /products/, /pages/ окремо
Використовуйте режим списку: Надавайте відомі URL безпосередньо замість виявлення
Збільште виділення пам’яті: Screaming Frog може потребувати 8 ГБ+ оперативної пам’яті
Запускайте на ніч: Великі сканування можуть тривати годинами

⚠️ Скануйте живий сайт

Завжди скануйте свій поточний продакшн-сайт до початку міграції. Сканування тестового або розробницького середовища пропустить URL, які існують лише в продакшні.

Проведіть сканування принаймні двічі: один раз на початку планування міграції та один раз безпосередньо перед запуском. URL змінюються під час розробки, і вам потрібні найактуальніші дані.

Як мені категоризувати URL за кодом статусу?

Суттєва організація

Після сканування категоризуйте всі виявлені URL за їх HTTP-кодом статусу. Кожна категорія вимагає різного підходу у вашій стратегії редиректів.

Категорії кодів статусу

200 OK URL: Ваш основний список джерел редиректів

Підкатегорія	Опис	Дія
Індексовані	Можуть з’явитися в результатах пошуку	Високопріоритетні редиректи
Неіндексовані	Заблоковані від індексації	Оцініть потребу в редиректі
Канонізовані	Вказують на іншу URL	Переспрямувати на канонічну ціль
NoIndex	Присутній тег meta noindex	Низькопріоритетні редиректи
UTM-параметри	URL відстеження маркетингу	Зазвичай виключаються з редиректів
Параметри фільтрів	URL фасетної навігації	Зазвичай виключаються з редиректів

301/302 Redirect URL: Вже перенаправляють

Документуйте існуючі напрямки редиректів
Переконайтеся, що нові редиректи вказують на кінцеві пункти призначення
Уникайте створення ланцюжків редиректів

404 Not Found URL: Зламані, але потенційно важливі

Перевірте зворотні посилання, що вказують на ці URL
Перегляньте Search Console на предмет проіндексованих 404
Можуть потребувати редиректів, якщо мають SEO-цінність

Створіть окремі вкладки електронної таблиці або файли для кожної категорії кодів статусу. Це полегшує застосування різних стратегій редиректів до кожної групи.

Чи повинен я включати URL з кодами статусу, відмінними від 200?

Так: критично для повного покриття

Багато міграційних проєктів фокусуються лише на сторінках зі статусом 200, але URL з 301/302 та 404 однаково важливі для збереження SEO-капіталу та користувацького досвіду.

Чому важливі 301/302 URL

Існуючі редиректи представляють URL, які колись мали цінність:

Зовнішні сайти можуть все ще посилатися на старі URL
Пошукові системи можуть мати проіндексовані старі URL
Користувачі могли додати старі URL до закладок

Якщо ви ігноруєте існуючі редиректи:

Старий URL → Поточний редирект → Новий сайт (зламаний)

При правильній обробці:

Старий URL → Новий сайт (прямий)

Чому важливі 404 URL

Статус 404 не означає, що URL безцінна:

Сценарій 404	Потреба в редиректі
Має зворотні посилання з зовнішніх сайтів	Так: зберегти капітал посилань
З’являється в Search Console	Так: Google знає про це
Показує трафік в аналітиці	Так: користувачі шукають це
Нещодавно видалений контент	Можливо: оцініть релевантність
Ніколи не мав трафіку або посилань	Ні: безпечно ігнорувати

Збір даних 404

Експортуйте 404 з:

Результатів сканування Screaming Frog
Звіту про покриття Google Search Console
Логів доступу до сервера
Аналітики (сторінки з нульовими переглядами, але сесіями)

⚠️ Не перенаправляйте все

Не кожна 404 потребує редиректу. Зосередьтеся на 404, які мають зворотні посилання, пошукові враження або представляють контент, який перемістився, а не контент, який був навмисно видалений.

Які варіації URL я повинен врахувати?

До тієї самої сторінки можна отримати доступ через декілька варіацій URL. Пропуск будь-якої варіації означає зламані посилання та втрату трафіку.

Критичні варіації URL

Як варіації викликають проблеми

Зовнішні посилання та закладки можуть використовувати будь-яку варіацію:

Збір всіх варіацій

Стратегія стандартизації

Визначте свій канонічний формат, а потім перенаправте всі варіації:

Як мені зібрати URL із зворотними посиланнями?

URL з зовнішніми зворотними посиланнями несуть SEO-цінність, яка передається через 301 редиректи. Інструменти аналізу зворотних посилань виявляють, які URL мають цей капітал.

Поширені інструменти зворотних посилань

Процес експорту (загальні кроки)

Ключові точки даних для захоплення

Структура пріоритизації

Не всі URL зі зворотними посиланнями рівноцінні:

Не забувайте про зворотні посилання на 404

Більшість інструментів зворотних посилань показують посилання, що вказують на URL, які повертають 404:

Навіщо мені сканувати XML-карту сайту?

Ваша XML-карта сайту представляє URL, про які ви явно повідомили пошуковим системам як важливі. Вони всі повинні бути включені у ваше планування редиректів.

Що розкривають карти сайту

Витягування URL карти сайту

Порівняння карти сайту та сканування

Порівняйте URL вашої карти сайту з результатами сканування:

Як мені експортувати URL з Google Search Console?

Google Search Console виявляє URL, які Google виявив і проіндексував, незалежно від того, чи з’являються вони у вашому скануванні або карті сайту.

Експорт даних URL

Категорії покриття для експорту

Цінність даних продуктивності

Тип варіації	Приклад A	Приклад B
www проти non-www	`www.example.com/page`	`example.com/page`
Кінцевий слеш	`/products/`	`/products`
Використання великих літер	`/Products/Widget`	`/products/widget`
Кодування URL	`/search?q=hello%20world`	`/search?q=hello world`
Протокол	`https://`	`http://`
Індексні файли	`/folder/index.html`	`/folder/`

Старий шлях	Перенаправити до
/Products/	/products
/PRODUCTS/	/products
/products	/products
/Products	/products

Інструмент	Ключова функція
Ahrefs	Site Explorer → Best by Links
Semrush	Backlink Analytics → Indexed Pages

Точка даних	Мета
Цільова URL	URL, що отримує зворотні посилання
Реферальні домени	Кількість унікальних сайтів, що посилаються
Загальна кількість зворотних посилань	Загальна кількість посилань
Показник якості посилань	Індикатор авторитетності (варіюється за інструментом)

Реферальні домени	Пріоритет	Дія
50+	Критичний	Обов’язково перенаправити
10-49	Високий	Слід перенаправити
2-9	Середній	Перенаправити, якщо практично
1	Низький	Оцінити індивідуально

Елемент карти сайту	Використання при міграції
Список URL	Сторінки, які ви вважаєте важливими
Дати останньої зміни	Нещодавно оновлений контент
Значення пріоритету	Ваша ієрархія контенту
Частота змін	Шаблони оновлення контенту

Сценарій	Значення	Дія
У карті сайту, знайдено при скануванні	Нормально	Включити в редиректи
У карті сайту, не знайдено при скануванні	Сторінка-сирота	Перевірити існування сторінки, включити
При скануванні, не в карті сайту	Відсутня в карті сайту	Включити в редиректи

Категорія	Чому це важливо
Valid (Indexed)	URL, що з’являються в результатах пошуку
Valid with warnings	Проіндексовані, але мають проблеми
Excluded - Crawled not indexed	Google знайшов, але не проіндексував
Excluded - Discovered not indexed	Google знає про них, але не сканував
Excluded - Redirect	URL, які Google бачить як перенаправлені

URL з пошуковими враженнями або кліками є доведено цінними:

Експортуйте дані за останні 16 місяців для найповнішої картини.

Рекомендований інструмент: SEOGets

Для більш потужного способу роботи з даними Search Console розгляньте використання SEOGets. Їх звіт про індексацію надає більш складний вигляд ваших проіндексованих сторінок, ніж рідний інтерфейс Search Console, що полегшує виявлення та експорт URL, які вам потрібні для планування редиректів.

Як мені зібрати URL з аналітики?

Дані аналітики показують, які URL фактично отримують трафік відвідувачів. Це ваші найвищепріоритетні кандидати на редиректи.

Експорт з Google Analytics (GA4)

Ключові показники для захоплення

Створення рівнів пріоритету

Не забувайте про цільові сторінки

Показник	Індикатор пріоритету
Сесії	Загальний обсяг трафіку
Користувачі	Кількість унікальних відвідувачів
Рівень залученості	Сигнал якості контенту
Конверсії	Бізнес-цінність

Місячні сесії	Пріоритет	Обробка редиректа
1000+	Критичний	Обов’язково перенаправити, перевірити призначення
100-999	Високий	Обов’язково перенаправити
10-99	Середній	Слід перенаправити
1-9	Низький	Перенаправити, якщо практично
0	Найнижчий	Перенаправляти лише якщо існують зворотні посилання

Фільтруйте сторінки, через які користувачі входять на ваш сайт:

Де мені знайти існуючі таблиці 301 редиректів?

Перед створенням нових редиректів ви повинні знати, які редиректи вже існують. Ігнорування існуючих редиректів створює ланцюжки, які шкодять SEO та продуктивності.

Поширені джерела редиректів

Місця, специфічні для CMS

Що документувати

Як корисно використовувати дані про ланцюжки редиректів?

Ланцюжки редиректів виникають, коли один редирект вказує на інший редирект, створюючи кілька переходів. Вони шкодять SEO та швидкості сторінки. Міграція — ідеальний час для їх усунення.

Виявлення ланцюжків редиректів

Процес вирішення ланцюжка

Поширені сценарії ланцюжків

Як створити єдиний набір даних URL?

Після збору URL з усіх джерел об’єднайте їх у єдиний набір даних без дублікатів. Це стає вашим основним списком джерел редиректів.

Процес об’єднання

Пропустіть кожен список URL через Screaming Frog в режимі списку:

Це підтверджує поточний статус кожної URL у всіх джерелах.

Готові зіставити свої URL?

Джерело	Де знайти	Метод експорту
Адмін-панель CMS	WordPress, Shopify тощо адмін-панель	Вбудований експорт або запит до бази даних
Плагіни редиректів	Yoast, Redirection, Rank Math	Налаштування плагіна → Експорт
Периферійні сервіси	Cloudflare, Fastly, Netlify	Панель керування → Правила → Експорт
Мережеві платформи	Балансувальники навантаження, CDN	Конфігураційні файли
Конфігурація сервера	.htaccess, nginx.conf	Прямий доступ до файлу

Поле	Приклад
Вихідна URL	`/old-page`
URL призначення	`/new-page`
Тип редиректу	301 або 302
Розташування	Плагін, .htaccess, CDN
Дата створення	2024-03-15

Сценарій	До	Після
HTTP до HTTPS до сторінки	http→https→/new	http→/new (якщо HTTPS застосовується на сервері)
Старий редирект + новий редирект	/old→/middle→/new	/old→/new, /middle→/new
Ланцюжок нормалізації WWW	non-www→www→/page	non-www→/page (www на рівні DNS)

URL	Статус	Зворотні посилання	Сесії	У карті сайту	Має редирект
/page-a	200	45	1200	Так	Ні
/page-b	404	12	0	Ні	Ні
/page-c	301	8	340	Так	Так

Після того, як ви зібрали URL з усіх джерел і створили свій об’єднаний набір даних, наступним кроком є зіставлення старих URL з новими призначеннями. Якщо ви робили роботу з редиректами раніше, ви знаєте, що це традиційно найбільш трудомістка частина роботи з редиректами, але це не обов’язково має бути так.

Redirects.net використовує інтелектуальні алгоритми співставлення для автоматичного зіставлення ваших старих URL з найкращими призначеннями на вашому новому сайті. Завантажте свій об’єднаний список URL і отримайте зіставлені редиректи, готові до впровадження.

Як зібрати всі важливі URL для 301 редиректів

Стратегії для брендів, SEO-стратегів та команд розробників