Важна ли карта sitemap.xml?
Поисковые системы учитывают sitemap.xml. Из данной карты они получают информацию о дате, приоритете и частоте изменения страниц. Обход сайта начинается именно с разделов, указанных в карте. Это делается, чтобы загрузить как можно больше полезной информации, а не мусорных страниц. Так что к sitemap.xml нужно относиться серьёзно и формировать её максимально корректно.
Например,
- Много страниц
- Отдельные страницы без навигационных ссылок
- Глубокая вложенность
Яндекс предъявляет к sitemap.xml следующие требования:
- Кодировка UTF-8
- Максимум 50 000 ссылок
- Максимальный размер файла – 50МБ
- Ссылки только на тот домен, на котором будет расположен сайт
- При обращении к файлу сервер должен возвращать HTTP-код 200.
Важно не забыть указать адрес xml карты в robots.txt, обычно это Sitemap.
Некоторые системы генерируют карту в автоматическом режиме, поэтому адрес может быть иным. Кром того, многие системы имеют модули автоматической генерации карты, например Joomla (Джумла), WordPress (Вордпресс), Bitrix (Битрикс). При этом на сайте можно видеть несколько xml карт, что приводит к путанице в работе с ними.
Почему при всей своей простоте, карта сайта может вызвать много проблем?
- Автоматическая генерация через встроенные модули приводит к попаданию «мусорных» страниц в карту
- Генерация руками часто приводит к тому же
Поэтому зачастую приходится все просматривать глазами и вылавливать в вебмастере. Все это вызывает проблемы на сайтах с большим количеством страниц, где добавляется десятки и сотни страниц в день. То же касается управления картой сайта на больших интернет-магазинах. На выходе получаем три подхода:
- В карту сайта выгружаются только важные страницы
- В карту сайта выгружается все, и она постоянно обновляется
- Карта сайта начинает отнимать слишком много времени
Карта сайта является важнейшим инструментом получения данных о качестве страниц, которые потом можно отсматривать в вебмастерах яндекса и гугла. Иначе мы просто никогда не увидим полноценную картину здоровья сайта.
Ответы на любые возникшие вопросы вы можете получить из Справок Яндекса и
Еще ответы по теме:
- Сколько времени нужно поисковым системам для индексации новой страницы?
- Как скоро SEO-продвижение начнет давать результаты?
- Можно ли приостанавливать SEO в «низкий сезон»? Чем это грозит?
Наши работы
Вернуться в раздел
расчет стоимости проекта, а так же план его реализации.
в самое ближайшее время
в рабочее время нашей компании.
партнером
У меня вопрос, пытаюсь в screaming frog сформировать XML карту. В роботе вроде все прописано, но все равно лягушка забирает страницы которые запрещены robots.txt?
Кому: Андрей Коннонов, скорее всего у вас в роботсе прописаны отдельные правила для Яндекса и Гугла, а лягушка ориентируется на общее правило. Сделайте общее правило и все должно сработать.
У меня в Яндекс вебмастере карта сайта отображается с ошибкой "формат документа не поддерживается индексирующим роботом. Обратите внимание на содержание заголовка Content-Type и на содержимое документа". В чем дело?
Кому: Тема, не обращайте внимание, это не ошибка для яндекса. Они когда-нибудь сделают исключение для таких страниц и ошибка перестанет отображаться в вебмастере. Еще раз повторюсь, это не ошибка. Это никак не влияет на индексацию или обработку карты сайта.
Сегодня увидел в вебмастере яндекса что страницы карты сайта это неподдерживаемый формат. Почему так, ошибка лежит в разделе "исключенные страницы" в разделе индексирования сайта.
Кому: Константин Гром, добрый день, это не влияет никак на сайт. Просто отчет падает в этот раздел с ошибками.