Что такое кэш поисковой системы? Зачем он нужен?
Когда робот поисковой системы (ПС) обходит сайт во время индексации, система автоматически сохраняет копию каждой посещенной страницы. Эти копии попадают в базу данных – кэш поисковой системы.
Кэшированные страницы могут отличаться от их текущих версий, потому что поисковая машина обновляет информацию с определенными временными интервалами, а контент на сайте может меняться чаще.
Особенности работы кэша поисковиков
- Кэш и индекс – не одно и то же. В кэше хранятся копии веб-страниц, а в индексе – только текстовые фрагменты с ключевыми словами и URL страниц, которые проиндексировал робот.
- В кэш не попадают динамические скрипты. Кэшированная страница содержит html-код текстового и статического контента. Видео, графика и блоки, написанные на JavaScript, Flash и Ajax не сохраняются в кэш. Но если поставить на них абсолютные ссылки, то эти блоки будут отображаться на кэшированной странице.
- Кэш – одна копия страницы. В базе данных поисковой системы хранятся наиболее актуальные копии каждой страницы. При каждом переобходе роботом информация в кэше обновляется и перезаписывается, старые версии при этом удаляются.
Кэш поисковой системы позволяет:
- увидеть сохраненную ранее копию страницы и ознакомиться с контентом, который был на ней в момент индексации;
- проверить, какие внесенные изменения на сайте были проиндексированы, а какие – нет;
- узнать, учитывает поисковая система ссылку на ресурс или нет;
- восстановить удаленные данные;
- оценить уникальность размещенного на странице текста;
- определить точную дату индексации.
Кроме того, кэш помогает посмотреть содержимое сайта, который система считает потенциально опасным и запрещает открывать актуальную страницу.
Как часто поисковые системы обновляют кэш
В Яндексе актуализация (апдейт) сохраненной копии происходит 1-2 раза в неделю. Система проверяет текстовое наполнение и ссылки. Пересчет ТИЦ (тематического индекса цитирования) производится реже – 1 раз в 2 месяца.
В Google нет фиксированной периодичности обновлений кэша. Все зависит от робота – когда он посчитал нужным зайти на страницу, тогда кэш и обновится. Здесь наши специалисты по SEO оптимизации грустят вместе с вами.
Как посмотреть кэш поисковой системы
Ссылка на сохраненную копию страницы размещается в сниппете в выдаче поисковых результатов. Чтобы ее увидеть, нужно нажать на стрелку рядом со ссылкой на страницу.
Так это выглядит в Яндексе:
А так – в Google:
Иногда в выдаче не показывается ссылка на сохраненную копию. Например, как здесь:
Это означает, что вебмастер по какой-то причине не хочет открывать доступ к кэшу посторонним лицам. Поэтому прописал атрибут Robots: <meta name="robots" content="noarchive"/>. После этого ссылка на кэш не отображается в результатах поисковой выдачи, но сама страница все равно индексируется поисковыми роботами, если это тоже не запрещено в файле robots.txt.
Зачем и как удалить страницу из кэша поисковой системы
В процессе работы SEO-специалисты сталкиваются с разными проблемами, одна из которых – копирование контента с их сайта. Из-за этого проседают позиции, и процесс продвижения ставится под вопрос. Если удается добиться, чтобы сайт «воров» перестал работать, страницы начинают отдавать ошибку 404, но продолжают оставаться в выдаче. В таком случае единственный способ решить проблему – удалить копии страниц из кэша.
Еще может произойти ситуация, когда на сайт попала нежелательная информация, которую оперативно удалили, но робот все же успел проиндексировать страницы, где она находилась.
Чтобы удалить кэшированные страницы из выдачи, нужно воспользоваться специальным инструментом –
Еще ответы по теме:
Наши работы
Вернуться в раздел
расчет стоимости проекта, а так же план его реализации.
в самое ближайшее время
в рабочее время нашей компании.
партнером
Как долго может храниться кеш поисковой системы?
Кому: Za/Man, может достаточно долго. Особенно если эти страницы попали в разряд "малокачественных". Особенно это касается больших порталов СМИ, некоторые страницы на них посещаются роботом один-два раза и он о них забывает на долгие годы.
Обновить эти страницы можно через МАССОВЫЕ изменения. Например, внутренними ссылками, изменение метатегов или появления нового контента на страницах.
Дополнение: ТИЦ "покинул нас", примерно как ВИЦ до него и это правильно, поскольку ТИЦ относится исключительно к количеству ссылок которые ведут на сайт. А новый параметр ИКС отвечает уже за группу факторов, важнейшими из которых являются поведенческие факторы и удобство использования сайта.
Видят ли поисковые роботы кэш сайта.
Кому: Нина, если вы про кеширование на стороне сайта, то да видит, если вы не меняете ip для разных посетителей, включая бот поисковой машины. Кстати у поисковиков разные боты, которые могут видеть сайт немного по разному.
Кэш также может работать по разным правилам на разных сайтах, самый простой это кэш на определенное время.
Сколько удаленные с сайта фотографии хранятся в кэше поисковика?
Кому: Дима Ивлев, обычно до месяца, главное чтобы она была удалена из html документа в котором размещалась. Бот увидит отсутствие этих страниц и удалить картинку из кеша.
А поисковики хранят всю память у себя?
Кому: Ксения Владимировна, нет, все не сохраняется. Это может быть из-за сложности структуры конкретного сайта или в целом из-за проблем поисковой машины.
Какие данные страницы хранятся в поиске, если она не проиндексирована?
Кому: Арес Темов, как говорят гуглойды, почти ничего не хранит поисковая машина. Скорее всего причину по которой страница не проиндексирована (если бот ее посетил)..