Индексация сайта


Индексация сайта — это процесс, проводимый роботами поисковых систем и заключающийся в исследовании ими страниц сайта с выявлением используемых слов, частоты их употребления, … со внесением полученной информации в базы данных, которые используются для формирования ответов на поисковые запросы.

Индексирование в поисковых системах (веб-индексирование) — процесс добавления сведений (о сайте) роботом поисковой машины в базу данных, впоследствии использующуюся для (полнотекстового) поиска информации на проиндексированных сайтах.

В сведения о сайте чаще всего входят ключевые слова (алгоритм определения ключевых слов зависит от поисковой системы), статьи, ссылки, документы, также могут индексироваться изображения, аудио и т. д.

Далее на этой странице выявлен и описан самый быстрый и верный способ определения числа проиндексированных страниц.

Индексация страниц сайта приводит к тому, что начинает брезжить надежда на появление посетителей из выдачи поисковых систем.


Google обычно обнаруживает и индексирует новую страницу буквально в первые 12-ть часов её существования.

Чтобы узнать, что конкретная страница проиндексирована Google, я обычно на google.ru делаю поиск по запросу название_страницы экопарк Z  Например, 12.06.2014 создал страницу Цвета, а 13.06.2014 эта страница находится на 4-м месте поисковой выдачи по запросу цвета экопарк Z

Можете проверить этот способ сначала на моём запросе, а потом и на подобном своём.

Яндекс действует значительно медленнее, на обнаружение страницы у него обычно уходит от 3-х до 7-ми дней, а индексацию, как я не совсем обоснованно считаю, он обычно проводит только тех страниц, которые имеют более ста слов.

Удалось обнаружить проиндексированные Яндексом страницы, имеющие 56-ть и 17-ть слов, поэтому считаю, что число слов, равное ста, не является чётким критерием, но уверен, что увеличение числа слов повышает шансы на индексацию Яндексом.

07.09.2014 даже обнаружил давно опубликованную страницу, имеющую лишь название и дважды упомянутое ключевое слово, совпадающее с названием. Вполне очевидные выводы делайте сами… У меня создалось впечатление, что Яндекс проиндексировал её авансом: ему просто надоело ждать , когда же страница будет наполнена текстом.

Используя сортировку на отдельном листе, выделил в таблице сайта 34-ре страницы с числом слов от 2-х до 97-ми — собираюсь вскоре существенно дополнить их текстами, ибо просто считаю неприличным иметь столь короткие страницы.


Чтобы наверняка и чётко узнать число страниц, проиндексированных Яндексом и Google, запускал программу Site-Auditor версии 2.54.1, которая выдавала информацию о числе проиндексированных страниц, но значения были сильно завышены: Яндекс — 779-ть, Google  — 940-к. Кликнув по подчёркнутому значению 779, попадаю в поисковую выдачу Яндекса. В строке поискового запроса стоит значение 779.

Перейдя в конец страницы, кликнул по +5 и перешёл на 6-ю страницу выдачи. Аналогичным образом перешёл на 11-ю, 16-ю, 21-ю, … страницы. На 46-й странице в строке поискового запроса появилось число 630-ть. Дошёл до 63-й странице и увидел число 628-мь. Именно столько страниц проиндексировал Яндекс. На сайте создано 645-ть страниц, согласно чёткой информации WordPress. 17-ть страниц по разным причинам ещё не попали в число проиндексированных.

За последние два дня создал примерно 11-ть страниц, которые наверняка ещё не проиндексированы Яндексом. 6-ть страниц — это, пожалуй, заготовки страниц, содержащие совсем мало слов. Таким образом, можно считать, что с индексацией страниц сайта Яндексом всё в порядке!

Считается, что можно узнать число страниц, проиндексированных Яндексом, набрав в адресной строке браузера на сайте yandex.ru запрос site:адрес_сайта

Попробовал — получил 2000-чи ответов. Кликнул по адресной строке браузера, информация в ней стала более подробной. Увидел в конце p=1 (то есть page=1), заменил 1 на 65 — попал на 63-ю страницу, так как 65-я не существует. В строке запроса увидел 628-мь ответов.

Вот так обнаружил быстрый и верный способ определения числа проиндексированных страниц.


Попытался аналогичным образом, танцуя от Site-Auditor, определить число страниц, которые проиндексированы Гуглом. Вместо 940-ка сначала получил значение 779-ть, последней страницей выдачи оказалась 43-я, причём с 35-й страницы в теле сниппетов появлялась запись «Описание веб-страницы недоступно из-за ограничений в файле robots.txt«. То есть реально Гугл индексирует всего лишь примерно 350-т страниц!

Начал разбираться. Файл robots.txt не редактировал, он у меня стандартный — просмотрел его текст, но ничего странного не заметил — последние две строки, как положено, указывают путь к двум файлам Sitemap. Странно то, что файлы Sitemap не менялись с 31.03.2014

Деактивировал плагин Google XML Sitemaps, который должен формировать два файла Sitemap. Снова активировал плагин, но он не сформировал новые файлы Sitemap. Деактивировал плагин Google XML Sitemaps

Подобрал другой плагин: Sitemap — сразу активировал его. Понаблюдаю за его действиями и попытаюсь наладить обновление двух файлов Sitemap, чтобы облегчить деятельность поисковых роботов и нарастить число страниц, нормально проиндексированных Гуглом.


Странная наблюдается ситуация: в панели управления хостинга два файла Sitemap не видны, но по адресу http://ep-z.ru/sitemap.xml файл виден. Снова активировал плагин Google XML Sitemaps, предварительно деактивировав плагин Sitemap.

Хотя прошёл слушок, что вскоре Гугл перестанет функционировать в России, пренебрегать трафиком с него не имеет смысла. За последние 30-ть суток Гугл дал 10,88 % посетителей (2160-т), что примерно в 8-мь раз меньше, чем Яндекс.

Самый быстрый и верный способ узнать число страниц, проиндексированных Яндексом, — заглянуть на страницу Мои сайты панели Вебмастера Яндекса по адресу http://webmaster.yandex.ru/sites/ Само собой разумеется, что сайт предварительно должен быть внесен в список сайтов!

Когда-то пришёл к выводу, что проще всего определить число страниц, проиндексированных Яндексом, если обратиться по адресу типа http://yandex.ru/search/?text=site%3Aep-z.ru&clid=9403&lr=213&p=99, но сейчас это не срабатывает: выдаёт ошибку 404.

Индексация страниц сама по себе мало что значит, ибо посетители на страницы сайта приходят, в основном, из так называемого ТОП10, то есть с первой страницы поисковой выдачи. Поэтому надо стараться, чтобы созданные страницы поскорее попадали в ТОП10.

Сколько времени нужно, чтобы страница попала в ТОП10? Иногда мне удавалось этого добиться за 30-ть, а за 55-ть суток удавалось вывести страницу на 1-е место в Яндексе по высокочастотному запросу! Крайний пример можете посмотреть на странице Как сделать быстрый сайт.


Многие страницы этого сайта побывали на первой позиции Яндекса, но с течением времени потеряли её — чтобы этого не происходило, нужно, как мне представляется, регулярно обновлять и совершенствовать эти страницы, обращая особое внимание на привлекательность Сниппета, ибо от него зависит переход на страницу.

В 2016-м году заметил, что Яндекс отказывается индексировать более тысячи страниц на моём сайте, причём это относится не только к моему сайту.

29-го апреля 2016-го года на сайте опубликовано 1124-ре страницы, Site-Auditor версии 3.0.12.beta сообщает, что Google проиндексировал 1240-к страниц, а Bing — 1120-ть страниц. Проверка показала, что Google проиндексировал 390-то страниц, а Bing — 1000-чу страниц, как и Яндекс. Получается, что полностью верить Site-Auditor версии 3.0.12.beta нельзя!

3-го ноября 2018-го года установил Site-Auditor версии 3.0.24.beta — она мне нравится меньше старых версий.

Откровенно говоря, индексация страниц сайта перестала меня волновать: поисковые системы прекрасно справляются с этим.

Если Вам нужно продвинуть страницу в ТОП10, посетите страницу Услуги.

Приглашаю всех высказываться в Комментариях. Критику и обмен опытом одобряю и приветствую. В хороших комментариях сохраняю ссылку на сайт автора! И не забывайте, пожалуйста, нажимать на кнопки социальных сетей, которые расположены под текстом каждой страницы сайта.

ИндексацияПродолжение тут…

ep-z.ru


Почему при индексации стоит, прежде всего, ориентироваться на Гугл и Яндекс

Поисковые системы Яндекс и Google зарекомендовали себя как лучшие и, соответственно, популярные поисковые системы.Индексация сайта

Это обусловлено тем, что уровень развития основных характеристик «поисковиков» превосходит все остальные представленные на сегодняшний день системы:

  • Точность — насколько найденные системой документы соответствуют запросу. Например, при введении пользователем в строку поиска «купить шубу» «поисковик» выводит 90-100% процентов с приведенным невидоизмененным сочетанием этих слов. Чем выше процент схожести, тем лучше.
  • Полнота — количество документов, относительно всех имеющихся в сети по этой теме, которые выдает пользователю система. Если всего в сети условно находится 100 документов по вопросу «Еда для ребенка 1 года», а «поисковик» предоставил к рассмотрению всего 70, полнота будет равна 0,7. «Выигрывает» система поиска с большим значением.

  • Скорость поиска связана с техническими характеристиками и возможностями каждого «поисковика». Чем она выше, тем больше пользователи будут удовлетворены работой системы.
  • Наглядность поиска — это качество представления информации по запросу, подсказки системы относительно тех документов, которые нашлись по запросу. Это наличие упрощающих работу элементов на странице выдачи результатов.
  • Актуальность — характеристика, обозначающая временной промежуток между получением информации и занесением в базу индекса. У крупных поисковиков существует так называемая «быстрая база», позволяющая в сжатые сроки индексировать новую информацию.

livesurf.ru

Как происходит индексация сайта поисковыми системами?

Прежде всего, индексация сайта в поисковых системах – важная составляющая продвижения сайта. От того, как быстро сайт будет проиндексирован, зависит его появление на страницах поисковых систем. Для индексации существуют специальные поисковые «роботы», которые регулярно заходят на сайты и анализируют данные. И если пользователю видна только визуальная и информативная составляющая сайта, то «робот» анализирует весь его html-код. Поэтому при поисковом продвижении сайта следует учитывать правильное заполнение всех тегов (теги <title>, <description>, <H1>, <р> и так далее), грамотное размещение текста на странице, перелинковку, создание карты сайта, наличие микроразметки.

Индексацию можно осуществить несколькими способами:


  1. Создать сайт, наполнить его контентом, заполнить теги и ждать поискового робота, который автоматически проиндексирует каждую страничку и внесет их в базу. Для быстроты индексации можно оставить ссылку на сайт на авторитетных ресурсах, тогда робот, перейдя по ней, проиндексирует страницы. Это может потребовать определенных затрат, так как на популярных сайтах и порталах, либо запрещено оставлять ссылки на другие ресурсы, либо эта услуга платная.
  2. Самостоятельно заполнить форму на индексирование вашего ресурса в поисковой системе. В этом случае сайт встанет в очередь на индексацию и через некоторое время робот будет отправлен по указанному вами адресу. Этот процесс может затянуться, но зато он бесплатный и не требует особых усилий. Вот адреса для заполнения форм:
  1. Третий способ – совмещенный. Это совокупность первого и второго метода, когда заполняется форма в ПС и устанавливаются ссылки на ваш сайт на других ресурсах.
  2. Четвертый способ – ничего не делать и ждать, когда поисковые роботы самостоятельно проиндексируют страницы сайта. Это самый длительный по времени способ.

Не следует забывать о том, что если поисковый робот посетил ваш новый сайт, то будут проиндексированы не все страницы сразу. Запаситесь терпением и ждите, роботы периодически будут заходить и индексировать страницы, а также проверять их на изменения и соответствие требованиям поисковиков. Так как поисковых систем несколько (Google, Rambler, Яндекс и так далее), то и индексация сайта в разных поисковиках займет разное время. Правильность настройки HTTP-заголовков страниц может существенно повлиять на индексацию, поэтому к этому вопросу следует подойти с профессиональной точки зрения, а лучше доверить дело профессионалам. В SEO.RU используют свои методы ускорения и проверки индексации сайта в поисковых системах, что выгодно отличает нашу компанию от других.

Как проверить индексацию сайта в поисковых системах Яндекс и Google

Проверка индексации сайта в поисковых системах (включая подсчет числа проиндексированных страниц) проводится несколькими способами:

  1. Запросить название своей организации в поисковике и вручную проверить каждую ссылку на первой и второй страницах. Не очень удобно, не очень быстро.
  2. Запросить в поисковике URL своего сайта с правильным оператором – site. Например, проверим в Яндексе индексацию сайта seo.ru:

индексация сайта в Яндексе

«Нашлось 412 результатов» – значит, 412 страниц сайта Яндекс проиндексировал.

Обратите внимание, что в Яндексе существует два варианта подобных операторов:

  • вышеописанный site: – когда поиск производится по всем поддоменам и страницам указанного сайта;
  • более точный host: – когда поиск идет по страницам, размещенным на данном хосте, в таком случае запрос уже будет выглядеть вот так: host:seo.ru | host:www.seo.ru.

То же самое запросим в Google:

индексация сайта в Google

«Результатов: примерно 416» – проиндексировано 416 страниц.

Как запретить сайт к индексации?

На сайт можно наложить запрет к индексации. Делается это с помощью файла robots.txt, содержимое которого заполняется так:

User-agent: * – директива для выбора поисковой системы, где * – это все поисковики; если нужно запретить к индексации от какого-то одного поисковика, прописывается его название на латинице (Google, Yandex и так далее);

Disallow: / – закрываем сайт от поисковиков.

Напомним, файл robots.txt должен находиться в корневой папке сайта.

seo.ru

Индексация сайта в Яндексе

Яндекс

Что бы добавить сайт для индексации в Яндекс (Yandex.ru) достаточно вести его адрес в специальную форму addurl (англ. addurl — добавить URL). Вебмастера прозвали ее адурилкой. Находится она тут: webmaster.yandex.ru/addurl.xml

Для добавления сайта на индексацию достаточно ввести url главной страницы и капчу. Капча — это несколько цифр, которые защищают от автоматических регистраций. После того как вы нажмете кнопку «добавить» возможно несколько вариантов развития событий.

1) Сообщение «ваш сайт добавлен» сигнализирует об успешном добавлении ресурса в очередь на индексацию в Яндекс.

2) Если появилась надпись «Ваш хостинг не отвечает» — значит, ваш сервер лежит в этот момент. Можно попробовать добавить сайт позже или найти более качественный хостинг.

3) А вот если появилось сообщение, что «указанный URL запрещен к индексации» то дела плохи. Это говорит о том, что на ваш ресурс наложены санкции в виде бана сайта. Вполне возможно, что на купленном вами домене уже когда-то был сайт, который и получил санкции. При помощи addurl вебмастера часто проверяют сайты на бан в Яндексе.

Индексация сайта в Google (Гугле)

Google

Следующая по значимости для нашего сайта идет поисковая система Google (Гугл). Процесс добавления на индексацию сайта в Google точно такой-же как на Yandex. В Гугле тоже есть своя адурилка, которая расположена по адресу: https://www.google.com/webmasters/tools/submit-url.

Так же надо ввести капчу при добавлении. Но есть два отличия. Если в Яндексе можно просто добавить урл без лишних телодвижений, то в Google надо быть залогиненым в своем аккаунте. Иначе не получится. Соответственно если аккаунта у вас там еще нет, его придется завести. Второе отличие Google от Яндекса это скорость индексации. Google очень быстро индексирует сайты.

Индексация сайта в Рамблере (Rambler.ru)

Rambler

Конечно, Рамблер уже не тот, что раньше, как скажут многие, и дает совсем немного трафика. И все равно, зачем им пренебрегать? Процесс индексации сайта в Rambler самый затяжной, среди других отечественных поисковых систем. Да и его адурилка уже давно не работает, она была по адресу: robot.rambler.ru/cgi-bin/addsite.cgi

Он уже давно использует поисковую базу Яндекса. Поэтому, что бы попасть в индекс Rambler.ru достаточно добавиться в Яндекс.

Индексация сайта в Mail.ru (Майл)

Mail.ru

Поисковая система Mail.ru тоже имеет кабинет вебмастера. Добавление сайта на индексацию в Mail.ru происходит через форму addurl, которая расположена по адресу: go.mail.ru/addurl

Причем как и у гугла, что бы сделать заявку на индексирование, нужно завести свой аккаунт и войти в него. Иначе не выйдет. Майл в последнее время старается развивать свои собственные инструменты для вебмастеров.

Выше мы рассмотрели основные отечественные поисковики, в которых нам желательно проиндексировать свой сайт. Идущие далее ПС приведу скорее для вашей общей SEO-эрудиции, чем для конкретных действий.

Поисковая система Aport.ru (Апорт)

Aport.ru

Aport.ru когда-то был поисковой системой, со своей индексной базой и адурилкой. Сейчас из него сделали товарный поисковик, в котором можно сравнивать цены на товары и услуги.

Поисковая система Nigma.ru (Нигма)

Nigma.ru

Nigma.ru это наша русская интеллектуальная поисковая машина. Суммарный объем ее трафика порядка трех миллионов запросов в сутки. Очевидно, что не надо пренебрегать трафиком из Нигмы. Добавить свой сайт на индексацию в Нигму можно на странице nigma.ru/index_menu.php?menu_element=add_site.

Медиа навигатор Tagoo.ru

Tagoo.ru

Система Tagoo.ru представляет собой медийный поисковик, который ищет медиа данные. Это музыкальный контент, видеоролики и программы. Что бы ваш сайт был проиндексирован системой Tagoo, нужно воспользоваться формой добавления: tagoo.ru/ru/webmaster.php?mode=add_site.

Поисковая система Turtle.ru (Черепаха)

Turtle.ru

Международный поисковик Turtle (Черепаха) осуществляет поиск по странам СНГ на любом языке. Для индексации принимаются ресурсы расположенные на таких доменных зонах как: ru, su, ua, am, az, ge, by, kz, kg, uz, md. Что бы добавить сайт на индексацию в черепахе нужно воспользоваться адурилкой: http://www.turtle.ru/add.html. Желательно дождаться вывода сообщения о принятии вашего сайта. Может не добавить, а вы и знать не будете.

Зарубежные поисковые системы

Если выше были отечественные поисковые системы, то ниже будет список зарубежных поисковых систем.

Поисковая система Yahoo.com (Яху)

Yahoo.com

Yahoo это один из первых поисковиков, появившихся в Интернет. Про нее слышали наверно все люди, так или иначе связанные с Интернетом. Добавить сайт в Яху можно тут search.yahoo.com/info/submit.html.

Поисковая система Bing.com (Бинг)

Bing.com

Поисковая система Bing принадлежит корпорации Microsoft и была создана на замену Live Search. Майкрософ надеется, что новое детище окажется намного популярнее предшественника. Если вы хотите индексации своего сайта ПС Bing.com, это это можно сделать на странице http://www.bing.com/toolbox/submit-site-url.

Украинские поисковые системы

И в заключении моего обзора приведу две популярных поисковых системы на Украине.

Украинская поисковая система Meta.ua (Мета)

Meta.ua

Что бы добавить свой сайт на индексацию в поисковую систему Meta там сначала надо пройти регистрацию. После того как вы войдете в свой аккаунт, добавить сайт можно будет на странице web.meta.ua/?action=add. Правда поисковиком принимаются только украинские web-сайты.

seob.info

  1. Добавьте сайт в Яндекс.Вебмастер.

  2. Sitemap. Для удобства вебмастеров и поисковых систем был разработан специальный формат карты сайта — sitemap. Это список ссылок на внутренние страницы сайта, представляемый в формате XML. Этот формат поддерживает и Яндекс. В специальном разделе сервиса можно загрузить sitemap для вашего сайта. Это позволит влиять на приоритет обхода роботом некоторых страниц вашего сайта. Например, если какие-то страницы обновляются гораздо чаще, чем другие, следует указать эту информацию, чтобы робот Яндекса правильно планировал свою работу.

  3. Robots.txt — файл, предназначенный для роботов поисковых систем. В этом файле вебмастер может указать параметры индексирования своего сайта как для всех роботов сразу, так и для каждой поисковой системы по отдельности. Рассмотрим три наиболее важных параметра, которые можно указать в этом файле:

    Disallow
    Эта директива используется для запрета от индексирования отдельных разделов сайта. С ее помощью необходимо закрывать от индексирования технические и не представляющие ценности ни для пользователя, ни для поисковых систем страницы. К ним относятся:
    Подробнее об этом см. в разделе Использование файла robots.txt.
    Crawl delay
    Позволяет указать индексирующему роботу минимальный промежуток времени (в секундах) между обращениями к страницам сайта. Этот параметр полезен для крупных проектов, содержащих десятки тысяч страниц и более. Поисковый робот Яндекса при индексировании может создать на такой сайт большую нагрузку, что может вызвать перебои и задержки в работе сайта, поэтому, возможно, вам следует ограничить количество обращений в секунду. Например, директива Crawl-delay: 2 укажет роботу, что он должен выжидать 2 секунды между обращениями к серверу.
    Clean param
    С помощью этой директивы можно указать роботу, какие cgi-параметры в адресе страницы следует считать незначащими. Иногда адреса страниц содержат идентификаторы сессий — формально страницы с разными идентификаторами различаются, однако их содержимое при этом одинаково. Если таких страниц на сайте много, индексирующий робот может начать индексировать такие страницы, вместо того чтобы скачивать полезное содержимое. Подробнее об этом см. в разделе Использование файла robots.txt.
  4. Яндекс индексирует основные типы документов, распространенных в Сети. Но существуют ограничения, от которых зависит, как будет проиндексирован документ, и будет ли проиндексирован вообще:

    • Большое количество cgi-параметров в URL, большое количество повторяющихся вложенных директорий и слишком большая общая длина URL может привести к ухудшению индексирования документов.

    • Для индексирования важен размер документа — документы больше 10Мб не индексируются.

    • Индексирование flash:

      1. индексируются файлы *.swf, если на них есть прямая ссылка или они встроены в html тегами object или embed ;

      2. если flash содержит полезный контент, исходный html документ может быть найден по контенту, проиндексированному в swf файле.

    • В документах PDF индексируется только текстовое содержимое. Текст, представленный в виде картинок, не индексируется.

    • Яндекс корректно индексирует документы в формате Open Office XML и OpenDocument (в частности, документы Microsoft Office и Open Office). Но следует учитывать, что внедрение поддержки новых форматов может занимать некоторое время.

    • Допустимо использование тегов <frameset> и <frame>, робот Яндекса индексирует контент, подгружаемый в них, и позволяет найти исходный документ по содержимому фреймов.

  5. Если вы переопределили поведение сервера для несуществующих URL, убедитесь, что сервер возвращает код ошибки 404. Получив код ответа 404, поисковая система удалит данный документ из индекса. Следите, чтобы все нужные страницы сайта отдавали код 200 OK.

  6. Следите за корректностью HTTP-заголовков. В частности, важно содержание ответа, который сервер отдает на запрос «if-modified-since». Заголовок Last-Modified должен отдавать корректную дату последнего изменения документа.

  7. Версии сайта, адаптированные для просмотра на мобильных устройствах, лучше выносить на поддомен, так же, как и версии сайта на различных языках.

К следующему разделу

yandex.ru

Индексация сайта — что находится в начале

Если театр начинается с вешалки, то индексирование с того, что роботу поисковой системы необходимо сообщить, что в интернете появился новый ресурс. Сделать это можно двумя способами:

  1. Зарегистрировать сайт в поисковой системе вручную Яндексу (webmaster.yandex.ru/addurl.xml), Google (www.google.com/webmasters/tools/submit-url?hl=ru) и других поисковых системах, если они вас интересуют.
  1. Дать ссылку на сайт со стороннего интернет-ресурса (разумеется, тот уже должен быть зарегистрирован).

Первый способ предпочтительнее, так как в этом случае первая индексация с большой вероятностью произойдет раньше.

Отчего зависит частота индексирования и как ее ускорить

businessman hand touch virtual graph,chart, diagram

Сейчас в базе данных Яндекса больше триллиона (!) веб-адресов (каждая страница любого сайта имеет свой адрес). Разумеется, проиндексировать всю эту махину за один день — задача нереальная. Поэтому следует понимать, что индексация сайта происходит не каждый день, а с определенной периодичностью. Причем эта периодичность — величина непостоянная и зависящая от ряда факторов. И на практике получается, что одни ресурсы ПС индексируют чуть ли не ежедневно, а для других — поисковый робот редкий гость. Поэтому очень желательно, предпринять ряд действий, чтобы интервал между индексациями уменьшить. Тогда вы эффективнее будете продвигать свой сайт, так как быстрее сможете видеть результаты своих действий на нем и, соответственно, быстрее вносить коррективы.

Что влияет на эту оперативность?

  1. Загруженность сервера, где расположен сайт. Если он загружен множеством сайтов, а его технические характеристики не позволяют оперативно передавать информацию поисковому роботу, то последний будет его посещать реже. Отсюда рекомендация — хотите быстрой индексации, разместите свой интернет-ресурс на качественном хостинге.
  2. Частота обновления веб-страниц и всего сайта в целом. Чем чаще происходят обновления, тем чаще робот будет приходить на такой ресурс. Все вполне логично. Смысл часто приходить туда, где ничего не происходит? Только следует знать один нюанс. Робот будет приходить именно на те страницы, которые часто и обновляются. То есть, если хотите, чтобы оперативно оценивалась информация на главной странице вашего сайта ее и регулярно обновляйте. Самый простой способ — разместить на ней блок новостей.
  3. Посещаемость сайта и поведенческие факторы его посетителей. То есть, если посещаемость высокая и люди на ресурсе задерживаются долго, совершают внутренние переходы, то интервал между индексациями, безусловно, уменьшится.

Как видите, на все эти три фактора можно влиять в благоприятную для владельца  сайта сторону.

Как узнать, что страница в индексе

uznat-indeksaciju

Это далеко не праздный вопрос и не из серии: «Лучше любая информация, чем неизвестность». Ведь если точно знать, что индексация прошла, а позиции вашего сайта в выдаче не изменились, значить что-то вы делаете не так.

Проверить индексацию сайта можно несколькими способами:

  1. На сервисе Яндекс.Вебмастер («Проверить URL»). Здесь можно узнать:
    • когда произошла последняя индексация;
    • какой документ показывается посетителю в результате поиска;
    • рекомендации по ускорению индексации;
    • если страница отсутствует в поиске, то по каким причинам.
  2. Провести поиск при помощи следующего выражения: url:интересующий url, например, url: moi sairu/contacts
  3. Поиск при помощи оператора site:. Например, записав в поисковую строку site: moi site.ru вы получите список всех страниц вашего сайта, которые были проиндексированы.
  4. Проверить индексацию списка URL в SE Ranking.

Сервис SE Ranking предлагает также инструмент отслеживания выдачи заданного URL в поиске. Так что вы всегда будете знать, не выпала ли интересующая страница из индекса, а также выдается ли нужная страница по конкретному поисковому запросу.

Как управлять поисковым роботом

Поисковая система скачивает информацию с сайта по строго определенному плану. Тут нет места импровизации. А где она берет этот план? Да на самом интернет-ресурсе! То есть вы можете указать ПС, что и как скачивать или не скачивать.

Файл robots.txt

robots.txt-indeksacija

Очень важный файл, в котором можно указать, какие страницы нельзя индексировать. Это очень важно, так как ни в коем случае нельзя позволять ПС считывать личную информацию пользователей: номера телефонов, паспортные данные, если таковые имеются и т. д. В противном случае владельцу сайта могут грозить крупные неприятности. Также, если у вас социальная сеть, особенно посвященная знакомствам, необходимо запретить индексацию страниц, где могут содержаться личные данные пользователей. Например, строка Disallow:/admin запретит роботу просматривать страницы, урл которых начинается со слова admin, а Disallow:/images запретит индексировать картинки.

Обязательно в robots.txt укажите адрес карты сайта sitemap. В этом случае вы будете уверены, что робот увидит все страницы вашего сайта, индексация которых не запрещена.

Типичные ошибки в файле robots.txt

  1. Ошибочный запрет к индексации некоторых страниц сайта.
  2. Код HTTP-ответа отличный от 200. Например, если при запросе страницы с файлом robots.txt поисковый робот получит HTTP-ответ, равный 403 («запрещено»), то он полностью проигнорирует содержимое файла robots.txt, в том числе  на запрет индексации определенных страниц.
  3. Наличие кириллических символов в файле. Особенно часто такая ошибка стала появляться, когда появилась возможность записывать урл кириллическими буквами. Например, если в директиве Host (указывает на главное зеркало сайта) написать лютикицветочки.рф, то такая запись будет проигнорирована. В таких случаях необходимо такие урл передавать в юникоде.
  4. Размер файла txt превышает 32 кб.

В завершении по robots.txt заметим, что не обязательно сайт должен его иметь.  Для простых одно-двухстраничных интернет ресурсов, например, лендинг пейдж такой файл будет лишним. Если же у вас он есть, то корректность его содержимого можно проверить на странице Яндекс.Вебмастер — webmaster.yandex.ru/robots.xml.  Загружаете файл в специальную форму и видите, какие ошибки в нем есть.

Файл sitemap

sitemap-indeksacija

В этом файле указывается, какие страницы подлежат индексации. Конечно, указать на них поисковому роботу можно и другими способами. Например, навигацией меню, «хлебные крошки», внутренней перелинковкой.

Но, во-первых, если у вас есть лендинг пейдж, на которую можно попасть только по внешней ссылке, то проиндексировать ее можно только с помощью sitemap.

Во-вторых, в sitemap при помощи:

  • тега <priority> можно указать приоритет индексации;
  • тега <changefred> частоту обновления конкретной страницы.

Эта информация не директивная для  робота, но обязательно будет принята им во внимание.

Типичные ошибки в файле sitemap

  1. Размещение sitemap на другом сайте. Часто это бывает, когда используется сервис для генерации такой файла. В этом случае сервис размещает карту вашего сайта у себя.
  2. На странице, где находится карта сайта, установлен редирект.
  3. Критические ошибки внутри файла sitemap. Например, отсутствует строка с указанием кодировки.

Проверить правильность файла sitemap на странице Яндекс.Вебмастер —  webmaster.yandex.ru/ sitemaptest.xml.

Во второй части статьи: « Принципы индексирования сайта. Часть  2» мы поговорим о принципах работы с зеркалами, о дублях страниц, об ошибках при использовании HTTP-кодов. И еще раз подчеркнем, что правильная настройка индексации сайта может существенно помочь его продвижению.

seranking.ru

Что такое индексация

Процесс добавления роботами собранной информации в базу называется индексацией. Затем данные определенным образом обрабатываются и создается индекс – выжимка из документов. Процесс заполнения индекса осуществляется одним из двух способов: вручную или автоматически. В первом случае владелец ресурса должен самостоятельно добавить URL веб-ресурса в специальную форму, которая есть у «Яндекса», Google и других поисковых систем. Во втором робот сам находит сайт, планомерно переходя по внешним ссылкам с других площадок или сканируя файл-карту sitemap.xml.

Первые попытки индексировать веб-ресурсы были сделаны еще в середине 90-х годов прошлого столетия. Тогда база данных была похожа на обычный предметный указатель, в котором содержались ключевые слова, найденные роботами на посещенных ими сайтах. Почти за 30 лет этот алгоритм был значительно усовершенствован и усложнен. Например, сегодня информация перед попаданием в индекс обрабатывается по сложнейшим вычислительным алгоритмам с привлечением искусственного интеллекта.

Зачем индекс поисковым системам

Индексация страниц сайта – неотъемлемая часть работы поисковых систем (не только Google и «Яндекса», но и всех остальных). База, полученная в процессе сканирования веб-ресурсов, используется для формирования релевантной выдачи. Основные роботы поисковых систем:

  • основной – сканирует весь контент на сайте и его отдельных страницах;
  • быстрый – индексирует только новую информацию, которая была добавлена после очередного обновления.

Также существуют роботы для индексации rss-ленты, картинок и др.

При первом посещении в базу попадают все новые сайты, если они подходят под требования поисковой системы. Во время повторного визита информация лишь дополняется деталями.

Скорость индексации страниц

Чем быстрее происходит добавление страницы в индекс, тем лучше для веб-ресурса. Однако поисковые роботы не могут выполнять такой большой объем работы так же часто, как обновляется наполнение сайтов. Индексация в «Яндекс» в среднем занимает одну-две недели, а в Google – несколько дней. С целью ускорения индексации ресурсов, для которых очень важно быстрое попадание информации в базу (новостные порталы и т. д.), применяется специальный робот, посещающий такие сайты от одного до нескольких раз в день.

Как проверить индексацию в «Яндексе» и Google

Воспользоваться информацией из панели веб-мастеров. В списке сервисов Google откройте Search Console, а затем перейдите в раздел «Индекс Google». Нужная информация будет находиться в блоке «Статус индексирования». В «Яндекс.Вебмастер» необходимо перейти по следующей цепочке: «Индексирование сайта» — «Страницы в поиске». Еще один вариант: «Индексирование сайта» — «История» — «Страницы в поиске».

Задать поиск по сайту с использованием специальных операторов. Для этого используйте запрос с конструкцией «site:», указав далее адрес вашего ресурса в полном формате. Так вы узнаете количество проиндексированных страниц. Серьезные расхождения в значениях (до 80 %), полученных в разных поисковых системах, говорят о наличии проблем (например, веб-ресурс может находиться под фильтром).

Установить специальные плагины и букмарклеты. Это небольшие дополнения для браузера, которые позволяют выполнить проверку индексации страниц сайта. Одним из самых популярных среди них является RDS Bar.

Как ускорить индексацию

На скорость индексации сайта прямо влияют несколько факторов:

  • отсутствие ошибок, замедляющих процесс сбора информации поисковым роботом;
  • авторитетность ресурса;
  • частота обновления контента на сайте;
  • частота добавления нового контента на сайт;
  • уровень вложенности страниц;
  • корректно заполненный файл sitemap.xml;
  • ограничения в robots.txt.

Чтобы ускорить индексацию сайта, выполните ряд правил:

  • выберите быстрый и надежный хостинг;
  • настройте robots.txt, установив правила индексации и сняв ненужные запреты;
  • избавьтесь от дублей и ошибок в коде страниц;
  • создайте карту сайта sitemap.xml и сохраните файл в корневой папке;
  • по возможности организуйте навигацию таким образом, чтобы все страницы были в 3 кликах от главной;
  • добавьте ресурс в панели веб-мастеров «Яндекса» и Google;
  • сделайте внутреннюю перелинковку страниц;
  • зарегистрируйте сайт в авторитетных рейтингах;
  • регулярно обновляйте контент.

Дополнительно рекомендуем оценить объем flash-элементов с точки зрения их влияния на продвижение. Наличие визуальных объектов этого типа значительно снижает долю поискового трафика, так как не дает роботам выполнить индексацию в полной мере. Также не желательно размещения ключевой информации в PDF-файлах, сохраненных определенным образом (сканироваться может только текстовое содержимое документа).

wiki.rookee.ru

Индексация сайта в поисковых системах

Как узнать проиндексирован ли сайт?

Первое, что нужно сделать — узнать проиндексирован ли сайт поисковыми системами. Может быть так, что сайт просто не находится на первой странице поиска по тому запросу, которые Вы вводили. Это могут быть высокочастнотный запросы, чтобы показываться по которым нужно работать над SEO-продвижением, а не просто сделать и запустить сайт.

Итак, для проверки заходим во все поисковые системы, в которые имеет смысл заходить (Яндекс, Гугл, Мэйл, Рамблер) и в строку поискового запроса вводим адрес сайта.

Индексация сайта в поисковых системах

Если Ваш ресурс ещё не был проиндексирован — в результатах выдачи ничего не будет показано, либо покажутся другие сайты.

Как проиндексировать сайт в Яндексе?

Для начала расскажем, как проиндексировать сайт в Яндексе. Но прежде чем, добавить свой ресурс, проверьте, чтобы он корректно работал, правильно открывался на всех устройствах и содержал только уникальный контент. Например, если добавить сайт на стадии разработки, можно просто угодить под фильтр — с нами один раз такое случалось и пришлось ждать целый месяц, чтобы Яндекс понял, что у нас качественный сайт и снял санкции.

Чтобы сообщить Яндексу о новом сайте, необходимо добавить его в Яндекс Вебмастер и установить Яндекс Метрику, первый инструмент отвечает за дополнительную информацию о ресурсе (регион, структура, быстрые ссылки) и тот, как сайт выглядит в результатах органической выдачи, второй за сбор данных по сайту (посещаемость, поведение и прочее), что согласно нашем опыту, так же оказывает влияние на индексацию сайта и его позиции в поиске. А ещё обязательно сделайте карту сайта и укажите её в панели вебмастеров.

Как проиндексировать сайт в Google?

Чаще всего Гугл сам достаточно оперативно находит новые сайты и загоняет их в поиск, но ждать, когда Google придёт и сделает за нам всю работу — слишком самонадеянно, поэтому давайте разберёмся, как проиндексировать сайт в Google.

Сначала добавляем сайт в Search Console — это панель вебмастеров Google, и устанавливаем Google Analitycs. Придерживаемся тех же целей — дать максимум информации о сайте поисковым системам.

После того, как сайты добавлены, должно пройти от 3 до 7 дней, прежде чем поисковики обновят данные и проиндексируют сайт.

Как ускорить индексацию страниц сайта в поисковых системах?

Всегда хочется, чтобы новые страницы сайта, стали показываться в результатах поиска, как можно быстрее и для этого есть несколько секретных (и очень простых) способов, как ускорить индексацию страниц сайта в поисковых системах.

  1. Разместите ссылки на новую статью или страницу в социальных сетях и попросите подписчиков поделиться ей с друзьями. В каких социальных сетях размещать ссылки? Во всех, от ВКонтакте до Моего Мира, учитывайте при этом, что Яндекс больше ориентируются на российские соц.сети (ВК, одноклассники), а Google на западные (FB, Twitter). Так же о сообщить о публикации нового материала можно на своём канале в мессенджерах.
  2. В панели вебмастеров Яндекса зайдите в раздел Индексирование и затем во вкладку переобход страниц. Здесь Вы можете указывать до 20 новых адресов, которые бот должен посетить в первую очередь. Так же этим способом можно воспользоваться, если требуется заново проиндексировать страницу (поменялся адрес, добавился/обновился контент).

Как ускорить индексацию страниц сайта в поисковых системах?

3. Чтобы проделать манипуляцию описанную во 2-м пункте, только для поисковой системы Google, заходим в Search Console. Выбираем «Сканирование» и «Посмотреть, как Googlebot» -добавляем адрес новой страницы и нажимаем «Сканировать», после этого запрашиваем индексацию.

QIP Shot - Screen 166

Анализ индексации сайта

В завершении необходимо отметить, что даже после успешной индексации сайта в поисковых системах, на этом работа не заканчивается. Необходимо периодически делать анализ индексации сайт, а так же снимать позиции по популярным запросам. Это позволит держать руку на пульсе и не оказать в ситуации, когда значительная часть трафика из органической выдаче просто исчезла.

Так случилось со многими старыми сайтами, которые использовали старые методы продвижения, после выхода алгоритма Яндекса Баден-Баден. При этом, Яндекс заранее сообщил о том, что запускает этот алгоритм и переоптимизированные страницы будут исключены из поиска, а тот же Google, никогда не сообщает о выходе новых алгоритмов. Поэтому только неустанный контроль позволит оставаться лидером тематики или стать им!

internet-marketings.ru


You May Also Like

About the Author: admind

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *

Этот сайт использует Akismet для борьбы со спамом. Узнайте как обрабатываются ваши данные комментариев.