Создать сайтмап


Sitemap – это веб-страница, отображающая полную информацию обо всех страницах сайта, которые нужны для поисковых роботов. Кто-то скажет, что она и не нужна, ведь все разделы уже отображаются. Однако необходимость такой страницы существует в том случае, если на сайте содержится пятьдесят страниц и больше. Для поисковиков и для пользователей она будет служить путеводителем, помогающим понять, где содержится та или иная информация.

XML- и HTML-файлы

Так как карта сайта используется не только для поисковых роботов, но и для пользователей, посещающих сайт, обычно составляют две карты: в XML- и HTML-форматах.

Чтобы создать Sitemap для поисковых роботов, используют XML-файл. Благодаря ему роботы заносят в свою поисковую базу новые проиндексированные страницы. При отсутствии карты на многостраничном сайте большое количество страниц может не индексироваться на протяжении иногда очень долгого времени.

Для создания карты сайта для пользователей используется HTML-файл. Важность этой карты заключается в том, что от ее удобства напрямую зависит, найдет ли пользователь интересующую его информацию или нет. Поэтому такую карту создают для тех интернет-проектов, у которых все разделы и их подразделы не помещаются в главном меню.

Существует три способа решения данной задачи:


  • Покупка генератора для карты сайта.

  • Создать Sitemap при помощи онлайн-сервисов.

  • Ручное написание файла.

Для существенной экономии времени предлагается приобретение генераторов. Поэтому если двадцать — тридцать долларов для покупки лицензии являются для веб-мастера мелкой тратой денег, то купить его, особенно для крупного интернет-ресурса, все-таки не помешает, так как не нужно будет тогда создавать сайт вручную.

Для сайта, содержащего несколько сотен страниц, рекомендуются онлайн-сервисы, где для того, чтобы создать Sitemap, необходимо будет лишь указать адрес интернет-ресурса и загрузить результат.

Самым верным вариантом является ручное создание карты. Для этого нужно знать такие теги, как url, urlset, loc, lastmod, changefreg и priority. При этом первые три тега считаются обязательными, а без последних трех можно и обойтись.

Чтобы на сайте создать Sitemap, Joomla и WordPress имеют специальные дополнения, как и большинство известных систем администрирования, благодаря которым карта сайта создается вручную или автоматически. Для крупных интернет-проектов, у которых постоянно обновляются материалы, такое дополнение очень удобно.

В «Джумле» оно называется Xmap, в WordPress – Google XML Sitemaps.

Автоматически создать Sitemap помогают бесплатные онлайн-серверы, если страниц сайта насчитывается не более пятисот. Вот как легко проводится генерация карты сайта:


  • Зайдя на один из таких интернет-ресурсов, нужно найти пункт «Генерация Sitemap», нажать на кнопку «Создать» и создать файл Sitemap автоматически.

  • Найти «URL сайта» и ввести там адрес сайта, для которого создается карта.

  • Возможно, система потребует введение проверочного кода. Его нужно также ввести и нажать «Старт».

  • Готовую карту загрузить на сайт.

Ручной способ создания карты

Такой способ является, с одной стороны, самым трудным, отнимающим драгоценное время, но с другой стороны, это самый верный способ, применяющийся в тех случаях, когда другие варианты не подходят. Так, например, если есть много страниц, в занесении в карту сайта которых нет особой необходимости, но автоматически они, конечно, туда попадают, ручной способ избавит карту от «передозировки» таких страниц. Другой причиной, по которой выбирают этот способ, является плохая навигация сайта.

Для реализации ручного создания карты необходимо:


  • Собрать страницы для включения их в карту.

  • В excel-файл вставить все адреса в третий столбик.

  • В 1-м и 2-м столбиках вставить и url и loc.

  • В 4-м и 5-м столбиках вставить закрывающие url и loc.

  • Применить функцию «сцепить» для соединения пяти столбиков.

  • В текстовом редакторе сделать sitemap.xml.

  • Добавить в этот файл теги и urlset и /urlset.

  • Вставить между ними соединенный столбик.

  • Все сохранить.

Получившийся файл необходимо проверить. Сделать это можно, например, в «Яндексе», в панели веб-мастера.

Как создать Sitemap для «Яндекса» и Google

После создания сайта ее добавляют на сайт. С этой целью файл с картой сайта нужно назвать Sitemap.xml и добавить его в корневую директорию. Чтобы поисковые роботы поскорее нашли ее, в Google и «Яндекс» имеются специальные инструменты. Они называются «Инструменты для веб-мастеров» (в Google) и «Яндекс-вебмастер» (в «Яндексе»).

Добавление Sitemap в Google

В Google необходимо пройти процедуру авторизации в «Инструментах для веб-мастеров». Далее, выбрав сайт, перейти в оптимизацию/файлы Sitemap, нажать кнопку «Загрузить» и подтвердить данную операцию.

Добавление Sitemap в «Яндекс»

Так же и в «Яндекс-вебмастер» нужно сначала авторизоваться. Потом перейти на индексирование/файлы Sitemap, указать там путь файла и нажать кнопку «Добавить».

Советы по созданию карты сайта

Рекомендуется придерживаться следующих советов при создании карты сайта:


  • Поисковые роботы сегодня возьмут только те файлы, которые содержат не больше пятидесяти тысяч url.

  • При превышении карты десяти мегабайт лучше разбить ее на несколько файлов. Благодаря этому перегрузки сервера не будет.

  • Чтобы создать Sitemap xml правильно, при нескольких файлах нужно их всех прописать в файле индекса, используя теги sitemapindex, sitemap, loc и lastmod.

  • Все страницы нужно прописывать или с префиксом «www» или без его использования.

  • Необходимая кодировка файла — это UTF8.

  • Также в файле нужно добавить указание пространства имен языка.

Как создать карту сайта для пользователей

Поскольку такая карта создается для пользователей, она должна быть максимально проста и наглядна. Несмотря на это, необходимо качественно донести всю информацию о структуре используемого сайта.

HTML-карты в основном имеют привычную пользовательскую структуру, состоящую из разделов и подразделов, выделенных определенным образом, например, стилями CSS и графическими элементами.

Чтобы создать Sitemap для крупного интернет-проекта, как и в случае с XML-картой, здесь также рекомендуется разбивание. В этом случае оно осуществляется в виде отдельных вкладок, избавляющих карту от громоздкости.

Повысить функционал страницы позволит язык JavaScript, который в этой карте допускается использовать, так как она создается не для роботов-поисковиков, а для пользователей.

Порядок для файла карты сайта


Желательно, чтобы в созданном файле, содержащем Sitemap, всегда были чистота и порядок, особенно если у сайта имеется большое количество страниц. Поскольку роботы-поисковики просматривают карты сайта очень быстро, для просмотра всего файла крупного интернет-ресурса может просто не хватить времени.

Поэтому если привыкнуть добавлять страницы в карту сайта не внизу, а в верхней ее части, то, с одной стороны, можно не сомневаться, что поисковый робот успеет просмотреть адреса новых страниц, а с другой стороны, таким образом намного легче будет контролировать все страницы.

fb.ru

Как проходит индексирование сайта?

Чтобы полностью понять зачем нужна карта, давайте поговорим об индексации. Если говорить в простой и понятной для всех форме, то процес выглядит так:

Представьте такую ситуацию: вам нужно что-то найти в книге по физике и вы пошли в библиотеку, чтобы найти там ту самую книгу. Пришли и нашли, открыли ее. После этого, начинаете искать нужную вам информацию без какого-либо ориентирования. Таким образом, листая книгу, вы начали воспринимать всю информацию, какая там только есть, то есть индексировать.


Примерно так выглядит процесс индексации. Вы, как робот, начали просматривать все, что только есть в книге и запоминать, хотя большая часть из содержания имеет второстепенное значение. Чтобы быстро ориентироваться по книге, предусмотрено содержание: страница с названиями глав и номерами страниц (ссылки). Файл Sitemap.xml, как раз-таки, является неким содержанием, но только для поискового робота.

Как создать файл sitemap.xml?

Создать карту сайта можно, используя специальные онлайн-генераторы, которых пруд пруди в Интернете. А для тех, чьи сайты работают на CMS, можно использовать плагины (блог работает на WordPress, я использую плагин Yoast SEO).

Есть и те, кто хочет написать сам Sitemap.xml, следующая часть урока именно для вас. Но сначала я хочу, чтобы вы скачали редактор Notepad ++, в этом редакторе можно сохранить файл в формате .xml:

    1. Откройте Notepad++, создайте файл: Создать файл
    2. Сохраните его в формате .xml и назовите sitemap:Формат файла

    3. Задаем кодировку файла UTF-8, прописывая в файле следующие строки:
      <?xml version="1.0" encoding="UTF-8"?>  <urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">  </urlset>
    4. Прописываем необходимые ссылки:
      <url>   <loc>http://www.site.ru/</loc>   <lastmod>2016-11-23</lastmod>   <changefreq>daily</changefreq>   <priority>1</priority>  </url>

Каждая последующая ссылка прописывается так же, как мы это сделали в четвертом шаге!

Теперь подробнее остановимся на значениях в теге <url>:

  • <loc></loc> — Обязательный тег, в котором указывается ссылка на страницу;
  • <lastmod></lastmod> — Дата обновления страницы;
  • <changefreq></changefreq> — Указывается частота обновления страницы, имеет следующие значения:

    • hourly — ежечасно;
    • daily — ежедневно;
    • weekly — еженедельно;
    • mouthly — ежемесячно;
    • yearly — ежегодно;
    • never — никогда.
  • <priority></priority> — приоритет индексирования страницы. Имеет значения от 0.1 — 1;

Остановимся на приоритете подробнее. Не нужно указывать высокий приоритет для каждой страницы в sitemap.xml. Он указывается исключительно относительно страниц, указанных в файле. То есть, если в карте сайте страница site.ru/1.html имеет приоритет 1 (высокий), а страница site.ru/2.html имеет приоритет 0.5, то site.ru/1.html будет проиндексирована первой, а вторая страница, соответственно, второй. Таким образом, тег <priority> — это некий порядок индексирования.


Вывод: для продвигаемых страниц ставьте приоритет 1, для других, менее важных, значения ниже.

Залить sitemap.xml нужно в корень папки сайта!

Карта сайта должна быть доступна по адресу: http://site.ru/sitemap.xml

Если по этому адресу карта не доступна, то вы залили ее не туда!

Ограничения для sitemap.xml

С тем, как создать файл sitemap.xml мы разобрались, теперь поговорим об ограничениях в файле:

  1. Ссылки должны вести на один и тот же сайт;
  2. Длина ссылка не должна превышать 2048 символов;
  3. Максимальное количество ссылок 50 000;
  4. Размер файла не больше 10 Мб.

Иногда случается так, что в один файл не вмещается вся информация, в этом случае поможет индексный файл.

Индексный файл — это тот же sitemap.xml, в котором указываются ссылки на карты сайта, которые мы создавали чуть выше.

Так, выглядит внутри индексный файл:

<?xml version="1.0" encoding="UTF-8"?>  <sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">   <sitemap>   <loc>http://www.site.ru/sitemap1.xml</loc>   </sitemap>   <sitemap>   <loc>http://www.sait.ru/sitemap2.xml</loc>   </sitemap>  </sitemapindex>

Сохраните его и при надобности используйте, заменив ссылки на свои.


Запомните: sitemap.xml нужен практически для всех сайтов, за исключением мелких. Он очень помогает в индексировании сайта.

Ну а на этом все, дорогие друзья!

До скорых встреч!

context-up.ru

С помощью нашего генератора карты сайта создайте файлы в формате XML, которые могут быть представлены в Google, Яндекс, Bing, Yahoo и других поисковых системах, чтобы помочь им индексировать ваш сайт.

Сделайте это за три простых шага:

  • Введите полный URL веб-сайта в форму.
  • Нажмите кнопку «Начать» и дождитесь, пока сайт полностью просканируется. При этом Вы увидете полное количество работающих и неработающих ссылок.
  • Нажав кнопку «Sitemap.xml», сохраните файл в удобном месте.
  • Sitemap – это карта сайта в формате XML, который В 2005 году поисковик Google стал использовать для индексации страниц сайтов. Файл Sitemap представляет собой способ организации веб-сайта, выявление адреса и данные по каждому разделу. Ранее карты сайта в основном были направлены для пользователей сайта. Формат XML был разработан для поисковых систем, что позволяет им найти данные быстрее и эффективнее.


    Новый протокол Sitemap был разработан в ответ на увеличения размера и сложности веб-сайтов. Бизнес-сайты часто содержат тысячи продуктов в своих каталогах, популярность блогов, форумов, досок объявлений вынуждают вебмастеров обновлять свои материалы, по крайней мере один раз в день. Поисковым системам все труднее отслеживать весь материал. Через протокол XML поисковые системы могут более эффективно отслеживать адреса, оптимизируя их поиск путем размещения всей информации на одной странице. XML также показывает, как часто обновляется определенный веб-сайт, и записывает последние изменения. XML карты не являются инструментом для поисковой оптимизации. Это не влияет на ранжирование, но это позволяет поисковым системам сделать более точные рейтинги и поисковые запросы. Это происходит путем предоставления данных, удобных для считывания поисковыми системами.

    Общее признание протокола XML означает, что разработчикам веб-сайтов больше не нужно создавать различные типы карт сайта для различных поисковых системах. Они могут создать один файл для представления, а затем обновить его, когда они внесли изменения на сайте. Это упрощает весь процесс тонкой настройки и расширения веб-сайта. Сами Вебмастера начали видеть преимущества использования этого формата. Поисковые системы ранжируют страницы в соответствии с релевантностью содержания конкретных ключевых слов, но до формата XML часто содержимое страниц не было правильно представлено. Это часто расстраивает вебмастерам, которые понимают, что их усилия по созданию веб-сайта были оставлены незамеченными. Блоги, дополнительные страницы, добавление мультимедийных файлов занимают несколько часов. Через файл XML эти часы не будут потрачены впустую, их увидят все известные поисковые системы.

    Чтобы создать свой Sitemap в формате XML и держать поисковые системы в курсе всех изменений вашего сайта, попробуйте наш бесплатный генератор карты сайта.

    dnsip.ru

    Создание и отправка файлов Sitemap

    1. Решите, какие страницы вашего сайта должны сканировать поисковые роботы Google, и определите канонические URL для каждой из них. 
    2. Определите, какой формат файла Sitemap нужно использовать. Создать файлы Sitemap можно как вручную, так и автоматически с помощью сторонних инструментов.
    3. Сделайте файл Sitemap доступным для Google. Для этого добавьте ссылку на него в файл robots.txt или отправьте его непосредственно в Google с помощью Search Console.

    Форматы файлов Sitemap

    Google поддерживает несколько форматов файлов Sitemap, описанных ниже. Во всех форматах следует использовать стандартный протокол. Google в настоящее время не поддерживает атрибут <priority> в файлах Sitemap.

    Для всех форматов действуют следующие ограничения: файл Sitemap может содержать не более 50 000 URL, а его размер в несжатом виде не должен превышать 50 МБ. Если объем файла или количество перечисленных в нем адресов превышают эти лимиты, разбейте его на несколько частей. Вы можете создать файл индекса Sitemap, перечислив в нем все файлы Sitemap, и отправить их в Google все сразу.

    Расширения файлов Sitemap

    Google поддерживает расширенный синтаксис в файле Sitemap для приведенных ниже типов информации. С его помощью можно добавлять описание видео, изображений и другого контента для улучшения его индексации.

    • Видео
    • Изображения
    • Новости

    Общие рекомендации по файлам Sitemap

    • Используйте один и тот же синтаксис при указании URL. Google будет сканировать их в точности по списку. Например, если сайт размещен по адресу http://www.example.com/, не используйте URL /https://example.com/ (без www) или ./MoyaStranitsa.html (относительный URL).
    • Не указывайте в добавляемых URL идентификаторы сессий – это может привести к избыточному сканированию страниц.
    • Сообщите Google о версии страницы на других языках с помощью атрибута hreflang.
    • Файлы Sitemap должны использовать кодировку UTF-8, а в URL необходимо применять экранирование.
    • Разбивайте большие файлы Sitemap на файлы поменьше, чтобы снизить нагрузку на сервер при отправке информации в Google. Файл Sitemap может содержать не более 50 000 URL, а его размер в несжатом виде не должен превышать 50 МБ. Создайте файл индекса Sitemap, перечислив в нем все файлы Sitemap, и отправьте его в Google вместо отдельных файлов.
    • Используйте рекомендуемые методы канонизации URL, чтобы сообщить Google о версии домена, для которой составлен файл Sitemap (если сайт доступен как с www, так и без www). В этом случае потребуется только один файл Sitemap.
    • Используйте расширения файлов Sitemap для дополнительных типов информации, в частности видео, изображений и новостей.
    • Если у мобильной и обычной версии страницы разные URL, мы рекомендуем указывать только на одну из них. Если все же требуется указание на оба URL, добавьте для них аннотации, чтобы распознавались разные версии.
    • Если существуют версии страницы на других языках или для других регионов, вы можете указать их с помощью файла Sitemap или атрибута hreflang.
    • Применяйте только цифры и латинские буквы. Файл Sitemap обязательно должен быть в кодировке UTF-8 (обычно ее можно выбрать при сохранении). Во всех файлах XML для любых значений данных (включая URL) необходимо применять экранирование элементов при использовании символов, перечисленных в таблице ниже.  Файл Sitemap может содержать только символы ASCII. В нем не должно быть расширенных символов ASCII, определенных управляющих кодов и специальных символов, таких как * и {}. Если они содержатся в URL, то при попытке его добавить появится сообщение об ошибке.
      Символ Маскирование
      Амперсанд & &amp;
      Одинарные кавычки &apos;
      Двойные кавычки « &quot;
      Больше чем > &gt;
      Меньше чем < &lt;

      Кроме того, все URL (включая адреса в вашем файле Sitemap) должны быть правильно экранированы и закодированы, чтобы их мог обработать веб-сервер. Обычно это выполняется автоматически, если для создания URL вы применяете какой-либо скрипт, инструмент или файл журнала, то есть не вводите адреса вручную. Если при отправке файла Sitemap вы получаете оповещение о том, что Google не удалось найти ваши URL, убедитесь, что они соответствуют стандарту RFC-3986 для URI, стандарту RFC-3987 для IRI и стандарту XML.

      Ниже представлен пример URL, в котором содержится символ, не относящийся к кодировке ASCII (ü), а также символ, требующий экранирования (&).
      http://www.example.com/ümlat.html&q=name
      Этот же URL, переведенный в кодировку ISO-8859-1 (для размещения на сервере, использующем эту кодировку) и содержащий маскирование:
      http://www.example.com/%FCmlat.html&q=name
      Этот же URL, переведенный в кодировку UTF-8 (для размещения на сервере, использующем эту кодировку) и содержащий маскирование:
      http://www.example.com/%C3%BCmlat.html&amp;q=name
      Этот же URL, содержащий маскирование:
      http://www.example.com/%C3%BCmlat.html&amp;q=name

    Как сделать файл Sitemap доступным для Google

    Предоставить Google доступ к файлу Sitemap можно несколькими способами:

    • Отправить его в Google с помощью инструмента Search Console
    • Вставить в любом месте файла robots.txt строку, указывающую на местоположение файла Sitemap:
      Sitemap: http://example.com/adres_sitemap.xml.
    • Воспользоваться запросом ping. Отправьте такой запрос HTTP GET:
        http://www.google.com/ping?sitemap=<polniy_url_faila_sitemap>
      Пример:
        http://www.google.com/ping?sitemap=https://example.com/sitemap.xml

    support.google.com

    История развития Sitemap

    Сколько себя помнит Интернет, веб-мастера всегда пытались угодить поисковым паукам — помочь им собрать детальную информацию о структуре продвигаемого сайта.

    Первым, самым древним и вполне естественным способом было создание специальной страницы, на которой помещались все ссылки сайта. Назывались и называются такие страницы картами сайта. Принцип их работы прост: поисковый робот при визите на эту страницу автоматически пройдёт по опубликованным там ссылкам и занесёт их в индекс.

    Подобная схема была удобна до поры до времени. Позже, когда сайты перестали собой представлять исключительно статические страницы с малым количеством страниц, возникла новая проблема, связанная с неэффективностью метода публикации классического варианта карты сайта, т.к. мест для ссылок не хватало, страницы получались большими по размеру, неудобными.

    На некоторых сайтах число страниц перевалило за 1 000, естественно, что абсолютно все ссылки разместить на карте сайта стало невозможно. Коэффициент проиндексированности таких сайтов стал снижаться. Мир нуждался в новом эффективном решении возникшей проблемы.

    И проблема была решена. В июне 2005 года компанией Google был создан новый удобный формат описания новых страниц сайта для улучшения качества их индексации поисковыми системами.

    Стандарт получил название Sitemaps 0.84. За основу был принят принцип текстовой базы данных XML, позволяющий компактно в текстовом файле описать структуру сайта, включая новые и опубликованные ранее страницы сайта с возможностью указания дополнительной META-информации. Эффективное решение Sitemaps, предложенное Google, стало пользоваться бешеной популярностью.

    Популярность сказалась и на мнении других поисковых систем к новому подходу создания карт сайта. Так в ноябре 2006 года к поддержке стандарта присоединились такие поисковые гиганты, как MSN и Yahoo, а в апреле и Ask.com. На радостях формат Sitemaps получил новую версию Sitemap 0.90, расширяющую функциональные возможности.

    В мае 2007 года было официально объявлено о поддержке подключения стандарта Sitemaps в файле robots.txt поисковиками Ask, Google и Yahoo, т. е. найти карту сайта Sitemap стало проще: достаточно указать его местоположение в этом файле, а за источник информации для Sitemap использовать RSS-ленты или обычные текстовые файлы.

    2 июня 2008, спустя 3 года после объявления протокола Google на блоге Яндекса для вебмастеров появилось сообщение о поддержке этого протокола Яндексом.

    htmlweb.ru

    Что конкретно находится в карте сайта ?

    Файл sitemap. xml содержит не только url страниц, но и дополнительную информацию каждой страницы:

    • дату последнего изменения;
    • частоту изменения;
    • приоритетность на уровне сайта.

    Естественно, прописать ручками этот файл очень трудно. Особенно если у вас большой интернет-магазин. Для упрощения жизни был разработан онлайн генератор карты сайта (sitemap generator online), который выполняет всю рутинную работу за вас.

    На данный момент существует достаточно много ресурсов для генерации карты, в этой статье я расскажу о наиболее популярных онлайн генераторах.

     

    Как сгенерировать sitemap и как работает эта адская система?

    Практически все сервисы онлайн генерации карт сайта работают по одному и тому же принципу. Даже интерфейс примерно везде один и тот же, отличается только стиль оформления и расположение кнопок управления.

    Итак вы заходите на типичный онлайн генератор… что вы скорее всего увидите? Правильно! Поле ввода url. Вставляем нужный нам сайт. Для примера будем использовать генератор карты сайта cy-pr.com.

    Вводим адрес нашего сайта, выбираем частоту обновления (если оно вам надо), также для удобства можно использовать дату последнего обновления (чтобы запомнить когда создавалась карта) и нажимаем кнопку «Создать».

    После нажатия происходит волшебство! Вы сможете наблюдать как трудолюбивый сервис бегает по вашему сайту, записывая каждую страницу в файлик. После такого марафона генератор карты выдает вам всю свою рукопись с описанием каждой страницы:

    Теперь нам нужно ее сохранить. Для этого открываем блокнот, вставляем туда наш код, который нам дала адская система, нажимаем «сохранить как», далее вводим имя файла «sitemap.xml», выбираем тип «все файлы», выбираем кодировку utf-8 и нажимаем кнопку «сохранить».

    Мы получили файлик sitemap.xml:)

    Если вы все сделали правильно то получите такой файлик:

     

     

    Важно помнить, что карта сайта не резиновая — потолок 50 000 url. Готовую карту можно скидывать на сервер. Главное, не забудьте прописать в robots, что у вас есть карта! Роботы вредные и не будут ее сами искать:)

     

     

    Если вы решили не использовать сервисы онлайн генерации карты сайта, а захотели пойти по хардкору и написать все сами, то вам следует знать каждого из этого списка:

    1. <url> — Тег в котором указывается данные об url
    2. <urlset> — В этом теге заключаются данные о многих url
    3. <loc> — Используется для указания url
    4. <lastmod> — Хранит дату последнего изменения
    5. <changefreq> — Данные о частотности изменения (могу использоваться атрибуты «always, hourly, daily, weekly, monthly, yearly, never»)
    6. <priority> — Описывает приоритет страницы по сравнению с другими (от 0.1 — холоп до 1 — царь)

     

    <url>, <urlset> и <loc> являются обязательными, остальные могут не использоваться.

     

    Могучий пример

        <urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">   <url>   <loc>//semantica.in/</loc>   <lastmod>2016-06-09T11:46:13+04:00</lastmod>   <changefreq>always</changefreq>   <priority>1.0</priority>   </url>   <url>   <loc>//semantica.in/category/</loc>   <lastmod>2016-06-09T11:46:13+04:00</lastmod>   <changefreq>hourly</changefreq>   <priority>0.8</priority>   </url>   <url>   <loc>//semantica.in/page/</loc>   <lastmod>2016-06-09T11:46:13+04:00</lastmod>   <changefreq>daily</changefreq>   <priority>0.6</priority>   </url>  </urlset>  

     

    После чего вы можете также сохранить его и скинуть в корень.

     

    Не царское это дело, файлики сохранять

    Конечно, не все онлайн генераторы дают вам код, многие генерируют готовую карту сайта в виде файла «sitemap.xml», вам остается лишь скачать ее и закинуть в корень сайта.

    А если вы чувствуете, что работа с файлами это вообще не для вас…

     

     

    Решение есть! Sitemap generator для админки без регистрации и смс. Рассмотрим подробнее на примере админки wordpress.

    Плагин «Карта сайта» используется для небольших проектов, он выводит не такую подробную информацию как онлайн генераторы холопских файлов, но все же работает.

    Для установки переходим в раздел меню плагины > установленные > добавить новый

     

     

    В поиске вводим «Google sitemaps»

     

     

    Устанавливаем данный плагин, активируем и (Бац! Wow!) карта сайта создана. Ее можно дополнительно настроить вручную (если вам это понадобиться). Также существует множество других плагинов для генерации карты сайта. Не только для WP, но и для других CMS и с каждым днем их больше и больше.

     

    Генератор sitemap xml: советы

    • При создании карты сайта не стоит забывать о размере. Если файл весит больше 10 мб, рекомендуется его разбить на несколько частей. Тем самым вы избавите сервер от перегрузок.
    • Все url необходимо писать единообразно (с www либо без www)
    • Файл карты сайта должен иметь кодировку UTF-8
    • Всегда указывать на пространство имен языка XML xmlns=»http://www.sitemaps.org/schemas/sitemap/0.9″

     

    semantica.in

    Карта сайта sitemap в формате xml — а оно мне надо

    Но основным инструментом, предназначенным для прямого указания поисковикам тех страниц ресурса, которые нужно будет обязательно проиндексировать, является файл под названием Sitemap.xml (это его наиболее частое название, но по идее его можно обозвать как угодно, не суть важно), который не будет виден посетителям вашего web проекта.

    Он составляется с учетом специального синтаксиса, понятного поисковым машинам, где будут перечислены все страницы, подлежащие индексации с указанием степени их важности, даты последнего обновления и примерной частоты обновления.

    Есть два основных файла, которые должны иметься у любого web проекта — robots.txt и sitemap.xml. Если у вашего проекта их нет или они заполнены не правильно, то с большой долей вероятности вы сильно вредите своему ресурсу и не позволяете ему раскрыться на все сто процентов.

    Вы, конечно же, можете не послушать меня (ибо я не есть авторитет, в силу относительно малого накопленного фактического материала), но думаю, что со специалистами, имеющими под рукой статистику с десятков тысяч проектов, вы огульно спорить не будете.

    На этот случай у меня оказался припасен «рояль в кустах». Прямо перед написанием этой статьи попалась на глаза публикация специалистов из всем известной системы автоматического продвижения под необычным названием «Руки» (это аналог MegaIndex, о котором я писал Мегаиндекса).

    Понятно, что любая подобная им система заинтересована в том, чтобы проекты их клиентов успешно продвигались, но они могут только накачивать ресурсы клиентов ссылочной массой, а влиять на наполнение и правильную техническую настройку сайтов они, к сожалению, не могут.

    Поэтому и было проведено очень интересное и показательное исследование, которое было призвано выявить 10 самых популярных причин, которые затрудняют продвижение проектов и ткнуть этими данным клиентам прямо в …

    На первом месте, конечно же, был «не уникальный контент» (либо вы скопистили, либо у вас украли тексты, что сути не меняет). Но на втором месте была как раз именно карта сайта в формате xml, а точнее ее отсутствие или несоответствие признанному формату создания. Ну, а на третьем месте был уже упомянутый ранее файл robots.txt (его отсутствие или неправильное создание):

    Создать сайтмап

    Когда голословно утверждаешь, что карта должна быть у вашего проекта обязательно (иначе кирдык), то это не звучит так убедительно, как в случае подкрепления данного утверждения реальными фактами из довольно-таки репрезентативного исследования.

    Ладно, будем считать, что я вас убедил и давайте посмотрим, как можно самим создать сайтмап (синтаксис формата), как сделать ее для Joomla и WordPress, а так же посмотрим, как можно будет создать ее с помощью специальных онлайн генераторов (generator).

    Но просто создать sitemap еще не достаточно для того, чтобы быть уверенным в правильной индексации вашего проекта поисковиками. Нужно еще будет сделать так, чтобы об этой самой карте сайта узнали поисковые системы (в нашем случае это Google и Яндекс). Сделать это можно будет двумя способами, но об этом мы поговорим чуть позже (должна же быть хоть какая-то интрига, удерживающая внимание читателей).

    Зачем вообще нужен сайт мап и файл robots.txt

    Давайте для начала попробуем обосновать логическую необходимость использования как файла robots.txt, запрещающего индексацию определенных элементов вашего web проекта, так и файла сайт мап, предписывающего индексацию определенных страниц. Для этого вернемся на пяток-десяток лет назад, когда большинство ресурсов в интернете представляли из себя просто набор Html файликов, в которых и содержались тексты всех статей.

    Поисковый робот Гугла или Яндекса просто заходил на такой Html проект и начинал индексировать все, что ему попадется под руку, ибо практически везде содержался контент проекта. А что же происходит сейчас, в условиях повального использования CMS (систем управления контентом)? Собственно, даже сразу после установки движка поисковый робот уже обнаружит у вас несколько тысяч файлов и это при том, что никакого контента у вас еще может и не быть (ну, не написали вы еще ни одной статьи).

    Да и вообще, контент в современных CMS, как правило, хранится не в файлах, а в базе данных, которую поисковый робот напрямую проиндексировать, естественно, не сможет (для работы с базами советую бесплатно скачать, установить и настроить PhpMyAdmin).

    Понятно, что потыркавшись туда сюда, поисковые роботы Яндекса и Google все же найдут ваш контент и проиндексируют его, но вот насколько быстро это произойдет и насколько полной будет индексация вашего проекта — очень большой вопрос.

    Вот именно для упрощения и ускорения индексации проектов поисковиками в условиях повального использования CMS и следует в обязательном порядке создавать robots.txt и sitemap.xml. C помощью первого файла вы подсказываете роботам поисковиков на индексацию каких файлов не стоит тратить время (объекты движка, например), а так же с помощью него можно закрыть от индексации и часть страниц для устранения эффекта дублирования контента, который присущ многим CMS (читайте об этом подробнее в статье про robots.txt).

    А с помощью файла сайтмап вы четко и ясно говорите роботам Яндекса и Гугла, что именно на вашем проекте содержит контент, чтобы они не тыркались понапрасну по углам файлового хозяйства используемого движка. Не забывайте, что у ботов есть определенные лимиты на время и количество просмотренных документов. Он побродит у вас по файлам движка и уйдет, а контент останется не проиндексированным еще долгое время. О как.

    Помните как в известной комедии говорил один колоритный персонаж: «Ты туда не ходи, ты сюда ходи, а то…». Вот именно функцию этого персонажа и выполняют robots.txt и сайт мап с расширением xml для регулирования перемещений поисковых ботов по закоулкам вашего web проекта. Понятно, что боты могут и взбрыктуть, но скорее всего они послушно будут выполнять ваши грамотно написанные запрещающие и предписывающие (в карте сайта) инструкции.

    Понятно? Тогда приступаем непосредственно к решению вопроса, как создать sitemap.xml различным способами и как сообщить о его существовании двум китам поиска в рунете — Google и Яндексу, чтобы они не шарились по вашему проекту почем зря, создавая при этом еще и дополнительную нагрузку на сервер вашего хостинга, но это, правда, уже сильно второстепенная вещь, главное — это именно индексация (быстрая и всеобъемлющая).

    В отличии от robots.txt, который вам писать придется скорее всего собственноручно, файл карты сайта в формте xml, как правило, стараются создать каким-либо автоматическим способом. Оно и понятно, ибо при большом количестве страниц на часто обновляемом проекте ручное его создание может привести к повреждению ума у вебмастера.

    Да это вовсе и не обязательно, т.к. практически для каждой CMS найдется расширение, которое позволит создать, а при появлении новых материалов и пересоздать файл сайтмап. Ну, или можно будет всегда воспользоваться каким-либо онлайн генератором (generator) карты сайта в виде готового решения.

    Но все же, мне кажется, будет не лишним ознакомиться с нехитрым (да что там говорить — простейшим) синтаксисом создания sitemap. К тому же на маленьких и редко обновляемых проектах можно набросать его и вручную.

    Как создать Sitemap.xml самому в Joomla и Вордпрессе

    Этот файл вы можете создать в любом текстовом редакторе, например, все в том же Notepad++, о котором тут я вам все уши прожужжал. Карта сайта в формате xml имеет обычно примерно такую структуру.

    Сначала идет стандартная часть:

    <?xml version="1.0" encoding="UTF-8"?> <urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">

    А затем идет серия повторяющихся блоков, заключенных в теги «url», каждый из которых описывает одну из страниц вашего проекта, для которого пишется данная карта:

    <url> 		<loc>https://ktonanovenkogo.ru/</loc> 		<lastmod>2011-05-12T19:22:36+00:00</lastmod> 		<changefreq>daily</changefreq> 		<priority>1.0</priority> 	</url>

    Обязательным в этом xml коде является только пара тегов «loc», в которых заключается адрес страниц вашего проекта, которую должны будут проиндексировать поисковые системы. В теги «lastmod» заключена дата последнего обновления данной страницы, что позволит роботу лишний раз не заходить на не изменившуюся с момента последнего захода страницу.

    В тегах «changefreq» указывается примерная частота обновления данной страницы (раз в день, неделю, месяц), ну, а в теге «priority» указывается приоритетность ее индексации. Изначальный приоритет у всех страниц равен 0.5, но вы вольны изменять его для определения очередности индексации вашего web проекта (от 0 до 1).

    Не забывайте, что за один проход робот не сможет пройти по всем ссылкам в большой карте сайта (обычно около сотни ссылок за раз проходит), а значит с помощью большего приоритета можно выбрать наиболее важные для быстрой индексации страницы.

    По стандарту sitemap.xml не может содержать более 50 000 ссылок и весить более 10 Мб. Хотя, многие даже при превышении 500 — 1000 ссылок в карте сайта стараются ее разбить на несколько файлов, подсунув поисковым системам и указав в robots.txt индексный файл сайтмап, в котором имеются ссылки на все остальные файлы карт большого сайта.

    Его синтаксис будет примерно таким:

    <?xml version="1.0" encoding="UTF-8"?> <urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"  <sitemap>   <loc>https://ktonanovenkogo.ru/sitemap.xml.gz</loc>   <lastmod>2011-04-01T18:23:17+00:00</lastmod>   </sitemap>   <loc>https://ktonanovenkogo.ru/sitemap2.xml.gz</loc>   <lastmod>2011-04-01T18:23:17+00:00</lastmod>  </sitemap> 

    Генерация карты сайта в Joomla и WordPress

    Создать карту сайта для WordPress можно будет с помощью плагина Google XML Sitemaps. Для нее вы сможете произвести множество настроек, которые позволят исключить часть материалов вашего сайта, а так же можете задать предполагаемую частоту обновления. Кроме создания карты, плагин Google XML Sitemaps при публикации новых материалов на вашем блоге уведомляет об этом многие поисковые системы, приглашая их побыстрее провести индексацию.

    Путь до файла сайтмап можете задать сами в настройках плагина и даже можете дать ему название отличное от классического sitemap.xml. Многие владельцы именно так и делают — называю этот файл kjfdjkf.xml и закапывают его в огромном количестве вложенных папок. Тем самы они прячут карту сайта от посторонних глаз. В роботс.тхт они тоже этот путь не указывают, а сообщают его только Яндексу и Гуглу в их панелях для вебмастеров, о которых речь пойдет чуть ниже.

    Создать сайтмап

    Создать карту сайта для Joomla можно с помощью компонента Xmap. По приведенной чуть выше ссылке вы найдете довольно подробную инструкцию, как по ее созданию в виде файла xml, так и в формате Html, ориентированную в первую очередь не на ускорение индексации, а на удобство пользователей.

    Создать сайтмап

    Ссылку на созданный сайтмап сможете найти в настройках компонента, как показано на приведенном скриншоте.

    Как добавить сайт мап в Яндекс и Гугл Вебмастер

    Как видите, в отличии от файла robots.txt (который обязательно должен находиться в корневой папке вашего web проекта), файл сайт мап может лежать где угодно. Но вам нужно будет сообщить о его местоположении поисковым системам. Сделать это можно двумя способами.

    Во-первых, в robots.txt предусмотрена специальная директива «Sitemap», которая, например, для моего блога будет выглядеть так:

    Sitemap: https://ktonanovenkogo.ru/sitemap.xml

    или так (файл карты сайта вовсе не обязательно должен называться sitemap.xml, как я уже упоминал выше)

    Sitemap: https://ktonanovenkogo.ru/forum/index.php?action=sitemap;xml

    Обязательно нужно прописывать полный абсолютный путь до сайтмапа, не опуская «https://ktonanovenkogo.ru». Это я говорю потому, что пути во всех остальных директивах robots.txt пишутся без указания «https://ktonanovenkogo.ru» (читайте тут про относительные и абсолютные пути).

    Обычно директиву «Sitemap» прописывают в самом конце. Поисковые роботы при очередном заходе на ваш web проект обязательно просмотрят содержимое robots.txt и загрузят для изучения вашу карту. Однако, таким образом могут узнать о ее существования всякие редиски, которым сайт мап поможет тырить у вас контент.

    Но существует еще один способ уже напрямую передать информацию о местоположении карты сайта поисковикам без посредничества robots.txt. Делается это через интерфейс Яндекс Вебмастера и панели инструментов Google, хотя можно Bing вебмастер использовать. Вы уже знакомы с этими инструментами поисковых систем?

    Если нет, то обязательно добавьте свой проект и в инструменты Яндекс для вебмастеров, и в панель инструментов Гугла, а затем укажите в соответствующих вкладках путь до вашей карты сайта в формате Xml.

    Так выглядит форма добавления сайтмапа для Яндекс Вебмастера:

    Создать сайтмап

    А так выглядит аналогичная форма для прописывания пути в панели инструментов Google:

    Создать сайтмап

    ktonanovenkogo.ru

    Какие бывают карты сайта

    Поисковые системы индексируют сайт постепенно, уровень за уровнем, начиная с главной страницы. Если на сайте много уровней вложенности страниц, то пока все страницы сайта проиндексируются пройдут многие месяцы. Значит, необходимо создать карту сайта, на которой будут все ссылки на все страницы сайта сразу, чтобы робот не тратил время на переходы по уровням вложенности, верно? И да и нет. Ответ зависит от того зачем делается карта и какой она будет. Давайте рассмотри, какие бывают карты сайта.

    Карта сайта HTML Sitemap

    Карты сайта делятся на 2 основных вида или формата: карта сайта html и карта сайта файл xml. HTML карта сайта — это страница сайта, на которой перечислены ссылки. Обычно это ссылки на самые важные разделы и страницы сайта. HTML карта сайта больше рассчитана на людей, нежели на роботов и помогает быстрее ориентироваться в основных разделах сайта. Для карты сайта в виде html-страницы существуют серьезные ограния по количеству ссылок на одной странице. Если на странице будет слишком много ссылок, далеко не все ссылки могут быть проиндексированы или вовсе страница карты сайта может быть исключена из поиска за чрезмерное количество ссылок, пусть даже внутренних ссылок.

    Для того, чтобы карта сайта html правильно индексировалась и адекватно воспринималась посетителями не стоит размещать на странице более 100 ссылок. Этого более чем достаточно, чтобы разместить на странице все разделы и подразделы, которые не влезли в основное меню.

    Обычно, карта сайта в формате HTML имеет древовидную структуру, где указаны развернутые разделы и подразделы. Излишне громоздкие HTML карты сайта, зачастую оформляются графическими элементами, CSS-стилями и дополняются Java-script. Однако, карта сайта html не имеет большого значения для поисковых систем.

    HTML карта сайта — это не есть полноценный sitemap. Как же быть, если на сайте сотни, тысячи, десятки тысяч страниц? Для этого необходимо разместить ссылки на все страницы в карте сайта в формате xml.

    Карта сайта XML Sitemap

    XML карта сайта — это файл формата xml, вида sitemap.xml, который обычно находится в корне сайта. У карты сайта в формате xml есть множество преимуществ перед html картой сайта. Sitemap xml — это специальный формат карты сайта, который определяется всеми популярными поисковыми системами, например Google и Яндекс. В xml sitemap можно указать до 50.000 ссылок. Более того, в sitemap xml можно указать относительный приоритет и частоту обновления страниц.

    Стоит сказать, что содержимое карты сайта является лишь рекомендацией для поискового робота. Например, если установить для страницы сайта ежегодную частоту обновления, поисковые роботы все равно будут ходить чаще. А если установить частоту обновления страницы ежечасно, это не значит, что роботы будет индексировать страницу каждый час.

    Карта сайта xml имеет определенный синтаксис, давайте рассмотрим структуру xml карты сайта подрбнее.

    Пример файла карты сайта sitemap.xml

    Правильный sitemap.xml должен иметь кодировку UTF8. Содержимое файла карты сайта sitemap.xml выглядит следующим образом:

    <urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">  <url>  <loc>http://mysite.ru/</loc>  <lastmod>2014-09-18T18:54:13+04:00</lastmod>  <changefreq>always</changefreq>  <priority>1.0</priority>  </url>  <url>  <loc>http://mysite.ru/category/</loc>  <lastmod>2014-09-18T18:57:09+04:00</lastmod>  <changefreq>hourly</changefreq>  <priority>0.8</priority>  </url>  <url>  <loc>http://mysite.ru/page/</loc>  <lastmod>2014-09-18T18:59:37+04:00</lastmod>  <changefreq>daily</changefreq>  <priority>0.6</priority>  </url> </urlset>

    Где используются следующие обязательные теги:

    • <urlset> — родительский тег, в него заключаются все url-адреса;
    • <url> — тег, в котором указываются сведения о конкретном url-адресе;
    • <loc> — в данном теге указывается непосредственно url.

    Далее, следуют необязательные теги:

    • <lastmod> — этот тег заключает в себе дату последнего изменения страницы;
    • <changefreq> — тег используется, чтобы указать насколько часто изменяется страница: always, hourly, daily, weekly, monthly, yearly, never;
    • <priority> — указывает приоритет определенной страницы, относительно других страниц сайта от 0,1 – низкий приоритет, до 1 – высокий приоритет.

    Так же, в файле карты сайта в формате xml должно содержаться указание на пространство имен языка XML:

    xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"

    Если файл карты сайта включает более 50 тысяч ссылок или размер sitemap.xml превышает 10 мб, рекомендуется разделить карту сайта на несколько файлов. В таком случае, в карте сайта необходимо указать несколько ссылок на разные файлы карт.

    <sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">  <sitemap>  <loc>http://mysite.ru/sitemaps/sitemap01.xml</loc>  <lastmod>2014-09-18T18:54:13+04:00</lastmod>  </sitemap>  <sitemap>  <loc>http://mysite.ru/sitemaps/sitemap02.xml</loc>  <lastmod>2014-09-18T18:54:13+04:00</lastmod>  </sitemap> </sitemapindex>

    Здесь используются уже знакомые нам теги <loc> и <lastmod>, а так же обязательные теги:

    • <sitemapindex> — родительский тег, в который заключаются адреса всех карт сайта;
    • <sitemap> — тег, в котором заключается параметры для каждой карты сайта.

    Пример файла карты сайта sitemap.txt

    Еще одним способом оформления карты сайт в виде файла может быть карта сайта в формате txt:

    1. http://mysite.ru/ 2. http://mysite.ru/page/ 3. http://mysite.ru/page1/

    Все просто. В файле sitemap.txt построчно перечисляются все необходимые ссылки. Карта сайта в формате txt — это «вариант для ленивых». Здесь работает аналогичное sitemap xml ограничение в 50.000 ссылок. Однако, TXT карта сайта лишена возможностей указания даты последнего изменения и приоритета страницы.

    Как создать карту сайта

    Создание карты сайта важный процесс, в котором необходимо четко указать, какие страницы сайта нужно индексировать и как лучше их индексировать. В зависимости от того о каком типе карты сайта идет речь, используются различные способы создания карты сайта. Как создать html карту сайта обсуждать отдельно смысла нет. Рассмотрим как сделать карту карта в формате xml файла. Существует несколько основных способов создания карты сайта, но все их объединяет то, где находится карта сайта и как файл sitemap определяется поисковыми системами.

    Как уже было написано выше — файл карты сайта размещается в корне сайта. Поисковые системы способны самостоятельно обнаружить файл карты сайта. Но существует несколько способов указания прямой ссылки на файл(ы) карты сайта(ов) для более скорого обнаружения поисковыми системами. Самый простой способ указать место расположения файла карты сайта — это непосредственное указание ссылки или нескольких ссылок на файлы карт сайта в инструментах для вебмастеров от Yandex и Google. Там же можно проверить карту сайта, провести анализ карты сайта на корректность, соответствие того, какие страницы из карты сайта найдены поисковой системой и сколько из них находится в индексации.

    Второй способ указать поисковым системам на расположение файла карты сайта — это директива Sitemap файла robots.txt.

    Указание ссылки на карту сайта в robots.txt:

    Sitemap: http://mysite.ru/sitemap.xml

    В robots.txt можно указать несколько файлов sitemap, после чего, он автоматически будут добавлены в инструменты для вебмастеров. Как найти карту сайта мы рассмотрели, теперь перейдем к тому, как создать карту сайта.

    Основные способы создания карты сайта

    1. Генерация карты сайта силами системы управления сайта, если CMS имеет подобную встроенную возможность.
    2. Скачать карту сайта со стороннего онлайн сервиса. Существует множество online генераторов карт сайта с различным возможностями и ограничениями. Напрмер xml-sitemaps.com обладает возможностью настройки параметров карты сайта, но имеет ограничение по количеству ссылок в файле sitemap.xml в 500 штук.
    3. Скачать программу-генератор карты сайта. Подобные программы генераторы обычно платные, но при их помощи можно можно регулярно генерить sitemap xml для одного или нескольких сайтов. Вот пара примеров подобных программ-генераторов: SiteMap XML Dynamic SiteMap Generator, WonderWebWare SiteMap Generatior.
    4. Автоматическое создание sitemap карты сайта в Joomla (Джумла), WordPress (Вордпресс), Bitrix (Битрикс).
    5. Создание карты сайта вручную.

    Карта сайта — один из важнейших инструментов SEO оптимизации сайта. Не важно, как будет создана карта сайта. Важно — какие ссылки будут перечислены в карте сайта и как часто она будет обновляться. Иногда, в карту сайта выгружается все подряд и даже те ссылки, которые запрещены в robots.txt или неканонические ссылки. А обновление карты сайта происходит раз в месяц или реже. Подобное отношение к карте сайта может не просто сделать ее бесполезной, но того хуже — запутать поискового робота, что негативно отразится на индексации и позициях сайта в поиске.

    Создайте карту сайта для своего ресурса. Но будте внимательны и хорошо подумайте, что выгружать в sitemap, а что нет.

    convertmonster.ru


    You May Also Like

    About the Author: admind

    Добавить комментарий

    Ваш e-mail не будет опубликован. Обязательные поля помечены *

    Этот сайт использует Akismet для борьбы со спамом. Узнайте как обрабатываются ваши данные комментариев.