Sitemap xml проверить



URL недоступны

Google не удалось просмотреть адреса из файла Sitemap.

  1. Убедитесь, что файл находится именно там, где указано.
  2. С помощью инструмента проверки файла robots.txt выясните, как именно заблокирован доступ.
  3. Используйте Сканер Google для сайтов, чтобы определить, настроена ли блокировка страницы в файле robots.txt.
  4. Если сканировался URL из вашего файла Sitemap, проверьте, нет ли ошибок в адресе.

Переход по URL не выполнен

Обычно указывает на то, что при обработке файла Sitemap роботу Google не удалось открыть некоторые URL, потому что по ним выполняется слишком много перенаправлений. Измените URL переадресации в файле Sitemap и замените их на URL назначения (цель перенаправления).

Ниже описано, почему могла иметь место такая ошибка и как ее исправить.

  • Проверьте сайт с помощью текстового браузера (например, Lynx), поскольку большинство поисковых систем видят сайт точно так же, как Lynx. Если вам не удается просмотреть весь сайт с помощью текстового браузера из-за таких элементов как JavaScript, cookie, идентификаторы сеансов, фреймы, DHTML или Flash, то и сканерам поисковых систем, скорее всего, тоже будет трудно его обработать.

  • Если вы все время применяете переадресацию с одной страницы на другую, используйте постоянные перенаправления. Рекомендуем отказаться от переадреcации с помощью JavaScript или метатега refresh.
  • По возможности используйте абсолютные ссылки вместо относительных. Например, ссылаясь на другую страницу своего сайта, используйте URL https://www.example.com/moya-stranitsa.html, а не просто moya-stranitsa.html.

Недействительные URL

Некоторые URL-адреса находятся на более высоком уровне по отношению к файлу Sitemap или в другом домене.

Более высокий уровень: если файл находится на странице http://www.example.com/moy_sait/sitemap.xml, то для него недействительны следующие URL-адреса:

  • http://www.example.com/ – находится на более высоком уровне, чем файл Sitemap;
  • http://www.example.com/yoursite/ – расположен в каталоге, параллельном текущему местонахождению файла Sitemap.

Другой домен: убедитесь, что все адреса начинаются с домена, в котором хранится ваш файл Sitemap. Например, если файл находится на странице http://www.example.com/sitemap.xml, то для него недействительны следующие URL:

  • http://example.com/ – отсутствует www в начале.
  • www.example.com/ – нет префикса протокола (http).
  • https://www.example.com/ – указан протокол https вместо http.

Ошибка сжатия

Ошибка при попытке распаковать заархивированный файл Sitemap. Выполните сжатие ещё раз (например, с помощью gzip), а затем загрузите его на сайт и повторно отправьте в Google.

Пустой Sitemap

В файле Sitemap отсутствуют URL. Убедитесь, что он не пустой. Если файл использует протокол Sitemap, проверьте правильность тегов в URL.

Ошибка размера файла Sitemap: превышен максимально допустимый размер файла Sitemap

Размер файла Sitemap в несжатом виде превышает 50 МБ. Разбейте его на несколько файлов и укажите их в индексе, а затем отправьте нам каждый из них отдельно.

Неверное значение атрибута

Атрибут, связанный с одним из тегов XML в файле Sitemap, имеет недопустимое значение. Проверьте файлы Sitemap и убедитесь, что все атрибуты используются согласно техническим требованиям к таким файлам. Проверьте, нет ли опечаток в значениях атрибутов.

Недопустимая дата

Одна или несколько дат в файле Sitemap имеет неверный формат или значение. Даты должны быть в формате кодировки даты и времени W3C. Время можно не указывать. Убедитесь, что все даты записаны в одном из допустимых форматов кодировки согласно W3C.

 2005-02-21 2005-02-21T18:00:15+00:00 

Время задавать не требуется (по умолчанию устанавливается значение 00:00:00Z), однако если вы все же делаете это, не забудьте указать часовой пояс.


Недопустимое значение тега

В файле Sitemap содержится один или несколько тегов с недопустимым значением. В сообщении об ошибке они все должны быть указаны. Проверьте спецификации для соответствующего типа файла Sitemap (индекс, стандартный, видео и т. д.).

Недопустимый URL

В файле Sitemap указан недействительный URL. Возможно, он содержит недопустимые символы (пробелы, кавычки и т. д.) или другие ошибки форматирования, например имеет префикс htp:// вместо http://. Проверьте экранирование и кодировку URL, указанных в файле Sitemap. Проверьте, нет ли недопустимых символов, таких как пробелы и кавычки. Кроме того, можно вставить URL в браузер и посмотреть, сможет ли программа распознать его и загрузить страницу.

Недействительный URL в файле индекса Sitemap: неполный URL

Для некоторых файлов Sitemap, перечисленных в файле индекса Sitemap, не указаны полные URL-адреса. Google выполняет поиск файлов Sitemap в том же каталоге, в котором находится файл индекса. Например, если индекс находится по адресу http://www.example.com/folder1/sitemap_index.xml и адрес файла Sitemap в нем указан как sitemap.xml, наш робот попытается загрузить его по адресу http://www.example.com/folder1/sitemap.xml. Если робот Google не обнаружит файл Sitemap по этому адресу, попытка закончится ошибкой.


Обновите файл индекса Sitemap, добавив в него полные URL-адреса всех перечисленных файлов Sitemap, а затем ещё раз отправьте файлы.

Недопустимый XML: слишком много тегов

В файле Sitemap имеются повторяющиеся теги. Например, следующая запись станет причиной ошибки, поскольку тег <loc> повторяется в ней дважды:

 <url>  <loc>http://www.example.com/</loc>  <loc>http://www.example.com/stranitsa1.html</loc>  <lastmod>2005-01-01</lastmod>  <changefreq>monthly</changefreq>  <priority>0.8</priority> </url>

В сообщении об ошибке указываются тег и номер строки, в которой он находится. Удалите повторяющийся тег и ещё раз отправьте файл Sitemap.

Отсутствует атрибут XML

В одном из тегов в файле Sitemap отсутствует обязательный атрибут. Просмотрите файлы Sitemap и убедитесь, что все обязательные атрибуты на месте. Исправьте найденные ошибки в значениях атрибутов и ещё раз отправьте файл Sitemap.

Отсутствует тег XML

В одной или нескольких записях в файле Sitemap отсутствует обязательный тег. В сообщении об ошибке указывается номер строки. Сведения о обязательных тегах можно найти в статье о файлах Sitemap.

Отсутствует URL значка видео

В одной или нескольких записях о роликах отсутствует ссылка на значок видео. Убедитесь, что в тегах <video:thumbnail_loc> указаны URL всех таких значков.


Отсутствует название видео

В некоторых записях о роликах отсутствует название. Убедитесь, что в тегах <video:title> указаны названия всех видео. 

Неверный формат индекса Sitemap: вложенные файлы индекса Sitemap

В одной или нескольких записях файла индекса Sitemap указан его собственный URL или URL другого файла индекса Sitemap.

Файл индекса Sitemap может содержать ссылки только на обычные файлы Sitemap, а не на файлы индекса.

Удалите записи, указывающие на файлы индекса Sitemap и повторно отправьте файл Sitemap в Google.

Ошибка синтаксического анализа

Google не удалось выполнить синтаксический анализ XML-контента вашего файла Sitemap.

Часто это происходит из-за неэкранированных символов в одном из URL. Как и в файлах XML, любые значения данных (включая адреса URL) должны использовать экранирующие коды для некоторых символов, таких как & ‘ » < >. Проверьте, правильно ли настроено экранирование URL.

Временная ошибка

Файл Sitemap не удалось обработать из-за временной ошибки системы. Как правило, при этой ошибке отправлять файл заново нет необходимости. Робот Google попробует получить его позже. Если это сообщение об ошибке будет отображаться и по прошествии нескольких часов, отправьте Sitemap ещё раз.

Слишком много файлов Sitemap в файле индекса

В файле индекса более 50 000 файлов Sitemap. Разделите его на несколько и убедитесь, что в каждом указано не более 50 000 файлов Sitemap.


Слишком много URL в файле Sitemap

В файле Sitemap более 50 000 URL. Разделите его на несколько, каждый из которых содержит до 50 000 адресов. Для управления ими можно создать файл индекса Sitemap.

Неподдерживаемый формат файла

Вы создали некорректный файл. Он должен быть в формате XML и содержать правильный заголовок.

Распространенные ошибки XML:

  • Во файлах Sitemap должны быть правильные заголовки. Например, если содержание файла представляет информацию о видео, заголовок должен быть следующим:
     <?xml version="1.0" encoding="UTF-8"?> <urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"  xmlns:video="http://www.google.com/schemas/sitemap-video/1.1">
  • Пространство имен в заголовке должно иметь вид http://www.sitemaps.org/schemas/sitemap/0.9 (не .9).
  • Все атрибуты XML нужно заключать в одинарные (‘) или двойные («) кавычки, которые должны быть только прямыми. Внимание! Текстовые редакторы, например Microsoft Word, могут автоматически менять их на фигурные.

Несоответствующий путь: отсутствует префикс www

Путь к файлу Sitemap не содержит префикс www (например, http://example.com/sitemap.xml), а все перечисленные в нем URL содержат (например, http://www.example.com/myfile.html


).

Если вы хотите удалить префикс www из файла Sitemap, но сохранить его в URL, указанных в файле, выберите вариант с префиксом в качестве основного домена.

В противном случае измените файл Sitemap, удалив префикс www из всех URL.

Несоответствующий путь: имеется префикс www

Путь к файлу Sitemap содержит префикс www (например, http://www.example.com/sitemap.xml), а перечисленные в нем URL не содержат (например, http://example.com/myfile.xml).

Если вы хотите сохранить префикс www в файле Sitemap, но удалить его из указанных в файле URL, выберите вариант без префикса в качестве основного домена.

В противном случае измените файл Sitemap, добавив префикс www во все URL.

Неправильно указано пространство имен

В корневом элементе файла Sitemap неверно задано или отсутствует пространство имен, содержится орфографическая ошибка или неправильный URL.

Убедитесь, что пространство имен задано правильно с учетом типа файла. Пример:

  • Файл Sitemap: xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"
  • Файл Sitemap для видео: xmlns:video="http://www.google.com/schemas/sitemap-video/1.1"
  • Файл индекса Sitemap: <sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
  • Другие типы файла Sitemap…

Файл Sitemap начинается с пробела

Ваш файл Sitemap начинается с пробела, а не с пространства имен. Файлы XML должны начинаться с декларации XML, в которой указана используемая версия XML.


Эта ошибка не помешает Google обработать ваш файл Sitemap, однако лучше удалить пробел, чтобы файл соответствовал стандартам XML и сообщение об этой ошибке больше не появлялось.

Ошибка HTTP (конкретный код)

При попытке скачать файл Sitemap произошла ошибка HTTP. В сообщении о ней будет указан код статуса (например, 404). Убедитесь, что URL файла Sitemap записан верно и файл находится в указанном месте. Затем повторно отправьте его в Google.

Значок видео слишком велик

Значок видео, указанный в файле Sitemap, слишком велик. Измените его размер до 160 x 120 пикселей. При необходимости обновите файл Sitemap и повторно отправьте в Google. Подробнее о том, как добавить информацию о видео в файл Sitemap…

Значок видео слишком мал

Значок видео, указанный в файле Sitemap, слишком мал. Измените его размер до 160 x 120 пикселей. При необходимости обновите файл Sitemap.

Местоположения видео и страницы воспроизведения совпадают

URL видео и страницы воспроизведения не должны совпадать. Если используются оба тега (<video:player_loc> и <video:content_loc>), URL должны различаться.

URL местоположения видео указывает на страницу воспроизведения

URL <video:content_loc> в файле Sitemap для видео указывает на страницу, на которой размещен проигрыватель.

Файл Sitemap содержит URL, доступ к которым заблокирован в файле robots.txt

Роботу Google не удалось обработать файл Sitemap, поскольку доступ к нему или его содержанию заблокирован в файле robots.txt


. С помощью инструмента проверки файла robots.txt выясните, как именно заблокирован доступ, и внесите изменения, чтобы обеспечить сканирование.

support.google.com

Установка карты сайта плагином Google XML Sitemaps от 4.0 версии

В ранней статье «Строим карту xml плагином Google Sitemaps» я уже рассказал, каким образом создается подобный вид карты и возможно те, кто привык все делать по старинке найдут там полезную информацию, но большинство пользователей все-таки решило перейти на новую версию плагина, а для этого придется произвести кое-какие манипуляции.

Тем, кто еще не пользовался этим плагином, придется скачать его с официального сайта wordpress по этой ссылке, на день написания статьи уже доступна версия 4.0.7.

Скачать плагин Google XML Sitemaps

Далее устанавливаете его и активируете.

Для тех, у кого стоит старая версия, ниже 4.0, придется ее обновить из административной панели wordpress.


Обновление XML Sitemaps

Теперь очень важный момент, так как для работы прежней версии карты требовалось размещение в корневой папке сайта файлов sitemap.xml и sitemap.xml.gz, то после обновления они уже не понадобятся, поэтому их надо удалить.

Если перейти в настройки плагина, то он предлагает автоматически избавиться от ненужных элементов.

Удаление файлов xml

Если кому-то удобнее все делать в ручную, тогда переходите в коневую папку площадки, я для этого использую FTP клиент, и удаляете там выше перечисленные файлы.

Ручное удаление xml файлов

Теперь если вы посмотрите на свою sitemap xml карту сайта, то будите немного удивлены, потому что разработчики модуля решили перейти на новый формат хранения информации о страницах сайта.

Новый формат XML Sitemap

Настройка плагина Google XML Sitemaps

Теперь давайте пробежимся по всем настройкам обновленного плагина. В новой версии почему-то не до конца имеется перевод элементов настроек на русский язык, хотя и так все понятно, но лучше использовать встроенный в браузер онлайн переводчик.

Базовые параметры

Здесь я оставил первые галочки, чтобы происходило уведомление поисковиков Google и Bing об изменениях на сайте.

В виду того, что у меня уже в файле robots.txt прописан URL адрес к xml карте сайта, то третью галочку снимаем.

Предпоследняя строчка отвечает за отображение карты по ссылке http://ваш-сайт/sitemap.xml, однако если ее убрать, то никаких изменений у меня не произошло.

Приоритет статьи

У меня на тестируемой площадке все статьи имеют одинаковый приоритет, поэтому данную опцию я отключил.

Содержание карты сайта

Отмечаем страницы, которые будут загружаться в карту сайта, а также отмечаем самый последний пункт «Include the last modification time», чтобы помогать поисковикам определять, время изменения контента сайта.

Исключения

Если надо исключить категории из карты, то отмечаем нужные элементы или добавляем в специальное поле ID страниц и записей.

Время индексации

Плагин предлагает указать время, как часто поисковики должны индексировать страницы. Лично я считаю это элемент бесполезным, так как роботы ПС все равно не следуют данным предписаниям.

Приоритеты

Расставляем приоритеты значимости для страниц блога.

Подробно про установку и настройку карты сайта в формате XML с помощью плагина Google XML Sitemaps я рассказал в видео. Приятного просмотра.

Проверка индексации XML карты в Яндексе и Google

Далее нужно повторно отправить файл sitemap.xml на проверку в панели Вебмастер от Гугла, с Яндекс все куда проще, так как русский поисковик сам подхватит все изменения через несколько апдейтов при условии, что вы проверяли это файл там ранее.

Проверка для Яндекса

Переходим в панель Яндекс Вебмастер, а далее кликаем на вкладку «Настройка индексирования» — «Файлы Sitemap».

Файлы Sitemap в Яндекс

Затем указываем полный HTML адрес sitemap.xml карты и нажимаем проверить.

Проверка карты сайта Яндексом

Вас должно перебросить на страницу валидатора, который проверит файл sitemap на наличие ошибок.

Результат проверки валидатора

Далее останется подождать, пока алгоритмы Яндекс доберутся до новой xml карты сайта и переиндексируют ее содержимое.

Проверка для Google

Для Гугла все немного сложнее, так как понадобится повторно отправить файл обновленной карты на перепроверку. Для этого в панели вебмастера от Google переходим по вкладке «Сканирование» — «Файлы Sitemap»

Файлы Sitemap в Google

Далее нажимаем на ссылку sitemap.xml (эта ссылка появится, если вы раньше загружали старую версию карты), а затем жмем на кнопку «Отправить файл sitemap повторно».

Отправить файл sitemap

Появится сообщение, что файл отправлен и можно обновить страницу. После чего появится таблица со временем и датой обработки новой карты, а ниже вы увидите статус индексирования отдельных элементов xml файла.

Файлы Sitemap для Google

Через несколько минут, а может и часов, зависит от размера файла, Google полностью просканирует его содержимое, главное смотрите, чтобы были прочерки в столбце «Проблемы».

индексация карты сайта

Создание xml карты сайта плагином All in One Seo pack

Выше мы рассмотрели вариант построения структурированной карты сайта формата xml по средствам специального плагина, но не все, в том числе и я разделяют такой способ:

— Кого-то пугает ее странный вид, так как вместо обычных ссылок на статьи вы увидите что-то похожее на sitemap-pt-page-2013-03.xml, то есть привычный список ссылок будет разделен на несколько отдельных суб-карт.

— Другие нашли способ избавиться от лишнего модуля, построив карту с помощью плагина All in One Seo pack.

Итак, начнем…

Первое. Сначала избавляемся от плагина Google XML Sitemaps, для этого деактивируем его в административной панели и радуемся небольшому ускорению сайта. :)

Второе. Переходим в корневую папку и удаляем старые файлы sitemap.xml и sitemap.xml.gz, но все же рекомендую где-нибудь на компьютере сохранить их резервную копию.

удаляем старые xml файлы

Третье. Переходите во вкладку плагина All in One Seo pack «SEO инструменты» — «Другие модули» и активируете модуль «Карта сайта».

Активируем карту в SEO инструментах

Далее в «SEO инструментах» должна появится вкладка «XML карта сайта», перейдя в которую можно будет управлять настройками файла.

Основные настройки карты

В основных настройках указываем стандартный префикс файла, отмечаем какие поисковики следует уведомлять, если вы внесете изменения в ее содержание.

Далее указываем, из каких элементов будет состоять sitemap карта площадки, я оставил только записи и страницы, а также отметил самый последний пункт, чтобы плагин автоматически генерировал новую карту, по мере добавления новых ссылок.

Исключенные объекты

Здесь можно исключать из xml ненужные категории, страницы и записи.

Приоритет

Задаем приоритеты для страниц сайта.

Частота

Указываем, с какой частотой надо поисковикам индексировать страницы. Последние два параметра не имеют значимой роли.

Ну и конечно же не забываем проверить работоспособность новой карты по адресу http://seoslim.ru/sitemap.xml.

Вроде все. :) На этом я заканчиваю пост, хотел разделить его на две отдельных статьи, но в последний момент передумал.

Обязательно поделитесь в комментариях своими наработками по созданию xml карты с помощью плагинов «Google Sitemaps» и «SEO все в одном» очень интересно, какому из них вы отдали предпочтение. Пока!

seoslim.ru

Влияет ли файл sitemap.xml на продвижение сайта

Если у вас отсутствует sitemap, это не означает, что поисковики не станут индексировать ресурс. Поисковые роботы зачастую и без этого неплохо сканируют сайты и включают их в поиск. Но иногда могут возникать сбои, из-за которых порой удается отыскать не все веб-документы. Основными причинами являются:

  1. Разделы сайта, в которые можно попасть, только совершив длинную цепочку переходов;
  2. Динамические URL-адреса.

Создание sitemap.xml помогает решить эту проблему. 

Sitemap.xml влияет на SEO косвенно: облегчая и ускоряя индексацию страниц. 

Карта сайта sitemap в формате HTML

Карты сайта делятся на 2 основных вида или формата: карта сайта html и карта сайта файл xml. HTML карта сайта — это страница сайта, на которой перечислены ссылки. Обычно это ссылки на самые важные разделы и страницы сайта. HTML карта сайта больше рассчитана на людей, нежели на роботов и помогает быстрее ориентироваться в основных разделах сайта. Для карты сайта в виде html-страницы существуют серьезные ограничения по количеству ссылок на одной странице. Если на странице будет слишком много ссылок, далеко не все ссылки могут быть проиндексированы или вовсе страница карты сайта может быть исключена из поиска за чрезмерное количество ссылок, пусть даже внутренних ссылок.

Для того, чтобы карта сайта html правильно индексировалась и адекватно воспринималась посетителями не стоит размещать на странице более 100 ссылок. Этого более чем достаточно, чтобы разместить на странице все разделы и подразделы, которые не влезли в основное меню.

Обычно, файл sitemap в формате HTML имеет древовидную структуру, где указаны развернутые разделы и подразделы. Излишне громоздкие HTML карты сайта, зачастую оформляются графическими элементами, CSS-стилями и дополняются Java-script. Однако, карта сайта html не имеет большого значения для поисковых систем.

HTML карта сайта — это не есть полноценный sitemap. Как же быть, если на сайте сотни, тысячи, десятки тысяч страниц? Для этого необходимо разместить ссылки на все страницы в карте сайта в формате xml.

Карта сайта sitemap.txt

Еще одним способом оформления карты сайт в виде файла может быть карта сайта в формате txt:

1. http://site.ru/  2. http://site.ru/page/  3. http://site.ru/page1/

Все просто. В файле sitemap.txt построчно перечисляются все необходимые ссылки. Карта сайта в формате txt — это «вариант для ленивых». Здесь работает аналогичное sitemap xml ограничение в 50.000 ссылок. Однако, TXT карта сайта лишена возможностей указания даты последнего изменения и приоритета страницы.

Карта сайта XML Sitemap

XML карта сайта — это файл формата xml, вида sitemap.xml, который обычно находится в корне сайта. У карты сайта в формате xml есть множество преимуществ перед html картой сайта: 

  • Sitemap xml — это специальный формат карты сайта, который определяется всеми популярными поисковыми системами, например Google и Яндекс. 
  • В xml sitemap можно указать до 50.000 ссылок.
  • В sitemap xml можно указать относительный приоритет и частоту обновления страниц.

Содержимое карты сайта — лишь рекомендация для поискового робота. Например, если установить для страницы сайта ежегодную частоту обновления, поисковые роботы все равно будут ходить чаще. А если установить частоту обновления страницы ежечасно, это не значит, что роботы будет индексировать страницу каждый час.

Как создать правильный sitemap.xml

Рассмотрим, как сделать правильную xml-карту. Здесь должны быть соблюдены следующие требования:

  1. Размер файла должен быть не больше 10 мб;
  2. Карта должна содержать не больше 50000 ссылок. В тех случаях, когда ссылок больше, можно создать несколько карт и включить их в главную xml-карту;
  3. Адрес сайтмапа следует прописать в robots.txt;
  4. Также загрузите sitemap в яндекс и гугл (как добавить файл – описано ниже);
  5. Поисковые системы должны иметь доступ к карте. Необходимо использовать специальные теги, которые дают поисковикам понять, что это именно карта, а не что-то другое;
  6. У sitemap должна быть кодировка UTF-8.

Содержимое файла карты сайта sitemap.xml выглядит:

<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">   <url>   <loc>http://site.ru/</loc>   <lastmod>2015-10-18T18:54:13+04:00</lastmod>   <changefreq>always</changefreq>   <priority>1.0</priority>   </url>   <url>   <loc>http://site.ru/category/</loc>   <lastmod>2015-10-18T18:57:09+04:00</lastmod>   <changefreq>hourly</changefreq>   <priority>0.8</priority>   </url>   <url>   <loc>http://site.ru/page/</loc>   <lastmod>2015-10-18T18:59:37+04:00</lastmod>   <changefreq>daily</changefreq>   <priority>0.6</priority>   </url>  </urlset>

Где используются следующие обязательные теги:

  • <urlset> — родительский тег, в него заключаются все url-адреса;
  • <url> — тег, в котором указываются сведения о конкретном url-адресе;
  • <loc> — в данном теге указывается непосредственно url.

Далее, следуют необязательные теги:

  • <lastmod> — этот тег заключает в себе дату последнего изменения страницы;
  • <changefreq> — тег используется, чтобы указать насколько часто изменяется страница: always, hourly, daily, weekly, monthly, yearly, never;
  • <priority> — указывает приоритет определенной страницы, относительно других страниц сайта от 0,1 – низкий приоритет, до 1 – высокий приоритет.

Changefreq указывает на частоту изменений страницы:

  1. Hourly – обновление ежечасно;
  2. Always – всегда обновляется;
  3. Weekly – обновляется раз в неделю;
  4. Daily – обновления происходят ежедневно;
  5. Monthly – обновления происходят раз в месяц;
  6. Yearly – один раз в год;
  7. Never – не обновляется (такое значение лучше не использовать).

Priority сообщает поисковикам о степени важности страницы, по сравнению с другими. Приоритет можно выставлять от 0,1 (низкий) до 1 (высокий).

Priority рекомендуется расставлять следующим образом: максимальный для главной страницы (1), для рубрик средний (0,6), а для записей – минимальный (0,4).

Файл sitemap.xml должен содержать указание на пространство имен языка XML:

xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"

Если файл карты сайта включает более 50 тысяч ссылок или размер sitemap.xml превышает 10 мб, рекомендуется разделить карту сайта на несколько файлов. В таком случае, в карте сайта необходимо указать несколько ссылок на разные файлы карт.

<sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">   <sitemap>   <loc>http://site.ru/sitemaps/sitemap01.xml</loc>   <lastmod>2015-10-18T18:54:13+04:00</lastmod>   </sitemap>   <sitemap>   <loc>http://site.ru/sitemaps/sitemap02.xml</loc>   <lastmod>2015-10-18T18:54:13+04:00</lastmod>   </sitemap>  </sitemapindex>

Здесь используются уже знакомые нам теги <loc> и <lastmod>, а также обязательные теги:

  • <sitemapindex> — родительский тег, в который заключаются адреса всех карт сайта;
  • <sitemap> — тег, в котором заключается параметры для каждой карты сайта.

Как создать Sitemap.xml

Создание карты сайта важный процесс, в котором необходимо четко указать, какие страницы сайта нужно индексировать и как лучше их индексировать. В зависимости от того о каком типе карты сайта идет речь, используются различные способы создания карты сайта. Как создать html карту сайта обсуждать отдельно смысла нет. Рассмотрим как сделать карту карта в формате xml файла. Существует несколько основных способов создания карты сайта, но все их объединяет то, где находится карта сайта и как файл sitemap определяется поисковыми системами.

Как уже было написано выше — файл карты сайта размещается в корне сайта. Поисковые системы способны самостоятельно обнаружить файл карты сайта. Но существует несколько способов указания прямой ссылки на файл(ы) карты сайта(ов) для более скорого обнаружения поисковыми системами. Самый простой способ указать место расположения файла карты сайта — это непосредственное указание ссылки или нескольких ссылок на файлы карт сайта в инструментах для вебмастеров от Yandex и Google. Там же можно проверить карту сайта, провести анализ карты сайта на корректность, соответствие того, какие страницы из карты сайта найдены поисковой системой и сколько из них находится в индексации.

Второй способ указать поисковым системам на расположение файла карты сайта — это директива Sitemap файла robots.txt.

Указание ссылки на карту сайта в robots.txt:

Sitemap: http://site.ru/sitemap.xml

В robots.txt можно указать несколько файлов sitemap, после чего, он автоматически будут добавлены в инструменты для вебмастеров. Как найти карту сайта мы рассмотрели, теперь перейдем к тому, как создать карту сайта.

Основные способы создания карты сайта

  1. Генерация карты сайта силами системы управления сайта, если CMS имеет подобную встроенную возможность.
  2. Скачать карту сайта со стороннего онлайн сервиса. Существует множество online генераторов карт сайта с различным возможностями и ограничениями. Наверное, один из самых известных онлайн генераторов карты сайта — это Sitemap Generator. Он обладает достаточно большим функционалом и позволит вам бесплатно генерировать сайтмап на 1500 страниц, что достаточно много. Еще есть xml-sitemaps.com обладает возможностью настройки параметров карты сайта, но имеет ограничение по количеству ссылок в файле sitemap.xml в 500 штук.
  3. Скачать генератор карты сайта. Подобные программы генераторы обычно платные, но при их помощи можно можно регулярно генерить sitemap xml для одного или нескольких сайтов. Вот пара примеров подобных программ-генераторов: SiteMap XML Dynamic SiteMap Generator, WonderWebWare SiteMap Generatior.
  4. Автоматическое создание sitemap карты сайта в Joomla (Джумла), WordPress (Вордпресс), Bitrix (Битрикс), ModX.
  5. Создание карты сайта вручную.

Sitemap WordPress

Создать карту сайта для WordPress можно будет с помощью плагина Google XML Sitemaps. Для нее вы сможете произвести множество настроек, которые позволят исключить часть материалов вашего сайта, а также можете задать предполагаемую частоту обновления. Кроме создания карты, плагин Google XML Sitemaps при публикации новых материалов на вашем блоге уведомляет об этом многие поисковые системы, приглашая их побыстрее провести индексацию.

Google XML Sitemaps

Путь до файла сайтмап можете задать сами в настройках плагина и даже можете дать ему название отличное от классического sitemap.xml.

Sitemap Joomla

Создать карту сайта для Joomla можно с помощью компонента Xmap.

Xmap Joomla 3

Проверить Sitemap на битые ссылки

Чтобы не обманывать поискового робота sitemap.xml должна быть настроена без ошибок. Поэтому после каждого обновления файла нужно проверить sitemap на битые ссылки.

Проверка sitemap.xml в Яндекс Вебмастер

Зайдите в Яндекс Вебмастер — раздел «Инструменты» — «Анализ файлов Sitemap».

Выберите один из способов загрузки файла:

  • скопировать текст sitmepa.xml;
  • отправить URL карты сайта;
  • загрузить xml файл в сервис.

Sitemap.xml - создание карты сайта

Проверка sitemap.xml в Яндекс Вебмастер

Зайдите в Google Search Console — раздел «Сканирование» — «Файлы Sitemap».

Sitemap.xml - создание карты сайта

Анализ Sitemap.xml от PixelPlus

Инструмент от pixelplus.ru — Анализ XML-карты сайта. Он простой, крутой и понятный.

  1. Указываем карту сайта (URL) или загружаем XML-файл.

  2. Выбираем, требуется ли проверка кода ответа сервера для каждого URL в ней.

  3. Профит!

Sitemap.xml - создание карты сайта

Инструмент позволит проверить корректность карты сайта (файла формата *.xml), а также найти:

  • Ошибки валидности файла.

  • Те URL, которые отдают код ответа не 200 OK.

  • Прочие ошибки (указание на URL с другого домена, избыточный размер файла или числа URL в нём и так далее).

Напомним, что число допустимых URL в одном файле — 50 000 штук, а размер файла не должен превышать 10 МБайт.

Sitemap.xml - создание карты сайта

Если будут найдены ошибки (такое случается часто), то сервис подскажет, какие URL отдают некорректный ответ (удалены, лишние и так далее).

Sitemap.xml — важный инструмент

Карта сайта — один из важный инструмент SEO-продвижения сайта. Не важно, как будет создана карта сайта. Важно — какие ссылки будут перечислены в карте сайта и как часто она будет обновляться. Иногда, в карту сайта выгружается все подряд и даже те ссылки, которые запрещены в robots.txt или неканонические ссылки. А обновление карты сайта происходит раз в месяц или реже. Подобное отношение к карте сайта может не просто сделать ее бесполезной, но того хуже — запутать поискового робота, что негативно отразится на индексации и позициях сайта в поиске.

Создайте карту сайта для своего ресурса. Но будьте внимательны и хорошо подумайте, что выгружать в sitemap, а что нет.

webmaster-seo.ru

Как часто после создания нового сайта для него создается карта сайта? Судя по нашей статистике вновь прибывших проектов, как минимум 50-60% сайтов создаются без генерации карты в формате sitemap.xml. Да, можно аргументировать тем, что дело разработчика – это создать сайт. Как он будет индексироваться и нас колько быстро попадет в индекс поисковых систем — это дело владельца сайта. В принципе, тоже верно, но создать  Sitemap.XML и тем самым сделать как минимум приятный бонус для клиента – это вопрос нескольких минут.

Итак, что есть Sitemap.XML и чем может бать полезен? Расскажу об этом далее.

Sitemaps—XML-файл с информацией о страницах сайта для поисковых систем. Данный файл оказывает помощь поисковым системам в сканировании и индексировании страниц сайта. Стоит отметить, что данный файл не является директивой, а всего лишь своеобразным предложением к сканированию и индексации необходимых страниц сайта. Создавая такой файл для своего нового сайта, тем самым вы облегчаете (читайте, ускоряете) работу поисковых систем по сканированию и индексации сайта.

Пример Sitemap.xml

Привожу пример того как может выглядеть Sitemap в формате xml. (в нем описана только одна страница сайта)

<?xml version=”1.0″ encoding=”UTF-8″?>

<urlset xmlns=”http://www.sitemaps.org/schemas/sitemap/0.9″>

<url>

<loc>http://www.site.com.ua/</loc>

<lastmod>2010-16-07</lastmod>

<changefreq>daily</changefreq>

<priority>1.0/priority>

</url>

</urlset>

Как создать Sitemap.xml

Для автоматизированного создания карты сайта есть достаточно много онлайн сервисов. Например: раз, два.

Однако, все же рекомендую пользоваться программой A1 Sitemap Generator. Скачать и прочитать инструкцию.

Как использовать Sitemap.xml

Как правило, файл располагают в корневой директории сайта, чтобы он был доступен по адресу http://www.site.com.ua/sitemap.xml.

В файле должно быть не более 50 000 URL и размер его не должен превышать 10 МБ. Если требуется указать более 50 000 URL, создаем несколько файлов Sitemap.

Проверка корректности созданного файла Sitemap

Для определения элементов и атрибутов, которые могут появляться в файлах Sitemap, используются следующие XML-схемы:

  • Для файлов Sitemap
  • Для файлов индекса Sitemap

Оповещение поисковых систем о файле карты сайта

После создания файла карты сайта и его размещения, требуется оповестить создан и размещен на веб-сервере, необходимо оповестить поисковые системы о его местонахождени.

Данную операцию можно сделать несколькими методами:

  • с помощью панели вебмастера поисковой системы
  • указав местоположение файла в файле robots.txt
  • с помошью специального запроса к поисковой системе (как создать запрос описано ниже)

В таблице приведены запросы к некоторым поисковым системам

Эпилог

Стоит отметить, что создание таких файлов как sitemap.xml и robots.txt являются одними из первых «джентльменских» действий после создания нового сайта.

blog.aweb.ua

Поиск проблем индексации

С помощью «проверки XML-карты сайта» можно диагностировать и проблемы индексации. Для удобства выводится не только число найденных URL, но число документов в индексе Яндекса и Google для домена и их можно сравнить.

Потенциальные проблемы с индексацией, которые можно выявить:

  • Число документов в индексе какой-то из поисковых систем — сильно меньше найденного в файле. Проблемы индексации, которые требуется решить для роста поискового трафика.

  • В индексе сильно больше документов, чем в карте сайта. Дубли? Или в файл попали не все нужные URL.

  • Прочие.

Поиск проблем индексации

Доступна и история проведенных проверок.

История проверки

Удачи в работе!

tools.pixelplus.ru

Зачем нужен файл Sitemap?

В большинстве случаев грамотной внешней и внутренней перелинковки страниц достаточно, чтобы поисковые роботы узнали о всем содержимом сайта. Вместе с тем использование Карты сайта может заметно ускорить процесс полной индексации, особенно если:

  • Интернет-ресурс создан относительно недавно и пока не может похвастаться богатым профилем внешних ссылок;
  • в структуре сайта присутствуют многочисленные архивы веб-документов, не связанных между собой;
  • проект располагает большим количеством страниц, разделов, подразделов;
  • в структуре ресурса преобладают динамические страницы.

Во всех этих случаях всеобъемлющая индексация сайта поисковыми системами может оказаться под вопросом, если своевременно не позаботиться о файле Sitemap.

Базовые критерии создания файла Sitemap

К созданию Карты сайта выдвигается несколько основных требований, о которых веб-мастер должен всегда помнить.

Во-первых, количество URL-адресов в файле Sitemap не должно превышать 50 тысяч единиц. Если их больше, то необходимо создать несколько отдельных Карт сайта, которые прописываются в файле индекса Sitemap.

Во-вторых, максимальный размер файла – 10 Мб. Если несжатый файл превышает этот размер, его можно уменьшить при помощи архиватора gzip.

Sitemap xml проверить

В-третьих, файл Sitemap должен находиться на том же домене, что и веб-сайт, для которого он создан.

В-четвертых, составление Карты сайта предполагает использование кодировки UTF-8, а также латинских букв и цифр.

В-пятых, ответом сервера на обращение к файлу Sitemap должен быть HTTP-статус с кодом 200 OK.

Допустимые форматы Карты сайта

Особое требование предъявляется к формату файла Sitemap. Так, Карта сайта может быть создана в виде XML-файла, текстового файла или посредством RSS, mRSS и Atom 1.0. При этом наиболее распространенным форматом, который распознают все поисковые системы, считается XML-файл. С его помощью поисковикам можно сообщить не только о правильном местоположение страницы в иерархии сайта, но и:

  • о частоте обновления веб-документа в принципе (атрибут – changefreq);
  • о дате последнего обновления на странице (атрибут – lastmod);
  • о разной важности тех или иных страниц ресурса (атрибут – priority).

Пример Карты сайта в формате XML для PR-CY.ru, если бы он состоял из одной страницы и содержал упомянутые теги, мог бы выглядеть так:

<?xml version="1.0" encoding="UTF-8"?>  <urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">  <url>  <loc>http://www.pr-cy.ru/</loc>  <lastmod>2016-03-21</lastmod>  <changefreq>daily</changefreq>  <priority>0.8</priority>  </url>  </urlset>

Как создать и где разместить файл Sitemap?

При желании составить Карту сайта можно самому (вручную), что, впрочем, выглядит весьма трудозатратной затеей. Поэтому лучше создавать файл Sitemap автоматически, обратившись к услугам бесплатных онлайн-сервисов таких, как этот или этот.

После того, как Карта сайта готова, файл необходимо определить в корневую директорию. В этом случае ссылка, указывающая поисковым системам путь к файлу Sitemap, может быть следующей: http://www.pr-cy.ru/sitemap.xml

pr-cy.ru

Для следующего заголовка я получаю те же две ошибки на всех моих файлах Sitemap. Это сбивает с толку, потому что, если Google не сможет прочитать мою карту сайта, то как они могут сказать, что каждый URL имеет тот же приоритет? Заголовок загорается как строка 2 после объявления XML. Google утверждает, что индексировал около 2% URL-адресов с карт. Пожалуйста помоги.

ОБНОВЛЕНИЕ: Я думаю, что проблема в том, что я не знаю, как проверять схему. Как это сделать?

<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"  xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"  xsi:schemaLocation="http://www.sitemaps.org/schemas/sitemap/0.9/sitemap.xsd">  ==Parsing error We were unable to read your Sitemap. It may contain an entry we are  unable to recognize. Please validate your Sitemap before resubmitting.  ==Notice All the URLs in your Sitemap have the same priority...

ОБНОВЛЕНИЕ. Пожалуйста, будьте терпеливы, впервые проверяя XML. Я не понимаю ошибок.

Errors in the XML document:  4: 80 SchemaLocation: schemaLocation value = 'http://www.sitemaps.org/schemas/sitemap/0.9/sitemap.xsd' must have even number of URI's.  4: 80 cvc-elt.1: Cannot find the declaration of element 'urlset'.  XML document: 1 <?xml version="1.0" encoding="UTF-8"?> 2 <urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9" 3 xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" 4 xsi:schemaLocation="http://www.sitemaps.org/schemas/sitemap/0.9/sitemap.xsd"> 5 <url> 6 <loc>http://nutrograph.com/1-butter-salted</loc> 7 <changefreq>monthly</changefreq> 8 <priority>0.8</priority> 9 </url> 10 <url> 11 <loc>http://nutrograph.com/2-butter-whipped-with-salt</loc> 12 <changefreq>monthly</changefreq> 13 <priority>0.8</priority> 14 </url> 15 </urlset>

code-examples.net

Структура Sitemap.xml

Файл размечается XML-тегами, основные из которых указывают на:

  • Важность страницы в диапазоне от 0,1 до 1,0 (где 0,1 – самый низкий, а 1,0 – самый высокий приоритет).
  • Частоту обновления (раз в час, раз в день, раз в неделю, раз в месяц, раз в год, никогда или всегда).
  • Описание страницы и ее начало (это обязательный элемент карты сайта).
  • Адрес страницы сайта (это тоже обязательный элемент карты сайта).
  • Дату последнего изменения страницы (это опциональный элемент).

Размещение Sitemap.xml

Существуют правила расположения файла Sitemap.xml, соблюдение которых позволит достичь наилучших результатов в продвижении ресурса.

  • Документ Sitemap.xml рекомендуется размещать в корневой директории сайта.
  • Все имеющиеся на сайте ссылки нужно размещать на одном домене с файлом Sitemap.xml.
  • Ссылки, имеющиеся в документе Sitemap.xml, должны использовать тот же протокол, что и ссылки, размещенные на сайте (http или https, с www. или без www.).
  • В файле Robots.txt необходимо указать путь к карте сайта.

Файлы Sitemap

Разрешается размещать не только основной документ Sitemap.xml, но и дополнительные файлы, подобные основному. Каждый их этих файлов может содержать не больше 50 тыс. ссылок, а общий размер документов не должен быть более 10 МБ. В случае необходимости Sitemap.xml можно сжимать стандартным архиватором. Дополнительные файлы используются в том случае, если превышен объем основного файла. Каждый дополнительный файл перечисляется в индексе, а его формат идентичен исходному.

Польза Sitemap.xml

Документ Sitemap.xml используется в поисковом продвижении и особенно важен в том случае, если:

  • Сайт относительно молодой и ссылок, которые ведут на него с других ресурсов, для эффективного продвижения слишком мало.
  • На сайте содержится большое количество страниц, которые не связаны друг с другом навигационными ссылками.
  • На сайте размещаются мультимедиа данные, не индексируемые ботом.
  • Содержание страниц сайта постоянно обновляется.

Sitemap для Google.News

При продвижении новостного сайта в новостном агрегаторе Google News необходимо создавать отдельный файл Карты сайта для улучшенной индексации.

Генерация карты сайты (Sitemap)

В большинстве популярных CMS предусмотрена автоматическая генерация карт сайта. Если у вашего сайта отсутствует такая возможность, то можно воспользоваться сервисом: https://www.xml-sitemaps.com.

Статья в тему: Как создать и настроить карту сайта в XML и HTML.

Проверка карты сайта (Sitemap) на валидность

Самый простой способ проверить файл сайтмапа на валидность — добавить в вебмастеры поисковых систем и, если есть проблемы и ошибки, то вы их увидите в панели.

apanshin.ru


You May Also Like

About the Author: admind

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *

Этот сайт использует Akismet для борьбы со спамом. Узнайте как обрабатываются ваши данные комментариев.