Что означает Rel Canonical?
Это атрибут указывается в теге <link> и используется для отображения канонических страниц на сайте. Каноническая страница – является главной страницей, именно она будет индексироваться поисковой системой при наличии дублей на сайте.
История Canonical
12 февраля 2009 года Google представил атрибут canonical, который был создан, чтобы избавить сайт от дублированных страниц, указав необходимый URL адрес (каноническую страницу).
23 мая 2011 года поисковая система Яндекс так же запустила поддержку данного атрибута.
Где прописывать rel canonical
<html>
<head>
<link rel=”canonical” href=”http://edison.bz/”
</head>
Атрибут тега <link> rel canonical прописывается в разделе <head> и может встречаться только 1 раз на странице. Данный тег не может указывается в других разделах на сайте <body> или <footer>.
Каноническая ссылка – что это?
Каноническая страница – более приоритетная страница по сравнению с остальными.
Каноническая ссылка (с атрибутом rel=canonical тега link) – является подсказкой, но не директивой.
Давайте разберем конкретный пример:
У нас имеется каноническая страница, на которую мы хотим ссылаться в случае с дублями.
http://site.ru/
Страницы дублей выглядят по-разному:
http://site.ru/apple-iphone7/
http://site.ru/appleiphone7/
http://site.ru/iphone7/
Соответственно на данные страницы в разделе <head> прописываем:
<link rel=”canonical” href=http://site.ru/apple/iphone7/ />
Тег link с атрибутом каноникал будет являться канонической ссылкой.
Данную проблему мы можем решить другим способом. Со страниц дублей будет идти ReDirect 301 на главную (каноническую страницу). О 301-редиректе я расскажу в следующей статье.
Для главной страницы атрибут canonical необязателен, так как мы указываем в robots.txt директиву Host.
Что делать с пагинацией в интернет-магазине?
Нужен ли Canonical, где имеются карточки товаров? На этот вопрос уже ответил Яндекс:
“Если в какой-либо категории на вашем сайте находится большое количество товаров, могут появиться страницы пагинации (порядковой нумерации страниц), на которых собраны все товары данной категории. Если на такие страницы нет трафика из поисковых систем и их контент во многом идентичен, то советую настраивать атрибут rel=»canonical» тега <link> на подобных страницах и делать страницы второй, третьей и дальнейшей нумерации неканоническими, а в качестве канонического (главного) адреса указывать первую страницу каталога, только она будет участвовать в результатах поиска.
Например, страница сайт.рф/ромашки/1 — каноническая, с неё начинается каталог, а страницы вида сайт.рф/ромашки/2 и сайт.рф/ромашки/3 — неканонические, в поиск их можно не включать. Это не только предотвратит возможное дублирование контента, но и позволит указать роботу, какая именно страница должна находиться в выдаче по запросам. “
То если страницы пагинаций вида:
http://site.ru/category-name/2/
http://site.ru/category-name/3/
http://site.ru/category-name/4/
Читайте в нашем блоге: Поисковые системы — список популярных систем в России
Каноническая ссылка будет такой:
<link rel=”canonical” href=”http://site.ru/category-name/” />
Рекомендую ознакомится со следующим списком статей, который помогут сделать внутреннюю оптимизацию сайта качественно:
Как правильно прописать Title страницы
ЧПУ ссылки – как выглядит правильный URL?
Rel Canonical – как правильно использовать
ALT картинки — как правильно прописать
Мета-тег Description — разбор с примерами
LSI и SEO тексты – 5 основных отличий
Как правило, проблемы с дублями возникают со стороны платформы (чаще всего это известные CMS Joomla, Opencart и прочие). Opencart вообще можно вынести в отдельную категорию, так как не до конца решена проблема, во всяком случае у меня разобраться не получилось и пришлось переносить все на другой движок. (Никому не рекомендую данный движок)
Но так же существуют ошибки со стороны оптимизатора которые я описал ниже.
Основные ошибки написания Canonical
Неверный ответ сервера.
Страница, на которую ставим тег link rel=” canonical” должна быть работоспособной. То есть ответ сервера должен быть 200.
Проверить robots.txt
Возможно, что данная страница закрыта от индексации поисковых роботов.
Дублирование и расположение атрибута.
Важно, чтобы тег встречался всего 1 раз на странице и располагался только в теге <head>.
Отсутствие цепочек ссылок.
Со всех дублирующихся страниц все канонические ссылки указывают на 1 каноническую страницу. Чтобы не получилось, что одна ссылка ссылается на другую вторая на третью и так далее.
Rel Canonical в CMS WordPress
Прописать тег Canonical в CMS WordPress вы можете c помощью плагинов:
Плагин SEO Yoast
В SEO Yoast ограниченный функционал, можно указать только в поле необходимый канонический URL.
Плагин All in SEO
В All in SEO имеется возможность так же указывать канонический URL, а так же запрещать пагинацию для канонических URL(то есть ПС не будет индексировать эти страницы).
Заключение
Учитывая проблемы многих платформ, данный атрибут обязательно стоит учитывать, ведь он влияет на индексацию страниц вашего сайта.
Думаю, я рассказал большую часть про атрибут Rel=” Canonical”. Пишите в комментариях, как вы используете канонические ссылки на своих сайтах.
edison.bz
Зачем нужны canonical-адреса
Канонический URL (canonical) позволяет указать поисковой системе, какая ссылка является предпочтительной для индексации. Настройкой canonical необходимо заниматься, если у вас на сайте имеются страницы с одинаковым содержанием. Ввиду особенностей CMS сайта могут автоматически создаваться страницы с одним и тем же контентом по разным адресам URL (более подробно читайте ниже). Появление подобных страниц возможно вследствие таких причин:
- Если вы написали одно и то же сообщение в разных темах блога, то есть вероятность автоматического создания еще одной страницы сайта.
- Например, у вас есть несколько доменов: http://article.example.com и http://blogs.example.com. И вы планируете размещать информацию сразу на обоих ресурсах. В таком случае размещаемый контент будет дублированным.
- Если была обновлена структура вашего сайта, после чего URL страниц сайта могли быть изменены.
Чтобы не допустить дублирования страниц сайта в поисковой выдаче, необходимо настроить канонические URL, после чего поисковик сможет определить, какую страницу нужно индексировать. Рассмотрим причины, из-за которых важно заниматься настройкой canonical:
- Если на разных страницах вашего сайта публикуется частично или полностью идентичная информация, то следует указать, какую страницу следует считать основной.
- Одна и та же информация, размещенная на разных страницах, затрудняет получение статистики о данных страницах.
Как настроить канонические адреса
Рассмотрим способы настройки «канонических» URL:
- Следует указать, какой URL считается основным. Сделать это можно при помощи атрибута rel=»canonical» тега link. Например, на сайте присутствует несколько страниц с идентичным содержимым. Для того чтобы задать URL https://example.com/buyingcar в качестве основного, указываем на страницах с дублируемым контентом в блоке head кода страницы тег вида <link rel=»canonical» href=»https://example.com/buyingcar» />. В данной ситуации вы задаете главный URL, который в дальнейшем будет использован для просмотра сообщения о покупке автомобилей. Также эта страница будет показываться в результатах поисковой выдачи. Предпочтительнее задавать адрес сайта в абсолютном виде (https://example.com/buyingcar), избегайте относительных путей (/buyingcar).
- В карту сайта добавляем только канонические URL, в таком случае вы сможете сообщить поисковому роботу, какие страницы сайта вы считаете основными. При индексировании сайта поисковой робот не будет заходить на неканонические страницы, тем самым быстрее индексируя сайт.
- Для различных CMS существуют различные плагины, которые позволяют настроить канонические URL, например, для WordPress можно воспользоваться Yoast SEO.
Для OpenCart настройка атрибута canonical производится средствами CMS. Необходимо зайти в настройки товара и задать параметр SEO URL.
Для настройки canonical в Joomla нужно включить в настройках CMS функцию SEF. После включения для технических страниц вида /index.php?option будет добавлен атрибут rel=»canonical» (с указанием URL на страницу с настроенным ЧПУ).
Как проверить дублированный контент
Проверить, настроен canonical для страниц вашего сайта или нет, можно с помощью следующих инструментов:
1. Для проверки настройки canonical, открываем html-код страницы и проверяем наличие атрибута canonical у тега link (в блоке <head> кода страницы).
Плагин для браузеров RDS Bar позволит просмотреть эту информацию без совершения лишних действий. Включаем данную опцию в настройках плагина (Параметры – SEO – теги – Canonical), после чего при переходе на страницы, где canonical настроен, будет отображаться следующая информация:

2. Проверить наличие дублируемого контента можно с помощью Расширенного поиска Яндекса. Для этого указываем адрес сайта и часть текста со страницы, контент которой будем проверять на дублирование. В результатах поиска будет указано, нашлись точные совпадения или нет. Если дублирование отсутствует, то будут предложены варианты по запросу.
Также проверить контент на наличие дублей можно с помощью операторов поиска, рассмотрим на примере Google. Для этого нужно ввести в поисковую строку site:имя_домена «запрос», в итоге аналогично поиску от Яндекса по результатам поисковой выдачи делаем вывод о наличии дублированного контента.
3. Еще один способ найти дублируемый контент – уникальность. В этом нам помогут специальные программы и сервисы, мы рассмотрим на примере сервиса text.ru. Для анализа необходимо добавить информацию со страницы вашего сайта в сервис и запустить проверку. В результате вы увидите, на каких сайтах в Интернете есть такой же текст, и на сколько процентов ваш текст совпадает с текстами других сайтов.
Итог
Грамотно настроенный canonical повышает эффективность работы и ускоряет индексирование сайта. Если у вас не получится самостоятельно это сделать, то вы можете обратиться к нашим специалистам, и мы сделаем настройку rel=»canonical» для вашего сайта.
1ps.ru
Для чего выбирать канонический URL?
Указывать каноническую страницу из числа одинаковых или похожих стоит в следующих случаях:
- Если нужно выбрать, какой URL следует показывать в результатах поиска. Предположим, вы хотите, чтобы посетители переходили на страницу с описанием платьев зеленого цвета по адресу
https://www.example.com/dresses/green/greendress.html
, а неhttps://example.com/dresses/cocktail?gclid=ABCD
. - Для консолидации переходов на одинаковые или повторяющиеся страницы. Это поможет поисковым системам связать материалы, опубликованные на разных страницах, с одним основным адресом. В результате ссылки с других сайтов на страницу
http://example.com/dresses/cocktail?gclid=ABCD
будут объединены со ссылками наhttps://www.example.com/dresses/green/greendress.html
. - Чтобы упростить получение статистики по отдельным товарам или темам. Если контент размещен на нескольких страницах с разными URL, это затрудняет получение обобщенной статистики по нему.
- Для управления скопированным контентом. Если вы размещаете свои материалы по различным URL, потребуется задать самый высокий рейтинг для исходной страницы.
- Чтобы оптимизировать затраты ресурсов на сканирование повторяющихся страниц. Желательно, чтобы роботу Googlebot не приходилось сканировать множество вариантов страниц, например предназначенных для разных типов устройств или обновляемых. В противном случае поисковая индексация вашего сайта не будет выполняться эффективно.
Как узнать, какой URL роботы Google считают каноническим?
Чтобы узнать, какую страницу Google считает канонической, воспользуйтесь инструментом проверки URL. Обратите внимание, что, даже если вы укажете ее, Google может выбрать другую. Это зависит от многих факторов, например от представленных на странице материалов или ее эффективности в Google Поиске.
Как указать каноническую страницу
Существует несколько способов указать каноническую страницу из числа повторяющихся:
Способ | Описание |
---|---|
Общие положения | Все способы канонизации URL приведены по этой ссылке. |
Указание основного домена |
В Search Console вы можете указать URL в одном домене как канонический для аналогичных страниц в другом домене, например example.com для www.example.com. Этот способ подходит, только если у вас есть два похожих сайта, которые отличаются лишь доменом. Не используйте этот способ для URL, отличающихся протоколом – http и https. Плюсы
Минусы
|
Тег rel=canonical <link> |
Добавьте в код всех повторяющихся страниц тег <link>. Плюсы
Минусы
|
HTTP-заголовок rel=canonical |
Включите в ответ страницы заголовок rel=canonical. Плюсы
Минусы
|
Файл Sitemap |
Укажите канонические страницы в файле Sitemap. Плюсы
Минусы
|
Код статуса 301 | Используйте код статуса 301, чтобы сообщить роботу Googlebot, что URL, заданный в качестве нового адреса страницы, ведет на ее более актуальную версию. |
Вариант страницы в формате AMP | Если один из вариантов страницы – AMP, укажите каноническую страницу и ее варианты согласно инструкциям для AMP. |
Мы рекомендуем использовать перечисленные выше методы, однако ни один из них не является обязательным. Если вы не укажете канонический URL, мы попытаемся определить его самостоятельно.
Общие положения
Ниже приведены общие инструкции по указанию канонических URL.
Способы
Указать канонический URL для повторяющихся URL или похожих страниц можно одним из способов, описанных ниже.
Какой бы способ вы ни выбрали, обязательно следуйте приведенным выше общим рекомендациям.
support.google.com
Не так давно, Яндекс стал учитывать атрибут rel="canonical" . Я в этом убедился на своей шкуре. Специальных экспериментов не ставил, просто так получилось. ) Читайте.
В конце мая этого года, на официальном блоге яндекс поиска была опубликована новость – “Поддержка атрибута rel=”canonical” роботом Яндекса”. Яндекс наконец-то стал учитывать атрибут canonical.
Атрибут тега <link> rel="canonical" используется для того, чтобы объяснить поисковому роботу, какая страница сайта является канонической. Если сайт имеет две или более страниц с одинаковым содержанием, но с разными адресами, то тег показывает роботам, какую страницу следует считать канонической. Яндекс.Помощь вебмастеру: rel="canonical"
Непроизвольный эксперимент с атрибутом rel="canonical"
Эксперимент №1 — Кривые темы WordPress
В некоторых темах wordpress сделан вывод тега <link> с атрибутом rel="canonical". Тема этого блога сделана на основе одной из готовых тем, где как раз и был сделан вывод тега <link> с атрибутом canonical.
Я проверял корректность вывода url указанного в этом теге в статьях, но не проверял корректность url в рубриках и на главной странице. Так бы и не заметил ошибки, если бы яндекс не стал учитывать canonical.
После очередного обновления поисковой базы, я увидел, что в выдаче яндекса по запросу, которому соответствует последняя опубликованная на блоге запись, появилась главная страница блога. Заголовок сниппета в выдаче был как у последней статьи.
Почему?!
Я сразу сел писать гневное письмо Платону — как так, что там у вас за баги.
Написал. Перед отправкой письма, на всякий случай, решил посмотреть код страниц блога. Посмотрел. )) В коде главной страницы, я увидел, что в теге с атрибутом rel="canonical" отображается url последней записи на блоге, а на страницах рубрик, отображается url последней записи опубликованной в этой рубрике. То есть, ошибки у меня на сайте. Пока Яндекс не учитывал canonical, я этого не замечал.
Тема WordPress, на основе которой была сделана моя тема блога, была сделана криво. На главной странице и в рубриках, в теге <link> с атрибутом rel="canonical", выводился url последних записей, а не url главной и рубрик.
Код в шаблоне header.php был такой:
<link rel="canonical" href="<?php the_permalink(); ?>" />
Исправил. Теперь всё нормально.
Но и это ещё не всё. )
Эксперимент №2 — Кривые руки
В какой-то момент заметил, что один мой сайт, который имел около 30 страниц в индексе, вылетел из индекса. Сначала осталось 5 страниц. Я подумал АГС. После следующего обновления поисковой базы, осталась только главная страница. Бан, подумал я. )
В принципе, было за что. Контента мало, а полезного — совсем нету. Предположил, что какой-то интересный запрос попал в топ и кто-то пожаловался. Как итог, наложение фильтра. Плюс прогонял сайт по трастовым профилям. Может фильтр за спамные ссылки.
Расстроился и смирился. Забыл на несколько дней. Потом в один прекрасный день подумал, а вдруг это тоже связано с тем, что яндекс стал учитывать атрибут canonical. Вдруг и там накосячил с этим атрибутом.
И точно. На всех страницах сайта выводился url главной страницы. Посмотрел данные по сайту в панели вебмастера. Робот исключил все страницы именно из-за того, что на всех страницах была указана главная страница как каноническая.
В коде документа в тэге link содержится параметр rel="canonical", указывающий на другой (канонический) документ. Вместо данного документа проиндексирован канонический.
Исправил. Вернее, совсем убрал этот тег.
Часть страниц через пару АПов вернулась в индекс. Вернуться и остальные.
Странно, но Google всё показывал как надо. Главная – с заголовком главной, посты – со своими заголовками. Может тоже учитывал, но по своему. )
Вот такой практический пример того, что Яндекс теперь действительно учитывает атрибут canonical. Да ещё как учитывает. ) Лучше не прописывать тег link с canonical’ом, чем прописать криво.
seobook.info
Что такое канонические URL адреса?
В широком смысле слова, канонический означает «принятый за образец», «твердо установленный». То есть, канонический URL это, грубо говоря, основной адрес страницы.
Обычно, один материал имеет один URL адрес, к примеру www.example.ru/1.html. Но иногда одна и так же страница может быть доступна по нескольким адресам. К примеру: www.example.ru/1.html и www.example.ru/1/1.html. В таком случае, необходимо определить, какой из 2-х адресов является основным или каноническим.
Предположим, что www.example.ru/1.html был выбран в качестве основного URL. Тогда на странице с данным адресом (а так же, других страницах с копией контента) необходимо разместить следующий элемент:
<link rel="canonical" href="www.example.ru/1.html" />
Размещается он в шапке сайта, между тегов <head></head>.
Внимание! Что бы снизить вероятность ошибки, внутри элемента link rel=»canonical» необходимо использовать абсолютные, а не относительные адреса. То есть, добавлять к ссылке домен.
Убедитесь, что в технической карте сайта sitemap.xml размещены именно канонические ссылки. Иначе это может привести к ошибкам индексирования.
Примеры канонических адресов
Предположим, что мы создали статью о продвижении Интернет-магазина одежды, для которой сделали красивый, понятный для человека URL.
Но статья осталась доступна по техническому адресу, который мы больше видеть не хотим.
В этом случае, на странице со статьей, нам необходимо прописать элемент <link rel=»canonical» href=»https://dh-agency.ru/prodvijenie-magazina-odejdy/» />, в котором указан основной, канонический адрес.
Вот таким образом:
Теперь адрес https://dh-agency.ru/prodvijenie-magazina-odejdy/ будет считаться основным.
Роль канонических адресов страниц в SEO
С точки зрения поисковой оптимизации, наличие одного основного URL адреса страницы просто необходимо. Во-первых, это позволяет сэкономить время, так как роботу не приходится загружать копии контента. Во-вторых, не остается никаких сомнений, какой адрес должен участвовать в поисковой выдаче. В-третьих, снижается нагрузка на сайт, что так-же важно для посещаемого ресурса.
Нужно понимать, что краулер отводит ограниченное количество времени на индексацию сайта, поэтому многочисленные дубли страниц могут сильно ударить по эффективности его работы.
Правильно устанавливаем канонические URL адреса
Правильно установленный канонический адрес отвечает следующим требованиям:
-
Каноническая страница, указанная в элементе link rel=»canonical», обязательно должна существовать и быть доступна для пользователей;
-
Канонический адрес должен быть указан только для одного домена и поддомена. Грубо говоря, не должно быть ссылок на другие ресурсы;
-
Для страницы может быть указан один единственный канонический адрес;
-
Убедитесь, что на сайте отсутствуют рекурсии или «цепочки» канонических адресов. То есть, одна страница не должна ссылаться на другую, которая, в свою очередь, ссылается на третью или первую;
-
Элемент link rel=»canonical» должен находится между тегами <head></head>.
Уверены, что Ваши канонические адреса соответствуют всем вышеуказанным требованиям? Тогда можете считать их просто превосходными!
Понятие «каноническая ссылка»
Те, кто только начал окунаться в основы поисковой оптимизации, иногда разделяют понятия «канонический адрес» и «каноническая ссылка». На самом деле, речь идет об одном и том же — о главном URL адресе страницы.
Нет никаких канонических <a href=»»> </a> и «главных ссылок ссылок для перелинковки».
301 редирект — замена rel=»canonical»?
Когда речь заходит о выборе между 301 редиректом и элементом link rel=»canonical», мы обычно советуем использовать именно переадресацию. Все дело в том, что тег link rel=»canonical» не является обязательным, то есть, может быть проигнорирован поисковой системой.
Использование link rel=»canonical» актуально только тогда, когда сделать 301 редирект невозможно или проблематично.
Есть и еще один плюс link rel=»canonical» перед 301 редиректом — его простановку возможно сделать автоматической при создании страницы. К примеру, в WordPress эта функция уже реализована. То есть, заранее указав канонический адрес, Вы можете избавить себя от будущих проблем с индексацией.
Яндекс Вебмастер — статус «неканоническая»
В Яндекс Вебмастере есть раздел «Исключенные страницы«, добраться туда можно из меню «Индексирование» -> «Страницы в поиске» -> «Исключенные страницы«.
Перейдя в этот раздел, Вы увидите все материалы, которые были по какой либо причине загружены в базу, но исключены из поиска.
Среди прочих причин исключения Вы можете увидеть статус «Неканоническая». Нажав на троеточие, отроется сообщение следующего вида:
«Страница проиндексирована по каноническому адресу https://dh-agency.ru/category/vnutrennyaya-optimizaciya/design/, который был указан в атрибуте rel=»canonical» в исходном коде. Исправьте или удалите атрибут canonical, если он указан некорректно. Робот отследит изменения автоматически.»
Что это значит?
Ничего страшного не произошло. Робот Яндекса проиндексировал страницу по первому (написанному синем шрифтом) URL, при этом на самой странице стоял элемент link rel=»canonical», в котором, в качестве канонического, был указан другой адрес (написанный серым шрифтом).
Пользуясь данной инструкцией, робот исключил неканонический URL.
Переживать, что материал был полностью исключен из поиска не стоит, он находится в выдаче, но по другому URL адресу.
Что с этим делать?
Если Вас не устраивает URL, который был выбран в качестве основного, необходимо поменять адрес в элементе link rel=»canonical» на предпочтительный. После изменения, страницу желательно отправить на переобход индексирующему роботу.
(«Индексирование» -> «Переобход страниц«)
Так изменения будут загружены в базу в самое ближайшее время.
Только не забудьте изменить адрес в файле sitemap.xml.
dh-agency.ru
Пример канонических URL адресов страниц
Характерный пример — страница сайта доступна по нескольким адресам:
site.ru/page?id=3 site.ru/blog/seo/yandex site.ru/blog/yandex
Допустим, что предпочитаемым (каноническим) URL адресом является — /blog/seo/yandex. Значит в коде страниц:
site.ru/page?id=3 site.ru/blog/yandex
необходимо отразить адрес канонической страницы:
site.ru/blog/seo/yandex
Готовый код канонической ссылки:
<link rel="canonical" href="http://site.ru/blog/seo/yandex"/>
Что такое канонические ссылки
Каноническая страница — это оригинальная страница или первоисточник. Каноническая ссылка (с атрибутом rel=canonical тега link) — не является строгой дерективой. Это значит, что указание страницы как канонической может как учитываться так и игнорироваться поисковыми роботами. Поисковые системы негативно относятся к дублированому контенту, будь это кража контента с дргого сайта или дубликаты страниц на одном сайте.
Часто дублирование контента происходит из-за некорректной или плохо настроенной CMS. Организация канонических страниц как существенная часть seo оптимизации сайта позволяет избежать индексирования страниц-дублей. Кроме того, что это может снизить нагрузку на сайт, удаление ненужных страниц оптимизирует расход ресурсов, которые тратят поисковые системы на индексацию. Поисковые роботы будут быстрее находить новые страницы и другие изменения на сайте.
Как работают канонические ссылки
Правила, которые определяют корректное восприятие rel=canonical поисковыми системами:
- каноническая страница должна существовать и быть доступна для индексирования;
- адрес канонической ссылки не должен быть указан в домене другого сайта (и поддомене для Яндекса);
- на одной странице не может быть более одного канонического URL страницы;
- не должно существовать цепочек канонических ссылок, где на странице являющейся канонической для одной стоит каноническая ссылка на другую страницу (1=>2=>3).
Канонические ссылки (атрибут тега link rel canonical) позволяет указать какую именно страницу из группы похожих или одинаковых страниц нужно индексировать. Полезность данного инструмента сложно переоценить и глупо игнорировать. Ведь именно к правильному толкованию страниц сайта поисковыми системами, в значительной степени и сводится SEO сайта. Тем более, что канонические ссылки поддерживаются практически любой современной CMS вроде Joomla или WordPress.
Пишите в комментариях используете ли вы каннонические ссылки на своем сайте.
Делайте репосты статьи. Подписывайтесь на наш SEO блог.
Не дублируйте контент и ставьте правильные ссылки!
convertmonster.ru
Постраничная навигация
Она же пагинация — важный элемент структуры сайтов. Часто можно встретить запрос «страницы пагинации нужно ли закрывать от индексации или нет?». Ответ на который я разберу.
Важные изменения
С 21 марта 2019 Google объявил что прекращает поддержку rel prev/next. На данный момент мало информации. Это следует учитывать.
Немного конспирологии
Вначале несколько риторических вопросов…
1. Заинтересован ли Яндекс в том чтобы Гугл хорошо ранжировал ваш сайт?
2. Нужен ли Яндексу рост количества людей, пишущих «яндекс-г**но, в гугле всё норм, а тут хрен»?
3. К какой поисковой системе будет более лоялен владелец сайта? К той где он ниже или выше? И куда более вероятно понесет денежки?
4. Как проще: поднимать у себя или подтолкнуть к шагу вниз у конкурента?
Подумайте на досуге.
Немного терминологии
Переобуваться [несовершенное действие], Переобуться [совершенное действие] — Снимать с себя обувь и надевать другую.
Коротко будем называть НД и СД.
Что такое Дубли
Явные дубли — страницы с одинаковым содержимым по разным адресам, например на Opencart:
- сайт/товар
- сайт/категория/товар
- сайт/поиск/товар
Неявные дубли — страницы похожие между собой «на 99%», например:
- iPhone X 128Gb черный РСТ
- iPhone X 128Gb черный Евротест
При этом полностью одинаковое описание и характеристики.
Отличия в картинках в принципе не учитываются, только текстовое содержание.
Дубли ли страницы Пагинации
Основополагающим на странице является контент(он должен различаться), заголовки и метатеги это лишь названия и краткое описание (различий в один символ в них достаточно).
В случае интернет-магазинов на каждой странице размещены разные товары (это и есть контент), он не повторяется.
Технически поисковым системам сложно сравнивать контент со 100% гарантией, в отличии от title, description, H1. Поэтому нужно делать их уникальными для каждой из страниц. Так же полезно для юзабилити информировать пользователя дополнительной меткой с указанием например номера страницы.
Возможны исключения, когда категории состоят из очень похожих товаров, и сами по себе товары по сути неявные дубли. Например:
категория ГВОЗДИ гладкие
- Гвоздь гладкий 10мм
- Гвоздь гладкий 12мм
- Гвоздь гладкий 15мм
- …
- Гвоздь гладкий 250мм
При таком раскладе не имеет смысла пускать лишние страницы в индекс. Хотя тут проблемы куда глобальнее чем пагинация.
Что говорит Гугл
https://support.google.com/webmasters/answer/1663744
Если кратко:
- prev | next
- или canonical на страницу «показать все» если имеется (не на первую, а на «показать все»)
- или ничего не делать
и давать полный доступ для индексации
Ну и контрольный в голову
https://webmasters.googleblog.com/2013/04/5-common-mistakes-with-relcanonical.html
Топ 5 заблуждений про canonical от Гугл, и первый в списке «Mistake 1: rel=canonical to the first page of a paginated series»
Яндекс canonical
Есть люди утверждающие что на страницы пагинации Яндекс требует ставить canonical, опираясь на статью в блоге https://yandex.ru/blog/platon/2878.
Произведем разбор…
1. Если!
Если в какой-либо категории на вашем сайте находится большое количество товаров, могут появиться страницы пагинации (порядковой нумерации страниц), на которых собраны все товары данной категории. Если на такие страницы нет трафика из поисковых систем и их контент во многом идентичен, то советую настраивать атрибут rel=»canonical» тега на подобных страницах и делать страницы второй, третьей и дальнейшей нумерации неканоническими, а в качестве канонического (главного) адреса указывать первую страницу каталога, только она будет участвовать в результатах поиска.
Если!
Подробнее ниже ↓
2. Отделяем мух от котлет
Это касается тех случаев когда в веб-мастере вы видите страницы пагинации отмеченные как дубли т.е. подразумеваются такие входные данные: Одинаковые заголовки, метаданные, описания.
И canonical предлагается как решение этой проблемы.
Гораздо проще посоветовать «лепите canonical», нежели объяснить как уникализировать страницы.
Если же страницы уникализированы (заголовки, метаданные, описания, в идеале так же нужно лишние блоки убрать) это не требуется.
3. Непостоянство
Вспоминаем терминологию и спускаемся в комментарии этой же статьи.
НД
Угу упустил… Яндекс за 4 года не изучил официальное руководство от Гугл?
Кто изучал психологию, подумайте, случайна ли тут опечатка?
СД
Если была реальная необходимость было бы объяснение, а тут просто «можно не ставить»
4. Еще чуть-чуть конспирологии
Статья опубликована
29 декабря 2015, 15:24
Сидят ли перед Новым годом реальные специалисты в Яндекс, или же вместе с топ-менеджментом уходят в отпуск?
Кто же писал статью?
Самое тупое
Включаем логику, переводим атрибуты на простой язык:
- canonical — я копия, вот оригинал (ссылка)
- prev — я часть единого целого, вот предыдущая часть (ссылка)
- next — я часть единого целого, вот следующая часть (ссылка)
Попробуем составить общее предложение если вывести все три на странице и canonical указывает на первую.
Я копия, которая является следующей частью оригинала, есть еще следующая моя часть и она тоже следующая копия оригинала, а наши предыдущие части это оригинал.
Имея хоть зачатки логики и iq чуть больше чем у аудитории Дом-2, можно сразу понять что это вещи противоречащие друг другу.
full-index.ru
Когда нужно использовать канонические ссылки
- Для предупреждения появления различных дублей. Например:
- страниц сортировок: /*sort, asc, desc, list=*;
- дублей из-за UTM-меток: *utm_source=, /*utm_campaign=, /*utm_content=, /*utm_term=, /*utm_medium=;
- других страниц c GET-параметрами в URL;
- дублей в результате особенностей работы CMS (движка).
В этом случае нужно добавить атрибут rel=“canonical” на все статические страницы сайта. Например, для страницы https://site.ru/category-1/page-2, rel=“canonical” будет выглядеть следующим образом:<link rel=“canonical” href=“https://site.ru/category-1/page-2” />
- Для доступных по разным URL страниц с очень похожим контентом.Например, это могут быть страницы одной серии товара, который отличается только расцветкой или страницы товара, который расположен сразу в нескольких категориях.В этом случае нужно указать со всех страниц rel=“canonical” на основную, приоритетную страницу.
- На страницах пагинации, если в категориях сайта есть страницы «Показать всё».В таком случае на каждой из страниц пагинации нужно указать канонической страницу «Показать всё».Например, для страницы https://site.ru/category-1/page-2 нужно прописать канонический URL:<link rel=“canonical” href=“https://site.ru/category-1/show-all” />
Как настроить канонические адреса rel=“canonical”?
Прописать между <head></head> тегами любой HTML-страницы
Это основной способ. Чтобы указать каноническую ссылку, пропишите между тегами <head></head> на странице полный URL страницы, которая должна быть в индексе.
Например, для страницы https://site.ru/*utm_content= канонической будет https://site.ru/.
Для получения такого результата, на странице https://site.ru/*utm_content= мы указали тег:
<link rel=“canonical” href=“https://site.ru/” />
Чтобы снизить вероятность ошибки в элементах link, после атрибута rel=“canonical” используйте абсолютные, а не относительные ссылки.
В файле Sitemap
В XML-карте сайта вы можете прописать канонический (основной) URL для любой страницы.
Атрибут rel=“canonical” — это рекомендация для поисковой системы, а не правило. В этом случае ПС могут проигнорировать их.
В заголовке HTTP
Лучше всего использовать для документов не HTML-формата. Например, для файлов формата PDF.
В таком случае сервер, при запросе дублирующего файла, должен отдавать ссылку на файл-оригинал:
Link: <https://site.ru/original -file.pdf>; rel=“canonical”
Этот способ подойдёт, если у вас есть доступ к настройкам сервера. Не рекомендуется использовать для HTML-документов.
С помощью плагина
Для CMS существуют различные плагины, которые позволяют настроить канонический URL. Например:
- для WordPress можно настроить canonical с помощью Yoast SEO;
- в OpenCart — реализовано в настройках CMS (нужно зайти в настройки товара и задать параметр SEO URL);
- для настройки атрибута canonical в Joomla (версии 3.х и выше) нужно включить в настройках CMS функцию SEF. После включения для технических страниц вида /index.php?option будет добавлен атрибут rel=“canonical” (с указанием URL на страницу с настроенным ЧПУ).
301 редирект или rel=canonical
Если нет факторов, мешающих внедрить 301 редирект, то используйте этот вариант. Помните, что указание канонической ссылки является рекомендательным для поисковых систем. Нередко в выдаче Google можно встретить ранжирующиеся неканонические страницы, при этом в коде страницы будет указана ссылка на первоисточник.
Алгоритм поисковика строится не только на поиске канонической ссылки в коде страницы, но и на массе других факторов — наличии внешних и внутренних ссылок, релевантности для пользователя и т.д. Поэтому у Google может быть другое мнение на счет того, какую же из страниц-дублей необходимо считать оригинальной.
Если же необходимо оставить страницы доступными для пользователей либо существуют технические сложности в реализации 301 редиректа на сайте — используйте rel=canonical.
Основные ошибки использования rel=canonical
Канонические URL поддерживают большинство популярных поисковых систем: Google, Яндекс, Yahoo, Bing. Но вы все равно продолжаете видеть в индексе неканонические страницы вашего сайта? Первое что нужно сделать — проверить не была ли допущена ошибка при настройке rel=canonical. Ниже перечень наиболее распространенных ошибок:
Не индексируемая каноническая страница
Проверьте может ли робот поисковой системы проиндексировать страницу, на которую вы ссылаетесь как на каноническую. Удостоверьтесь, что:
- страница отдает ответ сервера 200;
- на странице не установлен мета-тег robots со значением noindex;
- страница не закрыта от индексирования в файле robots.txt.
Разные канонические URL для одной страницы
Довольно часто устанавливаемые на сайт модули добавляют в код канонические ссылки. Это может привести в появлению нескольких rel=canonical на странице. Если ссылки в тегах указаны на разные URL, то, вероятнее всего, Google и другие поисковики просто проигнорируют ваши рекомендации.
Таким образом, все усилия по установке канонических страниц могут быть сведены на нет. Почаще проверяйте исходный код ваших страниц, чтобы убедиться в наличии только одной канонической ссылки.
Неправильное использование абсолютных ссылок
Распространенной ошибкой является указание канонической ссылки без протокола http:// или https://, как показано на примере ниже:
<link rel=«canonical» href=«ururu.com/ololo.html»/>
Допустимо указывать относительные ссылки:
<link rel=«canonical» href=«/ololo.html»/>
либо полный абсолютный путь с протоколом:
<link rel=«canonical» href=«http://ururu.com/ololo.html»/>
Использование тега вне блока head
Для корректного восприятия поисковыми системами, особенно это касается Google, тег rel=canonical должен находиться в рамках области head кода вашей страницы. Кроме того, данный тег стоит размещать настолько близко к началу HTML кода, насколько это возможно.
Канонические ссылки со страниц пагинации на первую страницу
Такое решение вполне дееспособно для борьбы с дублями. Однако, может негативно повлиять на индексацию страниц, ссылки на которые как раз и расположены на страницах пагинации. Например на странице http://example.com/dresses.html?page=3 расположены ссылки на 20 товаров — они не будут проиндексированы поисковым роботом непосредственно по ссылкам с этой страницы.
Тег canonical при использовании hreflang
Если вы внедряете hreflang на своем проекте, то обязательно убедитесь, что все канонические ссылки указывают на страницы этой же языковой версии. Несоответствие этому правилу может привести как к проблемам с ранжированием языковых версий, так и к неправильному пониманию поисковиками приоритетных для ранжирования дублирующихся страниц.
Неканонические ссылки в sitemap.xml
Файл sitemap.xml помогает поисковому роботу понять какие страницы вашего сайта нужно индексировать и ранжировать в поисковой выдаче. Именно поэтому не стоит добавлять в карту сайта закрытые любым способом от индексирования либо неканонические страницы.
Использование rel=canonical для неидентичных страниц
Данный атрибут был разработан специально для указания приоритетной страницы среди страниц-дублей. Судя по всему, поисковики допускают определенную степень расхождения в контенте страницы. Но это абсолютно не значит, что можно ставить каноническую ссылку на просто схожую по тематике страницу.
Если Google заметит вас в неправильном использовании канонических ссылок, это может повлиять на его отношение к rel=canonical для всего вашего домена и тогда пострадают даже верно настроенные страницы.
Канонические ссылки (атрибут тега link rel canonical) позволяет указать какую именно страницу из группы похожих или одинаковых страниц нужно индексировать. Полезность данного инструмента сложно переоценить и глупо игнорировать. Ведь именно к правильному толкованию страниц сайта поисковыми системами, в значительной степени и сводится SEO сайта. Тем более, что канонические ссылки поддерживаются практически любой современной CMS вроде Joomla или WordPress.
Не дублируйте контент и ставьте правильные ссылки!
webmaster-seo.ru