Canonical что это

Что такое rel canonical?

Остановимся подробнее на теге rel=»canonical». Его основная цель — борьба с дублями страниц и неинформативными страницами (например страницами пагинации), а также повышение качества индексации с помощью прописывания приоритетного адреса.

Канонические ссылки

Что такое каноническая ссылка?

Тег canonical будет чрезвычайно полезен, если на вашем сайте есть страницы-дубли, которые имеются в доступе по различным адресам. С помощью него необходимо прописать приоритетный канонический URL для восприятия поисковиками.

Этот атрибут указывается внутри тега <head> на URL-дубликатах с указанием предпочитаемого URL. Оформляется он таким образом:


Канонические ссылки

Для чего нужен каноникал?

При наличии похожих страниц в индексации поисковиками участвуют все они одновременно. В итоге ни одна из них в полной мере не продвигается по причине того, что внутренние ссылки имеются на обе страницы. Поисковик не знает, какой из них нужно отдать приоритет.

То же самое касается и внешних ссылок — продвигается не один URL, а несколько, а вес также распределяется между ними. И сайт находится на более низких позициях, чем мог бы быть.

Благодаря каноникал в индексе поисковиков будет предпочитаемый канонический URL.

Примеры использования

Например, у вас на сайте есть печатная версия страницы. Или отдельный урл для мобильной версии. И вы ставите каноникал с них на основную страницу, в итоге эта основная страница получает больший вес и плюс при ранжировании, а из индекса убирается куча мусора.


Как каноникал используется для пагинации

Нужно проставить rel canonical со страниц пагинации (site.ru/category/page/2) на первую из них (site.ru/category).

Яндекс рекомендует со всех страниц пагинации настраивать каноническую ссылку на первую из них. Как итог — яндекс-робот воспримет, что именно первую страницу необходимо индексировать. Про индексацию товаров уточняется, что по другим ссылкам Яндекс всё равно будет переходить.

Специалисты Google склоняются к следующим вариантам:

  1. оставить всё по-прежнему — поисковик по-разному распознаёт и воспринимает различные виды страниц;
  2. создать отдельный URL-адрес «Показать всё» и установить его как канонический — особенно рекомендуется для многостраничных статей;
  3. прописать в теге линк атрибуты rel=»prev» и rel=»next» с целью фиксации взаимосвязи между URL-адресами; поисковик будет выдавать первый из них.

А вот видос Деваки, где он подробно поясняет за пагинацию:

Атрибуты rel=»next» и rel=»prev»

Есть также и другое мнение — типа страницы пагинации закрывать не надо, что они наоборот должны получать дополнительный трафик. И тут важны два момента:


  • Все URL должны иметь уникальный параметр тега Title, уникальный текст и meta-теги;
  • Если Вы больше ориентируетесь на Google, то рекомендовано обязательное использование атрибутов rel=»next» и rel=»prev», которые нужно настроить так, чтобы каждая предыдущая страница ссылалась на следующую. На корневом адресе задаётся URL следующего, на последующих — URL предыдущей и следующей, на последней — только предыдущей.

Можно прописать пагинацию этими тегами, а каноническую ссылку оформить на первую или на главную страницу — в зависимости от особенностей ресурса.

Пример:

Канонические ссылки

Тема с SEO пагинатором

Вот допустим один из блогов (Sawynih или как-то так, уже не помню) писал о кейсе, когда страницы пагинации давали дополнительный трафик.

Если на разных URL представлен похожий товар, навигацию можно задать следующими способами:


  1. Прописать уникальные значения параметров автоматически, собирая заголовки из отдельных частей, к примеру:

    (купить|заказать|приобрести) юбки в (саратове|ростове|астрахани) (по низкой цене|выгодно|дешево) со скидкой (в магазине|в интернет магазине)

    Будут созданы уникальные значения метатегов.

  2. Самым эффективным и трудоемким является самостоятельное прописывание этих параметров, вручную. Все заголовки будут уникальными и очень сильно отличаться друг от друга, в том числе по смыслу. Это позволит продвинуть каждый URL по низкочастотным и низко конкурентным ключевым запросам в ТОП выдачи поисковиков. Благодаря применению этого способа расширится семантическое ядро. Плюс также в том, что для интернет-магазина множество статей писать нецелесообразно.

Важно осуществить эту работу один раз индивидуально для каждого URL. Параметры будут зафиксированы поисковиками.

Настройка Canonical для WordPress

Многие плагины для WordPress прекрасно работают с данным тегом.

Канонические ссылки


Большинство из них просты в применении — активируем плагин, а канонические ссылки прописываются автоматически. В других SEO-плагинах достаточно установить галочку возле этого параметра в настройках. Если какая-то статья относится одновременно к разным категориям, то каноническая ссылка фиксируется самостоятельно.

При использовании плагина Yoast SEO и расположения поста в разных категориях, поисковик будет видеть только одну страницу.

Что еще полезно знать о каноникал?

Важно подчеркнуть следующие моменты:

  1. Тег canonical — не директива, а подсказка, которую следует учесть и проанализировать, выделив наиболее подходящий URL для поисковой выдачи.
  2. Касаемо оформления канонических ссылок отсутствует запрещающий момент в виде относительного пути. Даже в случае введения тега <BASE> со ссылкой на документ, относительные пути станут восприниматься так, как прописано в базовом URL.
  3. Канонические страницы могут содержать не абсолютно одинаковое наполнение, и это логично. Могут присутствовать незначительные различия.
  4. Даже при наличии ошибки 404, контент будет индексироваться. Но рекомендуется указывать рабочие URL в качестве канонических.
  5. Если канонический url пока не проиндексирован, остаётся ждать — обычно недолго. Когда он распознается, подсказка будет пересмотрена.

  6. Можно использовать редирект — поисковик воспримет перенаправление и будет учитывать другой адрес.
  7. Рекомендуется задавать идентичный тег rel canonical, чтобы результат канонизации был оптимальным.
  8. Канонический урл может прописываться исключительно с текущего домена. Для указания урла с другого домена, следует использовать 301 редирект.
  9. Как оформляются канонические url, можно изучить на примере сайта wikia.com, открыв исходный код страницы http://starwars.wikia.com/wiki/Nelvana_Limited, содержащий canonical url http://starwars.wikia.com/wiki/Nelvana
    Обе ссылки практически одинаковы, но в первой прописан атрибут каноникал — и Google будет отображать версию, заданную в этом параметре.
  10. Вопросы применения каноникал можно задать в официальном блоге для вебмастеров поисковика Google.

Преимущества, связанные с умением правильно настраивать индексацию с помощью тега canonical:

  • избавление от похожего контента, связанного с недостатками движка, а также созданного искусственно целенаправленными действиями конкурентов;
  • отсутствие необходимости в применении robots.txt для запрета индексации отдельных страниц и угождения всем поисковикам.

znet.ru

Для чего выбирать канонический URL?

Указывать каноническую страницу из числа одинаковых или похожих стоит в следующих случаях:


  • Если нужно выбрать, какой URL следует показывать в результатах поиска. Предположим, вы хотите, чтобы посетители переходили на страницу с описанием платьев зеленого цвета по адресу https://www.example.com/dresses/green/greendress.html, а не https://example.com/dresses/cocktail?gclid=ABCD.
  • Для консолидации переходов на одинаковые или повторяющиеся страницы. Это поможет поисковым системам связать материалы, опубликованные на разных страницах, с одним основным адресом. В результате ссылки с других сайтов на страницу http://example.com/dresses/cocktail?gclid=ABCD будут объединены со ссылками на https://www.example.com/dresses/green/greendress.html.
  • Чтобы упростить получение статистики по отдельным товарам или темам. Если контент размещен на нескольких страницах с разными URL, это затрудняет получение обобщенной статистики по нему.
  • Для управления скопированным контентом. Если вы размещаете свои материалы по различным URL, потребуется задать самый высокий рейтинг для исходной страницы.
  • Чтобы оптимизировать затраты ресурсов на сканирование повторяющихся страниц. Желательно, чтобы роботу Googlebot не приходилось сканировать множество вариантов страниц, например предназначенных для разных типов устройств или обновляемых. В противном случае поисковая индексация вашего сайта не будет выполняться эффективно.

Как узнать, какой URL роботы Google считают каноническим?

Чтобы узнать, какую страницу Google считает канонической, воспользуйтесь инструментом проверки URL. Обратите внимание, что, даже если вы укажете ее, Google может выбрать другую. Это зависит от многих факторов, например от представленных на странице материалов или ее эффективности в Google Поиске.

Как указать каноническую страницу

Существует несколько способов указать каноническую страницу из числа повторяющихся:

Способ Описание
Общие положения Все способы канонизации URL приведены по этой ссылке.
Указание основного домена

В Search Console вы можете указать URL в одном домене как канонический для аналогичных страниц в другом домене, например example.com для www.example.com. Этот способ подходит, только если у вас есть два похожих сайта, которые отличаются лишь доменом. Не используйте этот способ для URL, отличающихся протоколом – http и https.

Плюсы

  • Очень легко реализовать и изменять.
  • Применимо, если у вас идентичные сайты в разных доменах.

Минусы

  • Работает только на уровне домена. Чтобы страницы распознавались как повторяющиеся, у них должны быть одинаковые адреса и названия.
  • Каждая страница на одном домене может соответствовать лишь одной странице на другом домене, при этом их пути должны совпадать.

Тег rel=canonical <link>

Добавьте в код всех повторяющихся страниц тег <link>.

Плюсы

  • Так можно пометить сколько угодно страниц.

Минусы

  • Увеличивает размер страницы.
  • Разметка на крупных сайтах или ресурсах, на которых URL часто меняются, отнимает много усилий.
  • Работает только с HTML-страницами, но не с файлами, такими как PDF. Для последних можно использовать атрибут rel=canonical в HTTP-заголовке.
HTTP-заголовок rel=canonical

Включите в ответ страницы заголовок rel=canonical.

Плюсы

  • Не увеличивает размер страницы.
  • Так можно пометить сколько угодно страниц.

Минусы

  • Разметка на крупных сайтах или ресурсах, на которых URL часто меняются, отнимает много усилий.
Файл Sitemap

Укажите канонические страницы в файле Sitemap.

Плюсы

  • Легко настроить и обновлять, особенно на крупных сайтах.

Минусы

  • Роботу Googlebot тем не менее нужно определить повторяющуюся страницу для каждой канонической, которую вы укажете в файле Sitemap.
  • Менее значимый сигнал для робота Googlebot, чем атрибут rel=canonical.

Код статуса 301 Используйте код статуса 301, чтобы сообщить роботу Googlebot, что URL, заданный в качестве нового адреса страницы, ведет на ее более актуальную версию.
Вариант страницы в формате AMP Если один из вариантов страницы – AMP, укажите каноническую страницу и ее варианты согласно инструкциям для AMP.

 

Мы рекомендуем использовать перечисленные выше методы, однако ни один из них не является обязательным. Если вы не укажете канонический URL, мы попытаемся определить его самостоятельно.

Общие положения

Ниже приведены общие инструкции по указанию канонических URL.

Способы

Указать канонический URL для повторяющихся URL или похожих страниц можно одним из способов, описанных ниже.

Какой бы способ вы ни выбрали, обязательно следуйте приведенным выше общим рекомендациям.

support.google.com

Что такое канонические URL адреса?

В широком смысле слова, канонический означает «принятый за образец», «твердо установленный». То есть, канонический URL это, грубо говоря, основной адрес страницы.

Обычно, один материал имеет один URL адрес, к примеру www.example.ru/1.html. Но иногда одна и так же страница может быть доступна по нескольким адресам. К примеру: www.example.ru/1.html и www.example.ru/1/1.html. В таком случае, необходимо определить, какой из 2-х адресов является основным или каноническим.

Предположим, что www.example.ru/1.html был выбран в качестве основного URL. Тогда на странице с данным адресом (а так же, других страницах с копией контента) необходимо разместить следующий элемент:

<link rel="canonical" href="www.example.ru/1.html" />

Размещается он в шапке сайта, между тегов <head></head>.

Внимание! Что бы снизить вероятность ошибки, внутри элемента link rel=»canonical» необходимо использовать абсолютные, а не относительные адреса. То есть, добавлять к ссылке домен.

Убедитесь, что в технической карте сайта sitemap.xml размещены именно канонические ссылки. Иначе это может привести к ошибкам индексирования.

Примеры канонических адресов

Предположим, что мы создали статью о продвижении Интернет-магазина одежды, для которой сделали красивый, понятный для человека URL.

Пример канонической страницы

Но статья осталась доступна по техническому адресу, который мы больше видеть не хотим.

Пример не канонической страницы

В этом случае, на странице со статьей, нам необходимо прописать элемент <link rel=»canonical» href=»https://dh-agency.ru/prodvijenie-magazina-odejdy/» />, в котором указан основной, канонический адрес.

Вот таким образом:

Элемент link rel=canonical

Теперь адрес https://dh-agency.ru/prodvijenie-magazina-odejdy/ будет считаться основным.

Роль канонических адресов страниц в SEO

С точки зрения поисковой оптимизации, наличие одного основного URL адреса страницы просто необходимо. Во-первых, это позволяет сэкономить время, так как роботу не приходится загружать копии контента. Во-вторых, не остается никаких сомнений, какой адрес должен участвовать в поисковой выдаче. В-третьих, снижается нагрузка на сайт, что так-же важно для посещаемого ресурса.

Нужно понимать, что краулер отводит ограниченное количество времени на индексацию сайта, поэтому многочисленные дубли страниц могут сильно ударить по эффективности его работы.

Правильно устанавливаем канонические URL адреса

Правильно установленный канонический адрес отвечает следующим требованиям:

  1. Каноническая страница, указанная в элементе link rel=»canonical», обязательно должна существовать и быть доступна для пользователей;

  2. Канонический адрес должен быть указан только для одного домена и поддомена. Грубо говоря, не должно быть ссылок на другие ресурсы;

  3. Для страницы может быть указан один единственный канонический адрес;

  4. Убедитесь, что на сайте отсутствуют рекурсии или «цепочки» канонических адресов. То есть, одна страница не должна ссылаться на другую, которая, в свою очередь, ссылается на третью или первую;

  5. Элемент link rel=»canonical» должен находится между тегами <head></head>.

Уверены, что Ваши канонические адреса соответствуют всем вышеуказанным требованиям? Тогда можете считать их просто превосходными!

Понятие «каноническая ссылка»

Те, кто только начал окунаться в основы поисковой оптимизации, иногда разделяют понятия «канонический адрес» и «каноническая ссылка». На самом деле, речь идет об одном и том же — о главном URL адресе страницы.

Нет никаких канонических <a href=»»> </a> и «главных ссылок ссылок для перелинковки».

301 редирект — замена rel=»canonical»?

Когда речь заходит о выборе между 301 редиректом и элементом link rel=»canonical», мы обычно советуем использовать именно переадресацию. Все дело в том, что тег link rel=»canonical» не является обязательным, то есть, может быть проигнорирован поисковой системой.

Использование link rel=»canonical» актуально только тогда, когда сделать 301 редирект невозможно или проблематично.

Есть и еще один плюс link rel=»canonical» перед 301 редиректом — его простановку возможно сделать автоматической при создании страницы. К примеру, в WordPress эта функция уже реализована. То есть, заранее указав канонический адрес, Вы можете избавить себя от будущих проблем с индексацией.

Яндекс Вебмастер — статус «неканоническая»

В Яндекс Вебмастере есть раздел «Исключенные страницы«, добраться туда можно из меню «Индексирование» -> «Страницы в поиске» -> «Исключенные страницы«.

Перейдя в этот раздел, Вы увидите все материалы, которые были по какой либо причине загружены в базу, но исключены из поиска.

Исключенные страницы в Яндекс Вебмастере

Среди прочих причин исключения Вы можете увидеть статус «Неканоническая». Нажав на троеточие, отроется сообщение следующего вида:

«Страница проиндексирована по каноническому адресу https://dh-agency.ru/category/vnutrennyaya-optimizaciya/design/, который был указан в атрибуте rel=»canonical» в исходном коде. Исправьте или удалите атрибут canonical, если он указан некорректно. Робот отследит изменения автоматически.»

Вебмастер - страница проиндексирована по каноническому адресу

Что это значит?

Ничего страшного не произошло. Робот Яндекса проиндексировал страницу по первому (написанному синем шрифтом) URL, при этом на самой странице стоял элемент link rel=»canonical»,  в котором, в качестве канонического, был указан другой адрес (написанный серым шрифтом).

Яндекс Вебмастер - статус "Неканоническая"

Пользуясь данной инструкцией, робот исключил неканонический URL.

Переживать, что материал был полностью исключен из поиска не стоит, он находится в выдаче, но по другому URL адресу.

Что с этим делать?

Если Вас не устраивает URL, который был выбран в качестве основного, необходимо поменять адрес в элементе link rel=»canonical» на предпочтительный. После изменения, страницу желательно отправить на переобход индексирующему роботу.

Индексирование» -> «Переобход страниц«)

Переобход страниц Яндексом

Так изменения будут загружены в базу в самое ближайшее время.

Только не забудьте изменить адрес в файле sitemap.xml.

dh-agency.ru

Когда нужно использовать канонические ссылки

  1. Для предупреждения появления различных дублей. Например:
    • страниц сортировок: /*sort, asc, desc, list=*;
    • дублей из-за UTM-меток: *utm_source=, /*utm_campaign=, /*utm_content=, /*utm_term=, /*utm_medium=;
    • других страниц c GET-параметрами в URL;
    • дублей в результате особенностей работы CMS (движка).

    В этом случае нужно добавить атрибут rel=“canonical” на все статические страницы сайта. Например, для страницы https://site.ru/category-1/page-2, rel=“canonical” будет выглядеть следующим образом:<link rel=“canonical” href=“https://site.ru/category-1/page-2” />

  2. Для доступных по разным URL страниц с очень похожим контентом.Например, это могут быть страницы одной серии товара, который отличается только расцветкой или страницы товара, который расположен сразу в нескольких категориях.В этом случае нужно указать со всех страниц rel=“canonical” на основную, приоритетную страницу.
  3. На страницах пагинации, если в категориях сайта есть страницы «Показать всё».В таком случае на каждой из страниц пагинации нужно указать канонической страницу «Показать всё».Например, для страницы https://site.ru/category-1/page-2 нужно прописать канонический URL:<link rel=“canonical” href=“https://site.ru/category-1/show-all” />

Как настроить канонические адреса rel=“canonical”?

Прописать между <head></head> тегами любой HTML-страницы

Это основной способ. Чтобы указать каноническую ссылку, пропишите между тегами <head></head> на странице полный URL страницы, которая должна быть в индексе.

Например, для страницы https://site.ru/*utm_content= канонической будет https://site.ru/.

Для получения такого результата, на странице https://site.ru/*utm_content= мы указали тег:

<link rel=“canonical” href=“https://site.ru/” />

Чтобы снизить вероятность ошибки в элементах link, после атрибута rel=“canonical” используйте абсолютные, а не относительные ссылки.

В файле Sitemap

В XML-карте сайта вы можете прописать канонический (основной) URL для любой страницы.

Атрибут rel=“canonical” — это рекомендация для поисковой системы, а не правило. В этом случае ПС могут проигнорировать их.

В заголовке HTTP

Лучше всего использовать для документов не HTML-формата. Например, для файлов формата PDF.

В таком случае сервер, при запросе дублирующего файла, должен отдавать ссылку на файл-оригинал:

Link: <https://site.ru/original -file.pdf>; rel=“canonical”

Этот способ подойдёт, если у вас есть доступ к настройкам сервера. Не рекомендуется использовать для HTML-документов.

С помощью плагина

Для CMS существуют различные плагины, которые позволяют настроить канонический URL. Например:

  • для WordPress можно настроить canonical с помощью Yoast SEO;
  • в OpenCart — реализовано в настройках CMS (нужно зайти в настройки товара и задать параметр SEO URL);
  • для настройки атрибута canonical в Joomla (версии 3.х и выше) нужно включить в настройках CMS функцию SEF. После включения для технических страниц вида /index.php?option будет добавлен атрибут rel=“canonical” (с указанием URL на страницу с настроенным ЧПУ).

301 редирект или rel=canonical

Если нет факторов, мешающих внедрить 301 редирект, то используйте этот вариант. Помните, что указание канонической ссылки является рекомендательным для поисковых систем. Нередко в выдаче Google можно встретить ранжирующиеся неканонические страницы, при этом в коде страницы будет указана ссылка на первоисточник.
Алгоритм поисковика строится не только на поиске канонической ссылки в коде страницы, но и на массе других факторов — наличии внешних и внутренних ссылок, релевантности для пользователя и т.д. Поэтому у Google может быть другое мнение на счет того, какую же из страниц-дублей необходимо считать оригинальной.
Если же необходимо оставить страницы доступными для пользователей либо существуют технические сложности в реализации 301 редиректа на сайте — используйте rel=canonical.

Основные ошибки использования rel=canonical

Канонические URL поддерживают большинство популярных поисковых систем: Google, Яндекс, Yahoo, Bing. Но вы все равно продолжаете видеть в индексе неканонические страницы вашего сайта? Первое что нужно сделать — проверить не была ли допущена ошибка при настройке rel=canonical. Ниже перечень наиболее распространенных ошибок:

Не индексируемая каноническая страница

Проверьте может ли робот поисковой системы проиндексировать страницу, на которую вы ссылаетесь как на каноническую. Удостоверьтесь, что:

  • страница отдает ответ сервера 200;
  • на странице не установлен мета-тег robots со значением noindex;
  • страница не закрыта от индексирования в файле robots.txt.

Разные канонические URL для одной страницы

Довольно часто устанавливаемые на сайт модули добавляют в код канонические ссылки. Это может привести в появлению нескольких rel=canonical на странице. Если ссылки в тегах указаны на разные URL, то, вероятнее всего, Google и другие поисковики просто проигнорируют ваши рекомендации.
Таким образом, все усилия по установке канонических страниц могут быть сведены на нет. Почаще проверяйте исходный код ваших страниц, чтобы убедиться в наличии только одной канонической ссылки.

Неправильное использование абсолютных ссылок

Распространенной ошибкой является указание канонической ссылки без протокола http:// или https://, как показано на примере ниже:

<link rel=«canonical» href=«ururu.com/ololo.html»/>

Допустимо указывать относительные ссылки:

<link rel=«canonical» href=«/ololo.html»/>

либо полный абсолютный путь с протоколом:

<link rel=«canonical» href=«http://ururu.com/ololo.html»/>

Для корректного восприятия поисковыми системами, особенно это касается Google, тег rel=canonical должен находиться в рамках области head кода вашей страницы. Кроме того, данный тег стоит размещать настолько близко к началу HTML кода, насколько это возможно.

Канонические ссылки со страниц пагинации на первую страницу

Такое решение вполне дееспособно для борьбы с дублями. Однако, может негативно повлиять на индексацию страниц, ссылки на которые как раз и расположены на страницах пагинации. Например на странице http://example.com/dresses.html?page=3 расположены ссылки на 20 товаров — они не будут проиндексированы поисковым роботом непосредственно по ссылкам с этой страницы.

Тег canonical при использовании hreflang

Если вы внедряете hreflang на своем проекте, то обязательно убедитесь, что все канонические ссылки указывают на страницы этой же языковой версии. Несоответствие этому правилу может привести как к проблемам с ранжированием языковых версий, так и к неправильному пониманию поисковиками приоритетных для ранжирования дублирующихся страниц.

Неканонические ссылки в sitemap.xml

Файл sitemap.xml помогает поисковому роботу понять какие страницы вашего сайта нужно индексировать и ранжировать в поисковой выдаче. Именно поэтому не стоит добавлять в карту сайта закрытые любым способом от индексирования либо неканонические страницы.

Использование rel=canonical для неидентичных страниц

Данный атрибут был разработан специально для указания приоритетной страницы среди страниц-дублей. Судя по всему, поисковики допускают определенную степень расхождения в контенте страницы. Но это абсолютно не значит, что можно ставить каноническую ссылку на просто схожую по тематике страницу.
Если Google заметит вас в неправильном использовании канонических ссылок, это может повлиять на его отношение к rel=canonical для всего вашего домена и тогда пострадают даже верно настроенные страницы.

Канонические ссылки (атрибут тега link rel canonical) позволяет указать какую именно страницу из группы похожих или одинаковых страниц нужно индексировать. Полезность данного инструмента сложно переоценить и глупо игнорировать. Ведь именно к правильному толкованию страниц сайта поисковыми системами, в значительной степени и сводится SEO сайта. Тем более, что канонические ссылки поддерживаются практически любой современной CMS вроде Joomla или WordPress.

Не дублируйте контент и ставьте правильные ссылки!

webmaster-seo.ru

Канонический тег (rel=»canonical») является довольно важным инструментом поисковой оптимизации. Зачастую он даже лучше, чем 301 редирект при работе с дублированным контентом.

Канонический тег

Разберём более подробно этот тег.

Что плохого в дублированном контенте

Дублированный контент — это два одинаковых по своему содержанию документа. Когда Google видит дубль, он старается исключить его из индекса, т.к. по идее пользователь не захочет видеть один и тот же документ в поисковой выдаче несколько раз. Да и к тому же самому поисковику не хочется постоянно обрабатывать тысячи и даже миллионы дублированных страниц, тратя на это свои производственные мощности.

Проблема для веб-мастера состоит в том, что если одна и та же информация находится на разных страницах, то в выдаче будет только одна из этих страниц. Но url, который выберет Гугл, не всегда является наиболее оптимальным для пользователя, и не всегда является первоисточником.

Пока поисковик не определит первоисточник, результаты выдачи не будут удовлетворять целям первоначального автора контента. В данном случае канонический тег имеет ограниченную пользу, поскольку те, кто крадут ваш контент, скорее всего, не будут ставить теги.

С другой стороны, если дублирование происходит на вашем сайте, то тег будет как нельзя кстати. Даже если на вашем сайте будут ссылки на дублированный контент, ценность для выдачи будет составлять только страница-первоисточник. Таким образом, даже при наличии ссылок на несколько дублей, значимой для Google будет считаться только одна из этих страниц. И внутренняя перелинковка не пострадает.

Естественно, это не лучшее решение с точки зрения SEO. Но это не приведёт к каким-либо санкциям со стороны Гугла.

Что такое тег rel=»canonical»

Тег имеет следующий синтаксис: <link rel=»canonical» href=»http://seo-aspirant.ru/www.example.com/url-i-want-to-appear-in-google»/> Таким образом Google и Bing поймут, что все дубли ссылаются на канонический адрес, указанный в теге. Гугл имеет чёткое представление по поводу использования данного тега:

Да, rel=»canonical» должен использоваться только для выбора предпочитаемой страницы при дублировании (незначительные различия в содержании допустимы).

Другими словами, используйте его только для борьбы с дублированным контентом. При использовании его для других целей вы можете быть уличены в поисковом спаме.

seo-aspirant.ru

Возможные причины появления дублей

  1. Система управления содержимым поддерживает работу с адресами нескольких типов.
  2. CMS возвращает одинаковое значение при запросе адреса с использованием субдомена www и протокола https.
  3. Система управления может присвоить одной странице несколько сетевых адресов, если обнаружит на ней одинаковый контент, относящийся к разным разделам сайта.
  4. Информация публикуется на разных сетевых ресурсах, поэтому содержимое страниц частично или полностью дублирует контент на страницах с разными адресами.

Атрибут rel=»canonical» необходимо использовать, если на разных страницах сайта присутствует контент, частично или полностью дублирующий содержимое статей, расположенных на страницах с другими сетевыми адресами.

Важность применения атрибута

Система управления содержимым позволяет обращаться к странице по разным сетевым адресам. Проблема возникает при индексации таких страниц. Поисковые роботы начинают думать, что сайт преимущественно состоит из дублей, поэтому понижают его рейтинг в поисковой выдаче. Большое количество одинаковых страниц приводит к ухудшению индексации сайта, что оказывает негативное влияние на эффективность СЕО-продвижения.

canonical2.png

Удаление дублей путем использования канонических адресов

Избежать появления в поиске страниц с одинаковым содержимым поможет расположение атрибута rel=»canonical» в коде статей. Поисковики увидят ссылку, помеченную таким атрибутом, и быстро проиндексируют нужную страницу. Адреса страниц с контентом, который должен попасть в поиск, можно писать в абсолютном или относительном значении. При СЕО-оптимизации сайта под Google рекомендуется использовать абсолютный путь к предпочитаемой странице. Риск возникновения ошибки в процессе индексирования будет снижен.

Преимущества использования метатега с атрибутом canonical

Метатег упрощает оптимизацию, делая поисковое продвижение более простым и быстрым. Пользователь исключает из работ по SEO-продвижению необходимость заполнения файла robots.txt, например адресами страниц для печати.

Установка метатега с атрибутом canonical

Пользователь должен определиться со страницей, которую поисковый робот будет считать основной. В заголовке кода статей с одинаковым содержимым нужно вписать метатег с атрибутом canonical. Например, поисковой системе нужно указать адрес https://test.com/car в качестве основного. В блоке <head></head> каждой страницы, на которой частично или полностью дублируется контент, пишем <link rel=»canonical» href=»https://test.com/car» />. Поисковый робот прочитает указания и проиндексирует только страницу с каноническим адресом. Дубли будут исключены из поиска. Впоследствии поисковая система не станет посещать неканонические страницы, тем самым ускорив периодическую индексацию сайта. Чтобы упростить процесс размещения метатега, были разработаны специальные плагины для разных систем управления содержимым. Некоторые CMS имеют встроенные средства для указания канонического адреса.

Как проверить наличие атрибута canonical

Существует несколько способов проверки наличия метатега, указывающего роботу на страницу с каноническим адресом, и присутствия частично или полностью дублированного контента на сайте.

  1. Открываем код страницы и в заголовке ищем нужный метатег с указанным атрибутом.
  2. Устанавливаем в браузер специальное расширение, дополнение или плагин, позволяющий просматривать различные параметры, которые используют при продвижении web-сайтов. При посещении страниц с искомым атрибутом дополнение проинформирует пользователя о его наличии или отсутствии.
  3. Заходим на страницу расширенного поиска системы «Яндекс». Передаем поисковой системе часть содержимого страницы или сетевой адрес сайта, который проверяем на наличие дублей. «Яндекс» проверит проиндексированные сайты на наличие копий. В результатах поиска будут предложены адреса страниц с дублированным контентом или варианты по запросу при отсутствии дублей.
  4. Проверить наличие атрибута также можно при помощи специальных операторов поиска. Например, поисковая система Google покажет в результатах поиска дублированный контент, если в поисковую строку ввести site: домен проверяемого сайта «ключевое слово».
  5. Для поиска дублей можно воспользоваться сервисами проверки уникальности контента. Они обнаружат полностью или частично дублированный контент с указанием процента совпадений.

Правильно настроенный метатег с атрибутом canonical повысит эффективность оптимизации и продвижения сайта в интернете.

wiki.rookee.ru

Канонический URL – помощник в борьбе с дублированным контентом

Больше видео на нашем канале — изучайте интернет-маркетинг с SEMANTICA

Canonical что это

Пример дубля web-документа

Стартовая страница интернет ресурса может быть доступна по нескольким адресам:

  • ru
  • primer.ru
  • ru/
  • ru/index.php

Поисковый робот распознает эти адреса, как четыре разных web-документа с идентичным содержанием.

 

Что такое канонический URL

Атрибут <link rel=»canonical» /> позволяет указать поисковому роботу каноническую, то есть основную версию документа. Этим атрибутом потребуется пометить не только основную продвигаемую страницу интернет проекта, но и ее дубли. Если робот найдет на сайте копии канонической страницы, то он пометит их, как малозначительные. Канонический URL – это самый легкий метод борьбы с дублированным контентом.

 

Как работает каноническая ссылка

Предположим, у нас есть основная страница http://yoursite.ru/statya1, которую также можно найти еще по нескольким адресам:

http://yoursite.ru/page?id=5

http://yoursite.ru/blog/statya1

 

 

Почему CMS создают дубли

Не нужно полагать, что система управления контентом намеренно генерирует дубли страниц. Обычно такие копии создаются вследствие некорректной настройки CMS. К самым распространенным причинам появления дублей относятся:

  1. создание архивов из старых статей;
  2. наличие открытых ссылок на документы в PDF-версии (для печати);
  3. неправильная структура сайта, добавление одинаковых страниц в разные категории;
  4. наличие динамических URL (характерно для интернет-магазинов).

Чтобы выявить дубликаты страниц и использовать атрибут rel canonical, можно воспользоваться инструментами Google для вебмастеров. Нужно перейти на вкладку «вид в поиске» и кликнуть по ссылке «оптимизация Html». В открывшемся разделе указаны страницы с повторяющимися метаописаниями. Такие документы нередко имеют дублированный контент.

 

Рекомендации по каноническим ссылкам

ПС Google советует не указывать атрибут rel=»canonical» в качестве директивы для robots.txt. Это может вызвать проблемы с индексацией сайта. Нельзя указывать разные канонические урлы для одной страницы (к примеру, один URL в карте сайта, а другой – непосредственно в разделе <head> страницы).

Чтобы снизить вероятность ошибки при индексации сайта, следует указывать в качестве атрибута link rel абсолютные, а не относительные пути. Иными словами, вместо структуры /blog/page-1 нужно использовать полный адрес http://yoursite/blog/page-1.

semantica.in

Rel canonical: что это

Когда на один и тот же контент можно попасть с помощью разных URL’ов, в индексе поисковых систем начинает участвовать сразу несколько страниц. В итоге ни одна страница толком не продвигается, так как внутренние ссылки идут то на одну страницу, то на другую.

Тоже самое касается внешних ссылок. Невозможно сосредоточиться максимально на продвижении одной страницы, а это в итоге не раскрывает потенциал страницы полностью. Или же, к примеру, покупаются ссылки на одну страницу, а на самом деле в индексе совершенно другая страница.

В результате чего сайт будет занимать позиции ниже, чем мог бы. Атрибут rel=canonical как раз позволяет нам оставить в индексе только самую приоритетную страницу. Также весь ссылочный вес передается на нее.

Чтобы в индексе была только одна страница, нужно прописать на страницах дубликатах в разделеканоническую ссылку на приоритетную:

<link rel="canonical" href="http://site.ru/prioritetnya-stranica" />

к оглавлению ↑

Откуда могут появиться дублирующиеся страницы?

Если для удаления дублей, можно воспользоваться 301 редиректом, я рекомендую в первую очередь обратить внимание на него. Если же 301 редирект не помогает или его использование неуместно, то на помощь можно позвать канонические ссылки, только будьте аккуратными.

к оглавлению ↑

Статья сайта относится к нескольким рубрикам

Если в ЧПУ вашего сайта выводится рубрика статей, то можно столкнуться с проблемой. Одна и та же статья может располагаться сразу по нескольким URL адресам. Вот у меня, к примеру, есть статья про безопасность в WordPress, она располагается сразу в 2-х категориях: «Полезное для блога» и «WordPress плагины». Поэтому доступна сразу по 2-ум разным URL адресам:

  • https://wpnew.ru/sozdanie-bloga/poleznoe_dlya_bloga/bezopasnost-wordpress.html
  • https://wpnew.ru/sozdanie-bloga/razdel-4-plaginy/bezopasnost-wordpress.html

Это для нас, обычных посетителей, как будто страница одна и та же. Для поисковиков же это 2 разные страницы, которые являются дублями. И они могут включить в индекс либо сразу обе страницы, либо не ту, которую хотелось бы. Как раз в подобных случаях выручает rel=canonical, который позволяет указать поисковикам, что нужно проиндексировать только одну конкретную страницу.

В моем случае со страницы https://wpnew.ru/sozdanie-bloga/poleznoe_dlya_bloga/bezopasnost-wordpress.html прописан канонический URL на https://wpnew.ru/sozdanie-bloga/razdel-4-plaginy/bezopasnost-wordpress.html и поэтому в индексе только второй вариант страницы.

Данный rel=canonical у меня прописывается автоматически с помощью плагина для WordPress, более подробно в конце урока.

к оглавлению ↑

Товары интернет-магазина в нескольких категориях

Еще одно из самых популярных явлений, это когда товары в интернет-магазинах расположены сразу в нескольких категориях. В виде примера приведу товар iPhone 6s, который может располагаться сразу на нескольких страницах:

  • site.ru/apple/iphone6s/
  • site.ru/mobilnye-telefony/iphone6s/
  • site.ru/catalog/iphone6s/

Все точно также, нужно указать со всех страниц rel=canonical на основную, приоритетную страницу. Как выбрать правильно каноническую страницу расскажу ниже.

к оглавлению ↑

Страница печати, разные id

Также на некоторых страницах встречаются страницы для печати. У них к URL  добавляется что-то вроде ?print=true. То есть, один и тот же контент может находиться на:

  • site.ru/content/post-1;
  • site.ru/content/post-1?print=true.

В таком случае со страницы site.ru/content/post-1?print=true нужно прописать в область(внимание, не в body!) следующее:

<link rel="canonical" href="http://site.ru/content/post-1" />

Благодаря этому действию, страница site.ru/content/post-1?print=true не будет участвовать в поиске, то есть не будет проиндексирована.

Также встречаются всякие &id=xxx , с ними боремся точно так же.

к оглавлению ↑

Тег more

Еще один популярный тег присваиваются статьям в стиле /#more-777 , который прописывается к URL. Чаще всего такое можно заметить на шаблонах WordPress, особенно старых. Чтобы в индекс попадала правильная страница, аналогично на странице site.ru/post#more-777 должно быть прописано :

<link rel="canonical" href="http://site.ru/post" />

Я же в идеале бы рекомендовал делать ссылки прямыми (с той же самой главной страницы), без тега more.

к оглавлению ↑

Дубли replytocom

Точно также бывает с ?replytocom=777 , которые могут попасть в индекс из-за древовидных комментариев. Делаем все по аналогии. Я же для борьбы с дублями replytocom просто ставлю галочку в плагине Yoast SEO и данная проблема больше не беспокоит:

Rel=canonical в WordPress

к оглавлению ↑

Партнерская программа

Когда реализуете партнерскую программу, часто много ссылок c «хвостами» начинают ссылаться на вас. Получается, что-то вроде этого: site.ru/?partner=id777. С подобных страниц тоже нужно прописывать атрибут canonical, чтобы они не попали в индекс.

к оглавлению ↑

Как правильно использовать rel=canonical

Как вы уже поняли, чтобы в индексе был только 1 вариант страницы, нужно со всех дублирующихся страниц проставить атрибут canonical. Вот как он должен выглядеть

<link rel="canonical" href="http://site.ru/osnovnoj-url" />

Данный тег должен находиться внутри.

к оглавлению ↑

Как правильно выбрать канонический урл?

Каноническая страница — это та страница, которая рекомендуется поисковикам для индексации среди всех дублей. Какую же лучше выбрать?

  • Если страница раньше имела только 1 url, то лучше сделать канонической ее, так как скорей всего она уже проиндексирована, также имеет определенный вес. То есть с новой страницы проставить rel=canonical на старую.
  • Если же страницы создавались примерно в одно время, лучше каноническим URL сделать ту, которая находится в индексе.
  • Если же несколько страниц-дублей находится в индексе поисковиков, то лучше выбрать тот, который будет продвигаться. Чаще всего тот URL, который имеет меньше всего уровень вложенности, либо уже имеет входящие ссылки.
  • Если же все условия идентичные у страниц дублей, обычно берется за приоритетную страницу та, которая подходит под некий шаблон товара/статьи по сайту и предпочтение отдается единообразию.

к оглавлению ↑

Частые ошибки с атрибутом rel=canonical

  1. Тег rel=»canonical» — это не строгая директива. Он лишь предлагает основную страницу для поисковиков, то есть просто-напросто советует.
  2. Нельзя использовать другой домен в данном атрибуте. Допускаются ссылки только внутри домена или поддомены.
  3. Для проставления канонических ссылок необязательно иметь 100% дублированный контент, если есть небольшие различия — это нормально. Такое может быть, когда продукты расставлены в другом порядке или поисковый робот посетил страницы в разное время, например.
  4. Если документ по каноническому адресу недоступен (отдает 404 ошибку, допустим), то поисковики могут проигнорировать его.
  5. Также поисковые роботы могут проигнорировать данный атрибут, если на странице указано несколько канонических урлов.
  6. Для указания канонического ссылки допускается использовать не полный URL адрес, а относительный путь:
    <link rel="canonical" href="/osnovnoj-url" />

    Но будьте аккуратны, можете «наломать дров», лучше использовать полный URL, с указанием вашего домена.

  7. Каноническая страница должна быть индексируемой.

Запомните: rel=canonical передает вес входящих ссылок.

Почитайте еще эти статьи (официальные руководства от Яндекса и Google):

  • Атрибут rel=canonical тега в Яндекс Помощи.
  • Канонические URL в справке Google Search Console.

к оглавлению ↑

Частные случаи использования rel=canonical

к оглавлению ↑

Сanonical сама на себя

Меня не раз спрашивали, можно ли ставить каноническую ссылку саму на себя? Такое обычно происходит при автоматической генерации с помощью разных плагинов или силами CMS. Ответ — да, можно, ничего в этом плохого нет.

к оглавлению ↑

Canonical для страниц пагинации

Многие вебмастера хотят сделать rel=canonical со страниц пагинации (site.ru/category/page/2) на первую страницу (site.ru/category). Это неправильно, как я считаю. Все-таки здесь встречаются не полные дубли, такие страницы пагинации лучше закрыть с помощью:

<meta name="robots" content="noindex,follow"/>

В WordPress это можно сделать автоматически, поставив галочку в плагине WordPress SEO by Yoast:

Запрет индексации страницы пагинации

к оглавлению ↑

Товары

Если товары разделены на несколько страниц (их много и сделана разбивка на несколько страниц), то лучше основным каноническим урлом сделать вывод всех товаров, которое обычно выводится с помощью добавления к URL что-то подобное этому ?all=products.

к оглавлению ↑

Атрибут rel=canonical в WordPress

Многие SEO плагины для WordPress очень хорошо дружат с атрибутом rel=canonical. Мой любимый и, как я считаю, лучший SEO плагин Yoast SEO вообще ничего не требует. Просто достаточно его активировать и необходимые канонические URL сами прописываются.

В некоторых других SEO плагинах в настройках нужно просто поставить галочку напротив «Канонические страницы» (или еще что-то подобное).

То есть по умолчанию, если статья на моем блоге присвоена сразу к нескольким категориям, то автоматически прописывается каноническая страница. Именно поэтому на странице https://wpnew.ru/sozdanie-bloga/poleznoe_dlya_bloga/bezopasnost-wordpress.html у меня прописан следующий атрибут rel=canonical (обратите внимание, это другой URL):

atribut-rel-canonical

По умолчанию, благодаря плагину Yoast SEO, если пост располагается сразу в нескольких категориях, в индекс же попадает только один вариант.

к оглавлению ↑

Выводы

Я надеюсь, что вполне понятно, смог объяснить, что такое атрибут rel=canonical и как им пользоваться. Настоятельно рекомендую ознакомиться вам еще с этим уроком: Как удалить ненужные страницы в индексе Яндекса и Google. Все эти действия с rel=canonical, 301-ым редиректом, meta name robots, файлом robots.txt позволят сделать выдачу вашего сайта «чистым».

Я за «чистый» индекс без дублей, служебных страниц и пр. ненужных вещей. Благодаря чистоте SEO продвижение сайта будет проще и правильнее.

И еще: чтобы не было подобных заморочек я рекомендую будущие ваши сайты создавать без указания категорий в URL статей/товаров. То есть пусть будет что-то вроде:

  • site.ru/statya.html (для блогов);
  • site.ru/catalog/iphone6s (для интернет-магазинов).

Отдельное спасибо за ретвиты и репосты, мои друзья. Обязательно жду ваших мыслей в комментариях.

wpnew.ru


You May Also Like

About the Author: admind

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *

Этот сайт использует Akismet для борьбы со спамом. Узнайте как обрабатываются ваши данные комментариев.

Adblock
detector