Link rel canonical

Плагин «Link canonical» поможет вам избавиться на сайте от дублированного контента, указывая роботам поисковых систем предпочитаемую версию URL адреса для страницы.

Удаление дублей и некачественных страниц
еще никогда не было так просто!

Link rel canonical

Если на вашем сайте есть идентичный или похожий контент, который доступен по разных URL-адресам, то данный плагин укажет тот URL, к которому должен возвращаться робот поисковых систем и при этом вы можете быть уверенным, что все характеристики (например, ссылочный вес) передадутся на нужную страницу.

Например, на страницах категорий выводится один и тот же список товаров с разной сортировкой:

    http://site.ru/category/kompyutery/
    http://site.ru/category/kompyutery/?sort=name&order=asc
    http://site.ru/category/kompyutery/?sort=tota&order=desc

Чтобы избежать дублирования таких страниц в поисковой выдаче, необходимо со страниц сортировки поставить тег <link rel=»canonical» href=»http://youdomain.com/…» /> на страницу категории. Это можно сделать с помощью плагина «Link canonical».

Главные возможности плагина «Link canonical»

Link rel canonicalАвтоматическая генерация тега
Автоматическая генерация значения для тега <link rel=»canonical» href=»http://youdomain.com/…» /> работает согласно настройкам, которые учитывают большинство стандартных ситуаций

Link rel canonicalРучное добавление тега на страницах категорий и товаров
В настройках редактирования категорий и товаров можно вручную указать URL канонической страницы, и тег появится со ссылкой на нее.

Link rel canonicalДобавление атрибутов rel=»next» и rel=»prev»
Теги link rel=»prev», link rel=»next» Google рекомендует добавлять на страницы многостраничного контента, чтобы робот мог связать содержимое данных страниц в логической последовательности.

Link rel canonicalДобавление тега на страницы с GET-параметрами
Одним действием можно добавить тег на все страницы с GET-параметрами. Если есть исключения, то пропишите их вручную или выберите из настроек плагина.


Link rel canonicalОтключение тега на определенных страницах
Предусмотрены гибкие настройки отключения тега на определенных страницах. В частности, можно указать, что не нужно проставлять тег со страниц пагинации на страницу категории.

Link rel canonicalСовместим с плагином «SEO-фильтр»
Плагин «Link canonical» совместим с плагином «SEO-фильтр». Он проставляет тег на страницах «SEO-фильтра» согласно настройкам, но можно отключить добавление тега для страниц пагинации.

Link rel canonicalПоддержка мультивитринности
Добавить свои правила для вывода тега <link rel=»canonical» href=»http://youdomain.com/…» /> можно для всех витрин в целом и для каждой в отдельности. Также витрину можно выбрать при ручном добавлении тега в настройках товаров и категорий.

Данный тег поддерживается всеми поисковыми системами

Яндекс:

Link rel canonical

Google:


Link rel canonical

Mail:

Link rel canonical

Как работает плагин на конкретных примерах?

Задача 1. Необходимо проставить тег со всех страниц с get-параметрами на основную страницу категории. Исключение – все страницы пагинации.

Решение:

1. Купить, установить, включить плагин «Link canonical».

2. Проверить наличие тега <link rel=»canonical» href=»http://youdomain.com/…» /> (см. п.3 инструкции);

3. Отметить «Проставлять тег со всех страниц с get-параметрами»;

4. Отметить «Не проставлять canonical на страницах пагинации»;

5. Сохранить изменения.

Задача решена с помощью плагина «Link canonical».

Задача 2. Необходимо проставить тег со всех страниц с get-параметрами на основную страницу категории. Сделать исключение для страниц пагинации категории и страниц «SEO-фильтра».

Решение:

1. Купить, установить, включить плагин «Link canonical».

2. Проверить наличие тега <link rel=»canonical» href=»http://youdomain.com/…» /> (см. п.3 инструкции);


3. Отметить пункт «Проставлять тег со всех страниц с get-параметрами»;

4. Отметить «Не проставлять тег со страниц пагинации на страницу категории»;

5. Отметить «Не проставлять тег со страниц пагинации на страницу SEO-фильтра»;

6. Сохранить изменения.

Задача решена с помощью плагина «Link canonical».

Задача 3. Необходимо проставить тег со всех страниц с get-параметрами, кроме страниц, в URL которых присутствуют параметры: color, weight, brand.

Решение:

1. Купить, установить, включить плагин «Link canonical».

2. Проверить наличие тега <link rel=»canonical» href=»http://youdomain.com/…» /> (см. п.3 инструкции);

3. Отметить «Проставлять тег со всех страниц с get-параметрами»;

4. В поле «Не проставлять тег, если в url присутствуют get-параметры» указать «color, weight, brand»;

5. Сохранить изменения.

Задача решена с помощью плагина «Link canonical».

Все возможности плагина:

Основные:

— Включение и отключение плагина;

— Выбор витрин;

— Проставлять тег со всех страниц с get-параметрами;

— Не проставлять тег, если в url присутствуют определенные get-параметры;

— Проставлять тег на канонической странице;


— Не простовлять canonical на страницах пагинации;

— Проставлять тэги link rel=»prev», link rel=»next».

Категории:

— Не проставлять тег со страниц пагинации на страницу категории;

— Не проставлять тег со страниц фильтров на страницу категории;

— Не проставлять тег со страниц сортировки на страницу категории;

SEO-фильтр:

— Не проставлять тег со страниц пагинации на страницу «SEO-фильтра».

Товары:

— Проставлять тег со страниц отзывов на товар;

— Проставлять тег со страниц отзывов на товар (только если нет отзывов);

— Проставлять тег со всех подстраниц товара на сам товар.

Бренды:

— Не проставлять тег со страниц пагинации на страницу бренда;

— Не проставлять тег со страниц пагинации на страницу подкатегории брендов.

Купить плагин

Покупая плагин, Вы соглашаетесь с условиями оказания технической поддержки.

www.webasyst.ru

Атрибут rel=«canonical». Руководство по использованию

Как мы ранее уже упоминали, дубликаты страниц на сайте являются крайне нежелательным явлением. Их наличие может вводить в заблуждение посетителей и, главное, поисковых ботов, что очень негативно сказывается на продвижении веб-сайта в целом.


В большинстве случаев дублирование контента устраняется банальным удалением повторяющихся страничек или же использованием редиректа 301.

Но существуют случаи, когда более удобным вариантом является атрибут rel=«canonical». Например, если удалить дублирующийся контент и предотвратить его появление в будущем технически сложно осуществить. Или же Вы просто хотите оставить все странички в открытом для пользователей доступе, несмотря на неуникальность размещенного на них контента.

Кстати, в сети очень часто неверно упоминается тег rel=«canonical». Правильный вариант – атрибут rel=«canonical» тега <link>.

 

Как с помощью атрибута rel=«canonical» убрать дублированный контент

Этот атрибут существует для указания роботам поисковых систем информации о том, какая из дублирующихся страниц является канонической. В частности, речь идет об указании канонической ссылки.

Если вы вдруг не знаете, что такое каноническая ссылка, представьте себе ситуацию, когда одинаковый контент доступен сразу по нескольких адресам:

Link rel canonical

Канонические ссылки – это предпочитаемые адреса схожих страниц, которые должны учитываться поисковиками (по Вашему мнению). Далее по тексту мы также будем использовать термин «канонический URL».

Обычно каноническая ссылка является адресом страницы-первоисточника, на которой дублируемый контент был размещен изначально.

Допустим, что в рассматриваемом примере, третий адрес – канонический УРЛ. Тогда в код первых двух страниц в сеции <head> нужно ввести атрибут rel=«canonical» для назначения канонического URL:


Link rel canonical

После этого посетители и роботы все еще смогут просматривать все три варианта, но при индексации будет учитываться только та страница, у которой будет канонический УРЛ.

Особенности применения атрибута rel=«canonical»

  1. Для роботов поисковых систем канонический URL, заявленный при использовании тега <link>, является не беспрекословным указанием, а лишь рекомендуемым вариантом, который в некоторых случаях может быть проигнорирован.
     
  2. Может и должен быть использовать также и в коде предпочитаемой страницы с указанием ссылки на нее же. Это позволит поисковым роботам определять ее как основную даже в случае захода на нее с автоматически сгенерированных адресов.
     
  3. Канонический УРЛ должен вести на существующую страницу.
     
  4. В пределах одной странички нельзя указывать более одной канонической ссылки.
     
  5. Канонический URL не может находиться на другом домене (или поддомене в случае с Яндексом).
     

  6. Не рекомендуется выстраивать канонические ссылки в цепочку:

    Link rel canonical
     

  7. Нецелесообразно использовать этот атрибут совместно с мета-тегом robots, поскольку указания последнего всегда будут считаться более
    приоритетными. А следовательно, если в нем будет использовано указание noindex, nofollow, страница не будет индексироваться даже при условии Вашего указания в теге <link>, что ее URL канонический.
     
  8. Перед тем как указывать канонический УРЛ, нужно убедиться, что страница, которая размещена по нему, не закрыта от индексации в robots.txt.
     
  9. Убрать дублированный контент не удастся, если в коде всех одинаковых страниц указать разные канонические УРЛ. В этом случае рекомендации, скорее всего, будут проигнорированы.
     
  10. Рекомендуется прописывать абсолютные адреса ссылок, а не относительные.

    Link rel canonical
     

  11. Считается, что если указать канонический URL, предпочитаемой странице будет практически без потерь передаваться суммарный вес ее дублей.
     

Подводя итог…

… хотелось бы сказать, что атрибут rel=«canonical» является очень удобным инструментом, который хоть и не может удалить дублирующийся контент в буквальном смысле, но при этом дает возможность поисковым машинам закрыть глаза на его наличие.


Важно лишь правильно определять канонический URL, соответствующий странице, которая действительно должна попасть в ранжирование.

А Вы пользуетесь этой достаточно удобной возможностью? Или предпочитаете другие способы избавления от дублей страниц?

 

seo-akademiya.com

Аллан Скотт (Allan Scott), инженер программного обеспечения команды индексирования Google, перечислил в блоге Webmaster Central пять наиболее распространенных ошибок, которые допускают вебмастера при использовании атрибута rel="canonical", а также дал несколько важных советов по применению данного тега.

Прежде всего, представитель поиска напомнил специалистам отрасли о том, что атрибут канонической страницы чётко указывает поисковым роботам, на какой именно экземпляр из набора страниц с похожим содержанием ссылаются дубликаты. При этом, дополнительные свойства адреса (к примеру PageRank) и связанные сигналы (качество входящей ссылочной массы) также переносятся с дублированных страниц на каноническую. В настоящее время атрибут rel="canonical" поддерживают все ведущие западные поисковые системы: Yahoo!, Bing, и Google.

Однако зачастую применение атрибута rel="canonical" вызывает у вебмастеров определенные трудности. В свою очередь, ошибки, связанные с указанием канонической страницы могут повлиять и на отображение страниц ресурса в поисковой выдаче.


Link rel canonical

Чтобы избежать подобных ошибок, специалисты Google рекомендуют придерживаться следующих общих правил при проставлении атрибута rel="canonical":

  • Большинство дублированных страниц должно содержать ссылки на канонический адрес.
  • Важно убедиться в том, что страница, на которую ссылаются при помощи атрибута rel="canonical" существует, а ее URL — правильный (проверьте не возвращает ли сервер ошибку 404 ).
  • Необходимо убедиться в том, что каноническая страница не закрыта для индексации поисковыми роботами.
  • Важно четко понимать, какую страницу вебмастер хочет видеть в результатах поиска, именно ее и следует указывать как каноническую (к примеру, если сайт содержит набор страниц с одной и той же моделью товара, различающегося по цвету — целесообразно в качестве канонической указать страницу с наиболее популярным цветом).
  • Не стоит забывать о включении атрибута rel="canonical" в раздел документа кода HTML.
  • Важно избегать использования атрибута rel="canonical" более одного раза для одной страницы. В противном случае поисковик просто-напросто проигнорирует указание атрибута.

Далее Аллан Скотт перечислил 5 основных ошибок, допускаемых вебмасетрами и оптимизаторами при применении атрибута rel="canonical":

Ошибка 1. Атрибут rel="canonical" использован для первой страницы серии пагинации:

Представьте, что статья на вашем сайте имеет несколько страниц:

  • example.com/article?story=cupcake-news&page=1
  • example.com/article?story=cupcake-news&page=2
  • и т.д.

В данном случае страницы 2 и 3 не являются дубликатами, а значит и применение атрибута rel="canonical" для указания в качестве канонической первой страницы документа будет ошибкой. Данная ошибка может повлечь за собой выпадение страниц 2 и 3 из индекса.

Link rel canonical

В подобных случаях представители Google рекомендуют использовать атрибут rel="canonical" для страниц компонента, указывая в качестве канонического, адрес страницы, на которой расположена статья целиком.

Кроме того, при разбиении документа на страницы важно грамотно применять HTML-атрибуты rel="next" и rel="prev", позволяющие указать на взаимосвязь между отдельными URL.

Link rel canonical

Link rel canonical

Ошибка 2. Абсолютные ссылки записываются как относительные:

Link rel canonical

Безусловно, rel="canonical" можно использовать как для абсолютных, так для относительных ссылок, однако Google рекомендует использовать абсолютные ссылки для минимизации возможных ошибок. Если в документе указана базовая ссылка, то все относительные ссылки будут вычисляться на ее основе.

Однако в случаях, когда абсолютные ссылки на каноническую страницу по ошибке записываются как относительные (<link rel=canonical href=“example.com/cupcake.html”/> вместо http://example.com/example.com/cupcake.html), алгоритмы могут проигнорировать то, что данная страница была указана в качестве канонической.

Ошибка 3. Если каноническими назначено несколько страниц из набора с похожим содержанием, или атрибут rel="canonical" использован по ошибке:

Часто специалисты Google наблюдают следующую ситуацию: вебмастер копирует шаблон страницы, забывая при этом изменить значение атрибута rel="canonical"

Link rel canonical

Если вы используете шаблоны – не забывайте проверять, не был ли случайно скопирован атрибут rel="canonical".

Еще одна ошибка вебмастеров, когда каноническими назначается несколько страниц из набора с похожим содержанием. Часто это происходит из-за использования различных плагинов на странице. Код плагина по ошибке встраивается в атрибут rel="canonical".

Link rel canonical

Важно понимать, что в обоих случаях алгоритмы Google распознают применение атрибута rel="canonical" как ошибочное, и не учтут его использование при индексации.

Ошибка 4. Одна из категорий целевой страницы ссылается при помощи атрибута rel="canonical" на избранную статью:

Link rel canonical

При таком подходе в индекс попадет только страница со статьёй, сама же страница категории не будет проиндексирована.

Ошибка 5. Атрибут rel="canonical" используется в разделе документа <body> :

Link rel canonical

Как уже говорилось выше, атрибут rel="canonical" должен быть включен в раздел документа кода HTML, при этом он не должен попадать в раздел документа <body>. В противном случае алгоритмы Google не будут учитывать использование данного тега, особенно если он будет показываться обычного текста, или тегов, которые мы обычно присутствуют в разделе <body>.

Дополнительная информация, касающаяся применения атрибута rel="canonical" доступна на формуе Webmaster Help.

www.searchengines.ru

Теория и справка от поисковых систем

Привожу ссылки на официальную позицию поисковых систем: Google об атрибуте rel=»canonical» и Яндекс про атрибут rel=»canonical» тега <link>. Разумеется, и mail.ru тут как тут – про значение canonical в теге — не могли же они отстать от Яндекса, но это и хорошо, все под копирку, нам же проще.

Я знаю, что вы лентяи и читать справку не будете, хотя я настоятельно рекомендую это сделать, а потом приведу ниже все самые основные выдержки из справки:

Что такое каноническая страница? Это рекомендуемый экземпляр из набора страниц с очень похожим содержанием.

Зачем нужно указывать каноническую страницу? Если поисковая система видит, что страницы очень похожи или одинаковы, то согласно алгоритмам в результатах поиска появится только одна предпочтительная страница, которая, по мнению поисковой системы, лучше всего отвечает на запрос пользователя.

А как мы знаем, поисковик не всегда угадывает наши желания, потому лучше перестраховаться и указать нужную страницу самостоятельно. Сделать это можно добавив ссылку rel=»canonical» в раздел <head> неканонических версий всех страниц HTML.

Еще оказывается, можно указывать каноническую ссылку для не HTML содержимого, а, например, для pdf, doc или других файлов при помощи заголовков. Типа как X-Robots-Tag HTTP header, только тут будет Link HTTP header. Но это уже совсем для гик-маньяков, так что рассказывать об этом не буду.

Должна ли эта ссылка быть абсолютной или относительной? Можно указывать и так и так, но чтобы избежать ошибок и последующих недоразумений, стоит использовать абсолютные ссылки.

Что будет, если атрибут rel=»canonical» указывает на несуществующую страницу? А если каноническими назначено несколько страниц набора? В этом случае поисковая система просто проигнорирует данные правила и будет поступать, как и раньше — вычислять подходящий экземпляр из набора страниц согласно алгоритмам.

Можно ли использовать атрибут rel=»canonical» для указания канонического URL на другом домене? Можно, но не нужно. Важно понимать, что атрибут canonical это всего лишь подсказка или рекомендация, а не строгое правило в отличие от редиректа, который и стоит использовать в данном случае.

На основании всего вышенаписанного, а так же по информации из других официальных источников (блоги поисковых систем и блоги их сотрудников) можно сделать выводы о том, что тег link rel=»canonical»:

  • Это рекомендация, а не правило, а потому может быть проигнорирован в следующих случаях:
    • Документ по каноническому адресу не существует, отдает ответ 404;
    • Каноническая страница закрыта от индексации в robots.txt или мета-тегом;
    • В html-коде страницы указано сразу несколько атрибутов rel canonical;
    • Адрес канонического документа указывает на другой домен или поддомен;
    • Присутствует цепочка назначений rel=»canonical», т.е. для документа А каноническим указан документ Б, а в это время для документа Б указан каноническим документ В;
  • Необходимо указывать только для дублирующих или очень схожих страниц, а не для склейки двух разных страниц или передачи веса;
  • Адрес канонической страницы может указывать сам на себя;
  • Поддерживается всеми поисковыми системами: в Яндексе с 23 мая 2011 года, в Google с 12 февраля 2009.

alaev.info

Для чего выбирать канонический URL?

Указывать каноническую страницу из числа одинаковых или похожих стоит в следующих случаях:

  • Если нужно выбрать, какой URL следует показывать в результатах поиска. Предположим, вы хотите, чтобы посетители переходили на страницу с описанием платьев зеленого цвета по адресу https://www.example.com/dresses/green/greendress.html, а не https://example.com/dresses/cocktail?gclid=ABCD.
  • Для консолидации переходов на одинаковые или повторяющиеся страницы. Это поможет поисковым системам связать материалы, опубликованные на разных страницах, с одним основным адресом. В результате ссылки с других сайтов на страницу http://example.com/dresses/cocktail?gclid=ABCD будут объединены со ссылками на https://www.example.com/dresses/green/greendress.html.
  • Чтобы упростить получение статистики по отдельным товарам или темам. Если контент размещен на нескольких страницах с разными URL, это затрудняет получение обобщенной статистики по нему.
  • Для управления скопированным контентом. Если вы размещаете свои материалы по различным URL, потребуется задать самый высокий рейтинг для исходной страницы.
  • Чтобы оптимизировать затраты ресурсов на сканирование повторяющихся страниц. Желательно, чтобы роботу Googlebot не приходилось сканировать множество вариантов страниц, например предназначенных для разных типов устройств или обновляемых. В противном случае поисковая индексация вашего сайта не будет выполняться эффективно.

Как узнать, какой URL роботы Google считают каноническим?

Чтобы узнать, какую страницу Google считает канонической, воспользуйтесь инструментом проверки URL. Обратите внимание, что, даже если вы укажете ее, Google может выбрать другую. Это зависит от многих факторов, например от представленных на странице материалов или ее эффективности в Google Поиске.

Как указать каноническую страницу

Существует несколько способов указать каноническую страницу из числа повторяющихся:

Способ Описание
Общие положения Все способы канонизации URL приведены по этой ссылке.
Указание основного домена

В Search Console вы можете указать URL в одном домене как канонический для аналогичных страниц в другом домене, например example.com для www.example.com. Этот способ подходит, только если у вас есть два похожих сайта, которые отличаются лишь доменом. Не используйте этот способ для URL, отличающихся протоколом – http и https.

Плюсы

  • Очень легко реализовать и изменять.
  • Применимо, если у вас идентичные сайты в разных доменах.

Минусы

  • Работает только на уровне домена. Чтобы страницы распознавались как повторяющиеся, у них должны быть одинаковые адреса и названия.
  • Каждая страница на одном домене может соответствовать лишь одной странице на другом домене, при этом их пути должны совпадать.
Тег rel=canonical <link>

Добавьте в код всех повторяющихся страниц тег <link>.

Плюсы

  • Так можно пометить сколько угодно страниц.

Минусы

  • Увеличивает размер страницы.
  • Разметка на крупных сайтах или ресурсах, на которых URL часто меняются, отнимает много усилий.
  • Работает только с HTML-страницами, но не с файлами, такими как PDF. Для последних можно использовать атрибут rel=canonical в HTTP-заголовке.
HTTP-заголовок rel=canonical

Включите в ответ страницы заголовок rel=canonical.

Плюсы

  • Не увеличивает размер страницы.
  • Так можно пометить сколько угодно страниц.

Минусы

  • Разметка на крупных сайтах или ресурсах, на которых URL часто меняются, отнимает много усилий.
Файл Sitemap

Укажите канонические страницы в файле Sitemap.

Плюсы

  • Легко настроить и обновлять, особенно на крупных сайтах.

Минусы

  • Роботу Googlebot тем не менее нужно определить повторяющуюся страницу для каждой канонической, которую вы укажете в файле Sitemap.
  • Менее значимый сигнал для робота Googlebot, чем атрибут rel=canonical.
Код статуса 301 Используйте код статуса 301, чтобы сообщить роботу Googlebot, что URL, заданный в качестве нового адреса страницы, ведет на ее более актуальную версию.
Вариант страницы в формате AMP Если один из вариантов страницы – AMP, укажите каноническую страницу и ее варианты согласно инструкциям для AMP.

 

Мы рекомендуем использовать перечисленные выше методы, однако ни один из них не является обязательным. Если вы не укажете канонический URL, мы попытаемся определить его самостоятельно.

Общие положения

Ниже приведены общие инструкции по указанию канонических URL.

Способы

Указать канонический URL для повторяющихся URL или похожих страниц можно одним из способов, описанных ниже.

Какой бы способ вы ни выбрали, обязательно следуйте приведенным выше общим рекомендациям.

support.google.com

Когда нужно использовать канонические ссылки

  1. Для предупреждения появления различных дублей. Например:
    • страниц сортировок: /*sort, asc, desc, list=*;
    • дублей из-за UTM-меток: *utm_source=, /*utm_campaign=, /*utm_content=, /*utm_term=, /*utm_medium=;
    • других страниц c GET-параметрами в URL;
    • дублей в результате особенностей работы CMS (движка).

    В этом случае нужно добавить атрибут rel=“canonical” на все статические страницы сайта. Например, для страницы https://site.ru/category-1/page-2, rel=“canonical” будет выглядеть следующим образом:<link rel=“canonical” href=“https://site.ru/category-1/page-2” />

  2. Для доступных по разным URL страниц с очень похожим контентом.Например, это могут быть страницы одной серии товара, который отличается только расцветкой или страницы товара, который расположен сразу в нескольких категориях.В этом случае нужно указать со всех страниц rel=“canonical” на основную, приоритетную страницу.
  3. На страницах пагинации, если в категориях сайта есть страницы «Показать всё».В таком случае на каждой из страниц пагинации нужно указать канонической страницу «Показать всё».Например, для страницы https://site.ru/category-1/page-2 нужно прописать канонический URL:<link rel=“canonical” href=“https://site.ru/category-1/show-all” />

Как настроить канонические адреса rel=“canonical”?

Прописать между <head></head> тегами любой HTML-страницы

Это основной способ. Чтобы указать каноническую ссылку, пропишите между тегами <head></head> на странице полный URL страницы, которая должна быть в индексе.

Например, для страницы https://site.ru/*utm_content= канонической будет https://site.ru/.

Для получения такого результата, на странице https://site.ru/*utm_content= мы указали тег:

<link rel=“canonical” href=“https://site.ru/” />

Чтобы снизить вероятность ошибки в элементах link, после атрибута rel=“canonical” используйте абсолютные, а не относительные ссылки.

В файле Sitemap

В XML-карте сайта вы можете прописать канонический (основной) URL для любой страницы.

Атрибут rel=“canonical” — это рекомендация для поисковой системы, а не правило. В этом случае ПС могут проигнорировать их.

В заголовке HTTP

Лучше всего использовать для документов не HTML-формата. Например, для файлов формата PDF.

В таком случае сервер, при запросе дублирующего файла, должен отдавать ссылку на файл-оригинал:

Link: <https://site.ru/original -file.pdf>; rel=“canonical”

Этот способ подойдёт, если у вас есть доступ к настройкам сервера. Не рекомендуется использовать для HTML-документов.

С помощью плагина

Для CMS существуют различные плагины, которые позволяют настроить канонический URL. Например:

  • для WordPress можно настроить canonical с помощью Yoast SEO;
  • в OpenCart — реализовано в настройках CMS (нужно зайти в настройки товара и задать параметр SEO URL);
  • для настройки атрибута canonical в Joomla (версии 3.х и выше) нужно включить в настройках CMS функцию SEF. После включения для технических страниц вида /index.php?option будет добавлен атрибут rel=“canonical” (с указанием URL на страницу с настроенным ЧПУ).

301 редирект или rel=canonical

Если нет факторов, мешающих внедрить 301 редирект, то используйте этот вариант. Помните, что указание канонической ссылки является рекомендательным для поисковых систем. Нередко в выдаче Google можно встретить ранжирующиеся неканонические страницы, при этом в коде страницы будет указана ссылка на первоисточник.
Алгоритм поисковика строится не только на поиске канонической ссылки в коде страницы, но и на массе других факторов — наличии внешних и внутренних ссылок, релевантности для пользователя и т.д. Поэтому у Google может быть другое мнение на счет того, какую же из страниц-дублей необходимо считать оригинальной.
Если же необходимо оставить страницы доступными для пользователей либо существуют технические сложности в реализации 301 редиректа на сайте — используйте rel=canonical.

Основные ошибки использования rel=canonical

Канонические URL поддерживают большинство популярных поисковых систем: Google, Яндекс, Yahoo, Bing. Но вы все равно продолжаете видеть в индексе неканонические страницы вашего сайта? Первое что нужно сделать — проверить не была ли допущена ошибка при настройке rel=canonical. Ниже перечень наиболее распространенных ошибок:

Не индексируемая каноническая страница

Проверьте может ли робот поисковой системы проиндексировать страницу, на которую вы ссылаетесь как на каноническую. Удостоверьтесь, что:

  • страница отдает ответ сервера 200;
  • на странице не установлен мета-тег robots со значением noindex;
  • страница не закрыта от индексирования в файле robots.txt.

Разные канонические URL для одной страницы

Довольно часто устанавливаемые на сайт модули добавляют в код канонические ссылки. Это может привести в появлению нескольких rel=canonical на странице. Если ссылки в тегах указаны на разные URL, то, вероятнее всего, Google и другие поисковики просто проигнорируют ваши рекомендации.
Таким образом, все усилия по установке канонических страниц могут быть сведены на нет. Почаще проверяйте исходный код ваших страниц, чтобы убедиться в наличии только одной канонической ссылки.

Неправильное использование абсолютных ссылок

Распространенной ошибкой является указание канонической ссылки без протокола http:// или https://, как показано на примере ниже:

<link rel=«canonical» href=«ururu.com/ololo.html»/>

Допустимо указывать относительные ссылки:

<link rel=«canonical» href=«/ololo.html»/>

либо полный абсолютный путь с протоколом:

<link rel=«canonical» href=«http://ururu.com/ololo.html»/>

Для корректного восприятия поисковыми системами, особенно это касается Google, тег rel=canonical должен находиться в рамках области head кода вашей страницы. Кроме того, данный тег стоит размещать настолько близко к началу HTML кода, насколько это возможно.

Канонические ссылки со страниц пагинации на первую страницу

Такое решение вполне дееспособно для борьбы с дублями. Однако, может негативно повлиять на индексацию страниц, ссылки на которые как раз и расположены на страницах пагинации. Например на странице http://example.com/dresses.html?page=3 расположены ссылки на 20 товаров — они не будут проиндексированы поисковым роботом непосредственно по ссылкам с этой страницы.

Тег canonical при использовании hreflang

Если вы внедряете hreflang на своем проекте, то обязательно убедитесь, что все канонические ссылки указывают на страницы этой же языковой версии. Несоответствие этому правилу может привести как к проблемам с ранжированием языковых версий, так и к неправильному пониманию поисковиками приоритетных для ранжирования дублирующихся страниц.

Неканонические ссылки в sitemap.xml

Файл sitemap.xml помогает поисковому роботу понять какие страницы вашего сайта нужно индексировать и ранжировать в поисковой выдаче. Именно поэтому не стоит добавлять в карту сайта закрытые любым способом от индексирования либо неканонические страницы.

Использование rel=canonical для неидентичных страниц

Данный атрибут был разработан специально для указания приоритетной страницы среди страниц-дублей. Судя по всему, поисковики допускают определенную степень расхождения в контенте страницы. Но это абсолютно не значит, что можно ставить каноническую ссылку на просто схожую по тематике страницу.
Если Google заметит вас в неправильном использовании канонических ссылок, это может повлиять на его отношение к rel=canonical для всего вашего домена и тогда пострадают даже верно настроенные страницы.

Канонические ссылки (атрибут тега link rel canonical) позволяет указать какую именно страницу из группы похожих или одинаковых страниц нужно индексировать. Полезность данного инструмента сложно переоценить и глупо игнорировать. Ведь именно к правильному толкованию страниц сайта поисковыми системами, в значительной степени и сводится SEO сайта. Тем более, что канонические ссылки поддерживаются практически любой современной CMS вроде Joomla или WordPress.

Не дублируйте контент и ставьте правильные ссылки!

webmaster-seo.ru

Канонический URL – помощник в борьбе с дублированным контентом

Больше видео на нашем канале — изучайте интернет-маркетинг с SEMANTICA

Link rel canonical

Пример дубля web-документа

Стартовая страница интернет ресурса может быть доступна по нескольким адресам:

  • ru
  • primer.ru
  • ru/
  • ru/index.php

Поисковый робот распознает эти адреса, как четыре разных web-документа с идентичным содержанием.

 

Что такое канонический URL

Атрибут <link rel=»canonical» /> позволяет указать поисковому роботу каноническую, то есть основную версию документа. Этим атрибутом потребуется пометить не только основную продвигаемую страницу интернет проекта, но и ее дубли. Если робот найдет на сайте копии канонической страницы, то он пометит их, как малозначительные. Канонический URL – это самый легкий метод борьбы с дублированным контентом.

 

Как работает каноническая ссылка

Предположим, у нас есть основная страница http://yoursite.ru/statya1, которую также можно найти еще по нескольким адресам:

http://yoursite.ru/page?id=5

http://yoursite.ru/blog/statya1

 

 

Почему CMS создают дубли

Не нужно полагать, что система управления контентом намеренно генерирует дубли страниц. Обычно такие копии создаются вследствие некорректной настройки CMS. К самым распространенным причинам появления дублей относятся:

  1. создание архивов из старых статей;
  2. наличие открытых ссылок на документы в PDF-версии (для печати);
  3. неправильная структура сайта, добавление одинаковых страниц в разные категории;
  4. наличие динамических URL (характерно для интернет-магазинов).

Чтобы выявить дубликаты страниц и использовать атрибут rel canonical, можно воспользоваться инструментами Google для вебмастеров. Нужно перейти на вкладку «вид в поиске» и кликнуть по ссылке «оптимизация Html». В открывшемся разделе указаны страницы с повторяющимися метаописаниями. Такие документы нередко имеют дублированный контент.

 

Рекомендации по каноническим ссылкам

ПС Google советует не указывать атрибут rel=»canonical» в качестве директивы для robots.txt. Это может вызвать проблемы с индексацией сайта. Нельзя указывать разные канонические урлы для одной страницы (к примеру, один URL в карте сайта, а другой – непосредственно в разделе <head> страницы).

Чтобы снизить вероятность ошибки при индексации сайта, следует указывать в качестве атрибута link rel абсолютные, а не относительные пути. Иными словами, вместо структуры /blog/page-1 нужно использовать полный адрес http://yoursite/blog/page-1.

semantica.in

Rel canonical: что это

Когда на один и тот же контент можно попасть с помощью разных URL’ов, в индексе поисковых систем начинает участвовать сразу несколько страниц. В итоге ни одна страница толком не продвигается, так как внутренние ссылки идут то на одну страницу, то на другую.

Тоже самое касается внешних ссылок. Невозможно сосредоточиться максимально на продвижении одной страницы, а это в итоге не раскрывает потенциал страницы полностью. Или же, к примеру, покупаются ссылки на одну страницу, а на самом деле в индексе совершенно другая страница.

В результате чего сайт будет занимать позиции ниже, чем мог бы. Атрибут rel=canonical как раз позволяет нам оставить в индексе только самую приоритетную страницу. Также весь ссылочный вес передается на нее.

Чтобы в индексе была только одна страница, нужно прописать на страницах дубликатах в разделеканоническую ссылку на приоритетную:

<link rel="canonical" href="http://site.ru/prioritetnya-stranica" />

к оглавлению ↑

Откуда могут появиться дублирующиеся страницы?

Если для удаления дублей, можно воспользоваться 301 редиректом, я рекомендую в первую очередь обратить внимание на него. Если же 301 редирект не помогает или его использование неуместно, то на помощь можно позвать канонические ссылки, только будьте аккуратными.

к оглавлению ↑

Статья сайта относится к нескольким рубрикам

Если в ЧПУ вашего сайта выводится рубрика статей, то можно столкнуться с проблемой. Одна и та же статья может располагаться сразу по нескольким URL адресам. Вот у меня, к примеру, есть статья про безопасность в WordPress, она располагается сразу в 2-х категориях: «Полезное для блога» и «WordPress плагины». Поэтому доступна сразу по 2-ум разным URL адресам:

  • https://wpnew.ru/sozdanie-bloga/poleznoe_dlya_bloga/bezopasnost-wordpress.html
  • https://wpnew.ru/sozdanie-bloga/razdel-4-plaginy/bezopasnost-wordpress.html

Это для нас, обычных посетителей, как будто страница одна и та же. Для поисковиков же это 2 разные страницы, которые являются дублями. И они могут включить в индекс либо сразу обе страницы, либо не ту, которую хотелось бы. Как раз в подобных случаях выручает rel=canonical, который позволяет указать поисковикам, что нужно проиндексировать только одну конкретную страницу.

В моем случае со страницы https://wpnew.ru/sozdanie-bloga/poleznoe_dlya_bloga/bezopasnost-wordpress.html прописан канонический URL на https://wpnew.ru/sozdanie-bloga/razdel-4-plaginy/bezopasnost-wordpress.html и поэтому в индексе только второй вариант страницы.

Данный rel=canonical у меня прописывается автоматически с помощью плагина для WordPress, более подробно в конце урока.

к оглавлению ↑

Товары интернет-магазина в нескольких категориях

Еще одно из самых популярных явлений, это когда товары в интернет-магазинах расположены сразу в нескольких категориях. В виде примера приведу товар iPhone 6s, который может располагаться сразу на нескольких страницах:

  • site.ru/apple/iphone6s/
  • site.ru/mobilnye-telefony/iphone6s/
  • site.ru/catalog/iphone6s/

Все точно также, нужно указать со всех страниц rel=canonical на основную, приоритетную страницу. Как выбрать правильно каноническую страницу расскажу ниже.

к оглавлению ↑

Страница печати, разные id

Также на некоторых страницах встречаются страницы для печати. У них к URL  добавляется что-то вроде ?print=true. То есть, один и тот же контент может находиться на:

  • site.ru/content/post-1;
  • site.ru/content/post-1?print=true.

В таком случае со страницы site.ru/content/post-1?print=true нужно прописать в область(внимание, не в body!) следующее:

<link rel="canonical" href="http://site.ru/content/post-1" />

Благодаря этому действию, страница site.ru/content/post-1?print=true не будет участвовать в поиске, то есть не будет проиндексирована.

Также встречаются всякие &id=xxx , с ними боремся точно так же.

к оглавлению ↑

Тег more

Еще один популярный тег присваиваются статьям в стиле /#more-777 , который прописывается к URL. Чаще всего такое можно заметить на шаблонах WordPress, особенно старых. Чтобы в индекс попадала правильная страница, аналогично на странице site.ru/post#more-777 должно быть прописано :

<link rel="canonical" href="http://site.ru/post" />

Я же в идеале бы рекомендовал делать ссылки прямыми (с той же самой главной страницы), без тега more.

к оглавлению ↑

Дубли replytocom

Точно также бывает с ?replytocom=777 , которые могут попасть в индекс из-за древовидных комментариев. Делаем все по аналогии. Я же для борьбы с дублями replytocom просто ставлю галочку в плагине Yoast SEO и данная проблема больше не беспокоит:

Rel=canonical в WordPress

к оглавлению ↑

Партнерская программа

Когда реализуете партнерскую программу, часто много ссылок c «хвостами» начинают ссылаться на вас. Получается, что-то вроде этого: site.ru/?partner=id777. С подобных страниц тоже нужно прописывать атрибут canonical, чтобы они не попали в индекс.

к оглавлению ↑

Как правильно использовать rel=canonical

Как вы уже поняли, чтобы в индексе был только 1 вариант страницы, нужно со всех дублирующихся страниц проставить атрибут canonical. Вот как он должен выглядеть

<link rel="canonical" href="http://site.ru/osnovnoj-url" />

Данный тег должен находиться внутри.

к оглавлению ↑

Как правильно выбрать канонический урл?

Каноническая страница — это та страница, которая рекомендуется поисковикам для индексации среди всех дублей. Какую же лучше выбрать?

  • Если страница раньше имела только 1 url, то лучше сделать канонической ее, так как скорей всего она уже проиндексирована, также имеет определенный вес. То есть с новой страницы проставить rel=canonical на старую.
  • Если же страницы создавались примерно в одно время, лучше каноническим URL сделать ту, которая находится в индексе.
  • Если же несколько страниц-дублей находится в индексе поисковиков, то лучше выбрать тот, который будет продвигаться. Чаще всего тот URL, который имеет меньше всего уровень вложенности, либо уже имеет входящие ссылки.
  • Если же все условия идентичные у страниц дублей, обычно берется за приоритетную страницу та, которая подходит под некий шаблон товара/статьи по сайту и предпочтение отдается единообразию.

к оглавлению ↑

Частые ошибки с атрибутом rel=canonical

  1. Тег rel=»canonical» — это не строгая директива. Он лишь предлагает основную страницу для поисковиков, то есть просто-напросто советует.
  2. Нельзя использовать другой домен в данном атрибуте. Допускаются ссылки только внутри домена или поддомены.
  3. Для проставления канонических ссылок необязательно иметь 100% дублированный контент, если есть небольшие различия — это нормально. Такое может быть, когда продукты расставлены в другом порядке или поисковый робот посетил страницы в разное время, например.
  4. Если документ по каноническому адресу недоступен (отдает 404 ошибку, допустим), то поисковики могут проигнорировать его.
  5. Также поисковые роботы могут проигнорировать данный атрибут, если на странице указано несколько канонических урлов.
  6. Для указания канонического ссылки допускается использовать не полный URL адрес, а относительный путь:
    <link rel="canonical" href="/osnovnoj-url" />

    Но будьте аккуратны, можете «наломать дров», лучше использовать полный URL, с указанием вашего домена.

  7. Каноническая страница должна быть индексируемой.

Запомните: rel=canonical передает вес входящих ссылок.

Почитайте еще эти статьи (официальные руководства от Яндекса и Google):

  • Атрибут rel=canonical тега в Яндекс Помощи.
  • Канонические URL в справке Google Search Console.

к оглавлению ↑

Частные случаи использования rel=canonical

к оглавлению ↑

Сanonical сама на себя

Меня не раз спрашивали, можно ли ставить каноническую ссылку саму на себя? Такое обычно происходит при автоматической генерации с помощью разных плагинов или силами CMS. Ответ — да, можно, ничего в этом плохого нет.

к оглавлению ↑

Canonical для страниц пагинации

Многие вебмастера хотят сделать rel=canonical со страниц пагинации (site.ru/category/page/2) на первую страницу (site.ru/category). Это неправильно, как я считаю. Все-таки здесь встречаются не полные дубли, такие страницы пагинации лучше закрыть с помощью:

<meta name="robots" content="noindex,follow"/>

В WordPress это можно сделать автоматически, поставив галочку в плагине WordPress SEO by Yoast:

Запрет индексации страницы пагинации

к оглавлению ↑

Товары

Если товары разделены на несколько страниц (их много и сделана разбивка на несколько страниц), то лучше основным каноническим урлом сделать вывод всех товаров, которое обычно выводится с помощью добавления к URL что-то подобное этому ?all=products.

к оглавлению ↑

Атрибут rel=canonical в WordPress

Многие SEO плагины для WordPress очень хорошо дружат с атрибутом rel=canonical. Мой любимый и, как я считаю, лучший SEO плагин Yoast SEO вообще ничего не требует. Просто достаточно его активировать и необходимые канонические URL сами прописываются.

В некоторых других SEO плагинах в настройках нужно просто поставить галочку напротив «Канонические страницы» (или еще что-то подобное).

То есть по умолчанию, если статья на моем блоге присвоена сразу к нескольким категориям, то автоматически прописывается каноническая страница. Именно поэтому на странице https://wpnew.ru/sozdanie-bloga/poleznoe_dlya_bloga/bezopasnost-wordpress.html у меня прописан следующий атрибут rel=canonical (обратите внимание, это другой URL):

atribut-rel-canonical

По умолчанию, благодаря плагину Yoast SEO, если пост располагается сразу в нескольких категориях, в индекс же попадает только один вариант.

к оглавлению ↑

Выводы

Я надеюсь, что вполне понятно, смог объяснить, что такое атрибут rel=canonical и как им пользоваться. Настоятельно рекомендую ознакомиться вам еще с этим уроком: Как удалить ненужные страницы в индексе Яндекса и Google. Все эти действия с rel=canonical, 301-ым редиректом, meta name robots, файлом robots.txt позволят сделать выдачу вашего сайта «чистым».

Я за «чистый» индекс без дублей, служебных страниц и пр. ненужных вещей. Благодаря чистоте SEO продвижение сайта будет проще и правильнее.

И еще: чтобы не было подобных заморочек я рекомендую будущие ваши сайты создавать без указания категорий в URL статей/товаров. То есть пусть будет что-то вроде:

  • site.ru/statya.html (для блогов);
  • site.ru/catalog/iphone6s (для интернет-магазинов).

Отдельное спасибо за ретвиты и репосты, мои друзья. Обязательно жду ваших мыслей в комментариях.

wpnew.ru


You May Also Like

About the Author: admind

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *

Этот сайт использует Akismet для борьбы со спамом. Узнайте как обрабатываются ваши данные комментариев.

Adblock
detector