Валидный noindex


Когда нужно запретить индексацию целой категории или ряда страниц, это легче сделать с помощью правильного robots.txt. Но как быть, если требуется закрыть от индексации одну страницу либо вообще часть текста на странице? Поговорим сейчас об элементах, которые призваны решать именно эту проблему.

Что такое мета тег Robots

Сначала уясним, что есть мета тег Robots, а есть файл Robots.txt, и путать их не будем. Метатег имеет отношение только к одной html странице (на которой он указан), в то время, как файл txt может содержать директивы не только к странице, но к целым каталогам.

При помощи мета тега Robots можно запрещать индексировать содержимое всей страницы. На страницах моего блога он выглядит так:

Это означает, что метатег роботс не запрещает индексировать страницу. Noodp тут означает, что он запрещает Google брать в сниппеты описание для страниц из каталога DMOZ — это одна из стандартных настроек плагина Yoast SEO, которым я пользуюсь.

А вот как выглядит метатег Robots, который запрещает индексацию страницы:

Как прописать

Дедовский способ — вручную прописать для страницы. Способ подходит для сайтов на чистом HTML.

Для сайтов на CMS рекомендую использовать SEO-плагины. Я, например, для WordPress использую плагин Yoast SEO, и там под каждой записью в режиме редактирования есть такая опция:


Управляем индексацией с помощью Noindex Nofollow и других примочек

То есть проставить нужное значение можно парой щелчков.

Как использовать noindex и nofollow в meta robots

Посмотрим на возможные значения атрибута content:

  • noindex, nofollow – запрещена к индексации вся страница и переходы по ссылкам на ней; кстати, идентичной будет значение при записи: <meta name =”robots” content=”none”/>
  • noindex, follow – страница не индексируется, но поисковик может переходить по ссылкам;
  • index, nofollow – страница индексируется, но переход по ссылкам запрещен;

  • index, follow – разрешены к индексированию как страница, так и ссылки на ней;
  • noarchive – работает как в yandex, так и в google – не показывает страницу на сохраненную копию;
  • noyaca – работает только в Яндексе, если сайт зарегистрирован в каталоге YACA – запрещает использовать описание в результатах поиска, которое берется из Яндекс.Каталога; выглядит так: <meta name =”robots” content=”noyaca”/>
  • noodp – работает и в Яндексе, и в Google – запрещает использовать в результатах описания, которые взяты из Каталога ДМОЗ (разумеется, если сайт там зарегистрирован).

Поговорим чуть больше о noodp

Иногда Гугл может добавлять в сниппет описание из DMOZ. Именно для этого и используется атрибут noodp. Кстати, его можно использовать вместе с тегом nofollow. Выглядит это так:

Чего нужно опасаться при использовании

Из-за невнимательности (особенно у новичков) могут случаться конфликты между тегами: в таком случае главным будет положительное значение (разрешающее индексацию). Например тут:

Тут выбрано будет первое значение, так как там оно положительно.

Что такое тег Noindex

Noindex — это тег, в который вы заключаете часть кода, и этот код по идее не должен индексироваться Яндексом. Тег ноиндекс был предложен именно Яндексом, и по сей день учитывается только системами Yandex и Rambler. Вот как он выглядит:

Noindex не чувствителен к вложенности.

Целесообразность использования тега

Лично я смысла в его использовании не вижу. Потому что Google этот тег игнорирует. Да и зачем скрывать что-то? Надо делать сайты для людей!

Если же вы все-таки решили пользоваться этим тегом, то гляньте видео от ТопЭксперт:


Как пользоваться тегом Noindex

Нужно просто обернуть им тег:

Валидный Noindex

Чтобы сделать его валидным, нужно закомментировать тег. Выглядит это так:

Для чего нужны теги, запрещающие индексацию

Как я писал выше, тег Noindex вообще ни для чего не нужен. Он себя давно изжил. А вот метатег роботс — довольно нужная вещь. Вот примеры ситуаций, когда он бывает полезен:

  1. На сайте есть какая-то страница, которую бы вы не хотели видеть в индексе. Например, страница с информацией для рекламодателей. А прописывать в роботсе по каким-то причинам не хотите (например, хотите скрыть её от оптимизаторов, которые лазят по чужим роботсам). Тогда вы просто парой щелчков через плагин ставите ноиндекс для этой страницы;
  2. Поскольку мета тег роботс имеет приоритет перед robots.txt, можно запретить индексирование какой-либо страницы, которая находится в директории, разрешенной для индексации.

Для чего нужен атрибут rel nofollow

Если метатег robots должен закрывать от индексации страницу, а тег noindex — её часть, то атрибут rel nofollow должен запрещать поисковику переходить по ссылке. Он является атрибутом тега А и выглядит так:

На самом деле поисковик вполне себе переходит по ссылкам с этим атрибутом и они вполне себе забирают ссылочный вес у ваших страниц. То есть смысла в этом атрибуте, как и в noindex, нет. Ссылки закрывать эффективно только через Ajax, да и это я думаю не навсегда. Но, если же вы все-таки решили сконцентрировать внимание на этой точке, которая в лучшем случае даст вам микроскопический рост, то вот еще один видос от ТопЭксперт:

znet.ru

Общие сведения

Как и в случае с атрибутом nofollow, с которым я рекомендую ознакомиться, noindex имеет значения, как в случае обычного тега, так и мета-тега.

  • Тег noindex закрывает от индексации только те части, которые заключены внутри него;
  • Мета-тег noindex — закрывает всю страницу от индексирования.

В первом случае, тегом оборачиваются необходимые части текста на страницах, которые не нужно индексировать. Это могут быть служебные участки текста или же какая-то конфиденциальная информация.

Тег можно использовать, как в общепринятом варианте, так и валидном, чтобы сделать код страницы валидным и убрать ошибки за счет тега. Снизу даю 2 строки, первая из которых обычный вариант, а вторая — валидный.

Какой вариант использовать, решайте сами. Я же пришел ко второму.

В случае же с мета-тегом, noindex добавляется в шапку сайта, что запрещает всю страницу от индексации. Необходим в том же случае (служебные страницы и так далее), только уже для полной страницы.

В данном случае noindex является значением мета-тега robots (см. ниже).

«>

Теперь по поводу использования данного тега.

Применение

Как я уже я писал выше, применять его стоит в том случае, если на странице имеется какая-то служебная информация. Также это имеет место, когда имеются неуникальные куски текста, которые пагубно влияют на продвижения страницы. Их также можно закрывать тегом noindex.


Если же взять мета-тег, который применяется ко всей странице и содержится внутри мета-тега robots (скриншот выше), то данный случай стоит применять для закрытия целых страниц от индексации. Это могут быть целые служебные страницы, не несущие никакой пользы сайту и посетителям. Например, страницы контактов, карты сайта и так далее.

Также имеет место закрытие страниц пагинации, то есть тех страниц, которые разбиваются на списки. Например, в постраничной навигации на сайте можно закрыть все страницы, кроме первой, чтобы обезопасить себя от появления дублированного контента.

«>

Хотя, в последнее время я перестал закрывать страницы мета-тегом noindex. Связано это с произведенным мной анализом других популярных сайтов. Я увидел, что никто из гигантов не использует такое закрытие. Исходя из этого, я также убрал. Хотя раньше я добавлял noindex на такие страницы и все работало на ура. Поэтому, если у вас мета-тег добавляется на страницы пагинации, то можете не переживать.

Главное, чтобы сами контентные страницы были полностью открыти и на них не было мета-тега noindex.

Посмотреть его наличие можно в исходном коде страницы, нажав комбинацию клавиш ctrl+u.

Касаемо моего сайта, то я применяю тег и довольно часто, но не в самих статьях, а в самой верстке шаблона. Я закрываю все части, которые не несут смысловой нагрузки сайту:

  • социальные кнопки;
  • формы подписки;
  • на страницах рубрик, архивов и поиска закрываю текст краткого анонса, чтобы не дублировать контент, ведь он доступен и в полной версии статьи.

Проверить закрытые части данным тегом можно с помощью дополнения к браузеру RDS bar.

Вот, как выглядит закрытие формы подписки и социальных кнопок при активном RDS баре (закрытые области подсвечиваются коричневым).

«>

А вот закрытый кусок текста на страницах рубрик, архивов и поиска.

«>

Таким образом можно закрыть очень много ненужного в своем шаблоне.

На этом можно заканчивать данный материал. Больше о данном теге ничего толкового и не скажешь. В окончание хочу сказать, что если вы хотите закрывать внешние ссылки в noindex, то закроется только содержимое ссылки, то есть ее анкор.

Сама же ссылка работать будет и вес также будет передаваться акцептору. Для закрытия внешних ссылок, нужно использовать атрибут nofollow.

Если у вас остались какие-то вопросы по поводу тега noindex, то пишите их в комментариях под блоком похожих записей, которые также можете почитать. Уверяю вас, будет интересно.

Все, друзья. До связи.

С уважением, Константин Хмелев!


Валидный noindex

kostyakhmelev.ru

Пусть у нас имеется (X)HTML-код, в котором некоторые блоки размечены старым добрым невалидным тегом noindex. Например, вот такой. На сервере мы должны заменить все текстовые узлы внутри noindex’ов на комментарии, а сами noindex’ы заменить на нормальные человеческие теги, каким-то образом отмеченные, чтоб на клиенте знать, что внутри них нужно обрабатывать комментарии. Я в качестве такого «маркера» использовал класс «noindex», а в качестве «человеческого тега» — div, либо если noindex[@type = ‘inline’] — то span.

Собственно говоря, XSL-шаблон, через который прогоняется документ на сервере, выглядит вот так. На клиент приходит документ, в котором тег noindex заменен на div[@class = ‘noindex’], а все текстовые узлы заменены на комментарии. Т.е. что-то в этом духе:

<div> Дорогой Яндекс! <div class="noindex"><!--Не индексируй меня! --><b><!--Пожа-а-а-алуйста!--></b></div> Вот этот кусок можно проиндексировать. А <span class="noindex"><!--вот этот, пожалуй, не стоит--></span>. </div>


Остается натравить на это безобразие еще один шаблон, уже на клиенте. Он совсем простой: он копирует все дерево, заменяя обратно комментарии на текстовые узлы внутри тегов с классом «noindex». disable-output-escaping я оставил для наглядности: если бы Фокс с ним дружил, можно было бы обойтись без преобразования на сервере.

Клиентский шаблон смотрим вот тут. А весь пример целиком можно потискать вот здесь. У меня оно заработало в FF2, IE6 и Opera 9. Однако, я эту методику на практике применять не планирую. Во-первых, подключается не везде легко. Во-вторых, нет у меня доверия XSLT на клиенте. Так что цель статьи — только показать идею, а реализовывать — пока рано.

Кстати. А вот кто-нибудь мне может сказать, как бы организовать подряд 2 преобразования, не используя JavaScript, и не городя огород на сервере? Я пытался из XSLT вставлять processisngInstruction xml-stylesheet со ссылкой на другой шаблон. Казалось бы, это логично. Но вот фиг, не работает и все тут, хотя например в спецухе Мозиллы написано, что должно. Кто-нибудь знает?


Ссылки по теме:
XHTML+XSLT=nofollow+noindex
— топик на серче про статью Ayavryk’а
Валидный <noindex>? Можно! — там же, nickspring пытался придумать хак, но вроде не преуспел.

www.blogovo.ru

Мета-теги позволяют указывать метаданные о странице сайта. Ряд мета-тегов также используется роботами поисковых систем.

Робот Яндекса учитывает содержимое следующих мета-тегов:

  • <meta name=»Keywords» content=»…»/> — может учитываться при определении соответствия страницы поисковым запросам;
  • <meta name=»Description» content=»…»/> — содержание данного тега может использоваться в сниппетах (описаниях сайтов на странице результатов поиска);

  • <meta name=»viewport» content=»width=device-width, initial-scale=1″> — используется для адаптации сайта к показу на мобильных устройствах. Позволяет контролировать масштабирование окна просмотра в браузере. Значение width=device-width адаптирует ширину окна просмотра к экрану устройства. Значение initial-scale=1 позволяет обеспечить соотношение 1:1 между пикселями CSS и независимыми пикселями устройства.

    Если мета-тег отсутствует, мобильные браузеры по умолчанию показывают страницу для экрана компьютера. Так как ширина экрана мобильного устройства значительно меньше экрана компьютера, браузеры пытаются оптимизировать содержание — увеличивают шрифт, масштабируют содержание по размеру экрана или показывают только часть контента, которая помещается на экране.

  • <meta http-equiv=»Content-Type» content=»type; charset=…»/> — робот может учитывать этот тег при определении типа документа и его кодировки;
  • <meta http-equiv=»refresh» content=»N;url=_адрес цели перенаправления_»> — перенаправление (редирект) пользователя на страницу с адресом URL, после N секунд нахождения на данной странице. При небольших значениях N считается временным перенаправлением, аналогичным серверным редиректам с HTTP-кодом 302/303/307;

  • <meta name=»robots» content=»all»/> — разрешено индексировать текст и ссылки на странице, аналогично <meta name=»robots» content=»index, follow»/>;

  • <meta name=»robots» content=»noindex»/> — не индексировать текст страницы;

  • <meta name=»robots» content=»nofollow»/> — не переходить по ссылкам на странице;

  • <meta name=»robots» content=»none»/> — запрещено индексировать текст и переходить по ссылкам на странице, аналогично <meta name=»robots» content=»noindex, nofollow»/>;

  • <meta name=»robots» content=»noarchive»/> — не показывать ссылку на сохраненную копию на странице результатов поиска;

  • <meta name=»robots» content=»noyaca»/> — не использовать описание из Яндекс.Каталога для сниппета в результатах поиска.

Робот не посетит документы, если ссылки на них стоят со страницы, содержащей мета-тег со значением nofollow, тем не менее, они могут быть проиндексированы, если в других источниках на них указаны ссылки без nofollow.

Если мета-теги не указаны, робот считает, что они имеют положительное значение (index, follow, archive). Если робот обнаруживает конфликт между мета-тегами, он учтет положительное значение.

Пример:

<meta name="robots" content="all"/> <meta name="robots" content="noindex, follow"/> <!--Робот выберет значение all, текст и ссылки будут проиндексированы.-->

Исключение: атрибут all не влияет на атрибут noarchive:

<meta name="robots" content="all"/> <meta name="robots" content="noarchive"/> <!--Текст и ссылки будут проиндексированы, но в результатах поиска не будет ссылки  на сохраненную копию страницы.-->

yandex.ru

Тег <noindex> и атрибут rel=»nofollow»

Тег <noindex> – это HTML-тег, который запрещает Яндексу индексировать ту или иную область страницы сайта. Для поисковой системы Google этот тег не работает, более того, в Google вообще не предусмотрена возможность исключения части текста страницы из индекса.

Заблуждение №1. Основная ошибка людей, которые используют этот тег, заключается в убеждении, что если часть какого-либо текста помещена между открывающимся и закрывающимся тегом <noindex>, то робот Яндекса не станет читать и анализировать этот текст.

Единственное, что данный тег запрещает – это помещение содержимого в индексную базу, но это содержимое в любом случае будет прочитано и проанализировано роботом.

Сама суть тега <noindex> – «не индексировать», значит запрета на чтение нет.

Предположим, что поисковый робот зашел на вашу страницу и начал сканировать содержимое. В какой-то момент робот находит открытие тега <noindex>, что является сигналом роботу – дальше текст не индексировать. Но чтобы найти то место кода, где тег <noindex> закрывается, роботу необходимо прочесть содержимое, идущее после открытия данного тега. Следовательно, даже теоретически нельзя запретить роботам читать содержимое с помощью тега <noindex>.

Для чего же тогда нужен тег <noindex>?

Он нужен непосредственно для того, чтобы запретить роботу выдавать в выдаче своей поисковой системы какую-либо информацию. Это могут быть, к примеру, контакты, которые по каким-либо причинам не должны отображаться в выдаче.

Заблуждение №2. Ещё одно заблуждение, которое часто встречается среди владельцев сайтов, – это мнение, что ссылка, помещенная в тег <noindex>, не будет учтена поисковым роботом. Как я говорил ранее, всё, что находится внутри тега <noindex>, будет прочитано и проанализировано роботом Яндекса. И ссылки не являются исключением. Единственное отличие размещенных обычным образом ссылок от ссылок в теге <noindex> – это то, что текст (анкор) ссылки не будет проиндексирован.

На помощь вебмастерам, которым необходимо, чтобы робот всё же не учитывал ссылки со страниц, приходит атрибут rel=»nofollow», который работает как для Яндекса, так и для Google. При использовании этого атрибута ссылка всё равно будет изучена роботом и по ней будет произведён переход, но без nofollow по ссылке будет передан вес адресату, а с nofollow вес будет сгорать.

Существует два способа написания тега <noindex> в коде:

1. <noindex>Текст, запрещённый к индексированию</noindex>

2. <!—noindex—>Текст, запрещённый к индексированию<!—/noindex—>

Второй вариант более верный. Так как тег <noindex> не входит в официальную спецификацию языка разметки HTML, то его присутствие в коде может вызвать недопонимание у других поисковых систем, которые будут считать его наличие за ошибку. Чтобы сделать код страницы валидным, для всех поисковых роботов рекомендуется использовать закомментированный вариант написания. Яндекс такое написание распознает, а другие поисковые роботы не будет обращать внимание на его присутствие.

Метатеги <meta name=»robots» content=»noindex»/> и <meta name=»robots» content=»nofollow»/>

Использование метатега noindex в коде страницы запрещает Яндексу (Google, опять же, в данном случае не участвует) индексировать всё текстовое содержимое страницы, ссылки при этом будут проанализированы в полной мере. То есть наличие в коде страницы этого метатега не равнозначно закрытию страницы от индекса в robots.txt.

Наличие в коде страницы метатега nofollow запрещает поисковым системам индексировать ссылки на страницах. Переходить по ссылкам со страницы при наличии этого метатега роботы также не будут. Но вот что написано в помощи Яндекса:
«Робот не посетит документы, если ссылки на них стоят со страницы, содержащей метатег со значением nofollow, тем не менее, они могут быть проиндексированы, если в других источниках на них указаны ссылки без nofollow»

Подведём итоги

Тег <noindex> используем только для того, чтобы запретить роботам Яндекс выдавать информацию в выдаче.

Если мы хотим, чтобы вес ссылки не передавался адресату, то используем атрибут nofollow. При этом не забываем, что робот всё равно может пройти по ссылке (если информация о ней получена из других источников: карта сайта, ссылки) и проанализирует страницу, на которую она ссылается. Метод работает как для Яндекс, так и для Google.

1ps.ru

Сервисы проверки валидности кода HTML

Скорее всего, в сети есть очень много seo и обычных сервисов для проверки валидности, тем не менее, главный из них находится на сайте W3C здесь. В специальной форме вводите ссылку на свой сайт или любую его страницу, если требуется, выбираете дополнительные опции (кодировку, DOCTYPE), после чего запускаете проверку Check.

сервис проверки валидности HTML

При наличии неточностей, в результатах вы получите список предупреждений и ошибок в коде. Иначе высветится приятная зеленая надпись «This document was successfully checked as XHTML 1.0 Transitional!»:)

Чтобы ускорить процесс можно использовать одну из функций модуля для firefox web developer, где кроме валидации есть куча других полезных мелочей.

tods-blog.com.ua

Что такое валидность кода?

Уверен, многие блоггеры краем уха слышали словосочетание «валидность кода». А так же то, что код, по идее, должен быть валидным. Например, я, даже зная, что это такое, никогда не обращал на него внимания. До определенного времени…

Итак, валидный код – это соответствие кода любой  страницы вашего сайта стандартам HTML и CSS. Стандарты эти установлены организацией W3C (http://www.w3.org/), которая была основана в далеком 1994 году. В состав W3C входят более 300 компаний-лидеров IT рынка, среди которых IBM, Google, Nokia, Apple.

Что дает вебмастеру валидность кода?

  1. Кроссбраузерность. Т.е. гарантированно правильное отображение страниц сайта во всех существующих браузерах.
  2. Отсутствие ошибок уменьшает скорость отображения страницы. Нельзя сказать, что это существенно, но бывают ошибки, на обработку которых браузеры тратят достаточно времени.
  3. Улучшение индексации сайта поисковыми системами. На самом деле, этот пункт спорный. Но и Google и Яндекс в один голос рекомендуют «Старайтесь, чтобы верстка страниц соответствовала стандартам». Поэтому, валидность имеет какое-то значение в ранге страницы с точки зрения поисковика.

Как проверить валидность кода страницы?

Заходим на страницу проверки валидности, вбиваем ссылку на главную или любую другую страницу проверяемого сайта или блога и смотрим результат. Если есть ошибки, валидатор обязательно их покажет с детальным описанием каждой (правда, на английском языке).

Страница без ошибок выглядит так:

Проверка валидности кода страницы

Страница с ошибками оповестит пользователя таким сообщением красного фона:

Проверка валидности кода страницы нашла ошибки

Если ошибок нет, поздравляю. Можете смело ставить в футер (или другое место сайта) баннер валидатора, который громогласно будет говорить посетителям, что ваш сайт валидный! ?

Что делать, если есть ошибки валидации?

  • Во-первых, не расстраиваться. ? Такие ошибки содержат 80-90% сайтов. Проверьте хотя бы тот же google.com, yandex.ru или mail.ru (его мы только что проверили — картинка сверху), которые содержат много ошибок. Уже это могло бы послужить сигналом, чтобы не обращать внимание на такую «мелочь», как валидность кода.
  • Во-вторых, принять для себя решение,  надо ли оно вам или нет. Но профессионалы в seo оптимизации однозначно говорят «да» валидности. Код сайта должен быть валидным и точка.

Если принято решение в пользу исправления ошибок, что ж – вперед! Изучаем и анализируем текст по каждой ошибке (который выдал валидатор), вспоминает html и css и потихоньку приводим код шаблона в норму. Как вариант, заказать исправление ошибок валидности у профессионала.

Валидность тега <noindex>

Многие блоггеры знают, внешняя ссылка на блоге – это, не всегда хорошо, а в некоторых случаях и очень плохо. Поэтому ее часто закрывают. Или, как вариант, скрывают какую-то область сайта. Например, дубли. Один из вариантов скрыть желаемые участки или ссылки от индексации Яндексом, обрамить ее тегом <noindex>.

Проблема в том, что этот тег, по версии W3C, не соответствует стандартам, т.е. он не валидный. Казалось бы – мелочь какая, можно и не обращать внимание на это. Но мы ведь идем к цели сделать код полностью валидным. Поэтому, спросим у Яндекса, что он думает по этому поводу. В замечательном справочнике «Помощь вебмастеру» есть этот раздел, где уважаемый поисковик позаботился о наших проблемах и порекомендовал использовать не <noindex></noindex>, а <!—noindex—><!—/noindex—>:

Правильное использование тега noindex

Что же, воспользуемся рекомендациями Яндекса для корректировки кода популярного плагина WP No External Links по скрытию исходящих ссылок.

Валидный noindex для плагина WP No External Links

Этот плагин автоматически скрывает внешние ссылки от индексации. Для меня он очень удобен. Единственное «но», он ставит не валидный код <noindex>. Отказываться от плагина не хотелось, поэтому решил поправить код плагина. Чтобы и у Вас этот плагин работал с валидным noindex, необходимо сделать следующее

  1. Открываем файл  wp-noexternallinks.php (лучше всего это делать с помощью бесплатной программы notepad++). Файл лежит в папке плагина по следующему пути: site.ru/wp-content/plugins/wp-noexternallinks.
  2. Ищем строку &lt;noindex&gt;link&lt;/noindex&gt;
  3. Заменяем ее на &lt;!&ndash;&ndash;noindex&ndash;&ndash;&gt;link&lt;!&ndash;&ndash;/noindex&ndash;&ndash;&gt;
  4. Сохраняем файл wp-noexternallinks.php
  5. Открываем файл wp-noexternallinks-parser.php (лежит там же, в той же папке)
  6. Ищем строку $link='<noindex>’.$link.'</noindex>’;
  7. Заменяем ее на $link='<!—noindex—>’.$link.'<!—/noindex—>’;
  8. Сохраняем wp-noexternallinks-parser.php

Обратите внимание, если плагин обновится, все наши изменения сразу исчезнут. Что делать в этом случае? Выбор за Вами – или не обновлять плагин или после обновления проверить, не исправил ли сам автор эту ошибку и если не исправил, исправить все самому.

На этом мой рассказ о валидном теге noindex в плагине WP No External Links подошел к заверщению. Спасибо за внимание! ?

Несколько строчек в конце…

Вот и завершился первый гостевой пост на моем блоге. Хочу выразить благодарность его автору, Андрею Анкову. Уверен, что многие пользователи плагина WP No External Links даже и не подозревали о такой проблеме валидности тега noindex. Теперь у них будет все исправлено благодаря рекомендациям Андрея.

От себя добавлю, что сам я таким плагином не пользуюсь. Во-первых, все исходящие ссылки я контролирую самостоятельно. И во-вторых, мне не очень нравится сам подход этого плагина к решению проблемы — все исходящие ссылки с помощью редиректа он превращает во внутренние, тем самым лишая адресатов своих открытых переходов. Конечно, такой способ подходит, если мы ссылаемся на ГВС. Но а если ссылка идет на хороший блог? Придется все исправлять ручками. ?

www.workformation.ru

Тег <NOINDEX>

Парный тег <NOINDEX></NOINDEX> поддерживается (лишь) поисковиками Яндекс и Рамблер и предназначен для запрета к индексации текста страницы (а также любой другой информации/кода), находящегося между открывающим и закрывающим тегами.

Никакие другие поисковые системы не используют тег NOINDEX и при наличии на странице игнорируют его также, как и любой другой тег, не удовлетворяющий стандартам.

При использовании нужно быть внимательным в использовании данного тега и не забывать закрывать </NOINDEX>, иначе, к примеру, может получиться ситуация, которая была с данным сайтом, когда в качестве «ноиндекс-эксперимента» в его названии (внутри тега <title>) присутствовал текст <NOINDEX>, в результате чего NOINDEX.by упорно не появлялся в индексе Яндекса.

Тег <NOINDEX> безразличен к вложенности (что, в частности, подтвердил вышеописанный эксперимент), потому при желании его можно сделать полностью HTML-валидным:

<!—noindex—>Текст или код, закрываемый от индексации Яндекс/Рамблер<!—/noindex—>

Вышеприведенный вариант кода — рекомендация от Яндекс. В сети можно встретить другие «самопальные» варианты валидации NOINDEX, также вполне работающие (в отношении поддерживающих NOINDEX ПС):

<span class=»inv»><![CDATA[<noindex>]]></span>
Запрещённое для индексации
<span class=»inv»><![CDATA[</noindex>]]></span>

.inv {display:none}

Использование тега NOINDEX

Наиболее распространённое (ранее, как минимум — до мая 2010 года, пока Яндекс «не понимал» атрибут nofollow) использование тега  было «закрытие счётчиков» — запрет их кода для индексации, дабы уменьшить количиество исходящих ссылок с каждой страницы сайта. (Подобный метод сложно назвать «удачным», лучше использовать «Ставим правильные счётчики на сайт»).

Кто-то в попытке максимально оптимизировать сайт внутренней перелинковкой — закрывает с помощью <NOINDEX> ссылки в меню (навигации). Данный способ также сложно назвать «удачным», потому без полного понимания зачем это нужно и как оно работает — настоятельно не рекомендуется его использовать.

Часто, особенно с появлением у Яндекса фильтра ТС (Ты Спамный) — тегом noindex закрывается «лишний» (для Яндекса — ибо для Google он «остаётся», т.е. им учитывается и используется при ранжировании страницы по имеющимся в нём ключевым фразам) текст на странице. И если для некоторых случаев, к примеру, интернет-магазинов, где в noindex закрываются много раз повторяющиеся блоки описания товара — ещё можно считать такое оправданным, то наличие noindex на главной странице — настоятельно не рекомендуется, т.к. судьба его трактовки Яндексом даже в среднесрочной перспективе — крайне не очевидна.

Итого, совет по использованию тега <NOINDEX>: если есть хоть какой-то вариант его не использовать — лучше его не использовать.

noindex — значение мета-тега robots

В отличе от тега <NOINDEX>, использование noindex в качестве значения мета-тега robots является абсолютно стандартным. В таком варианте он также запрещает к индексации текст страницы и поддерживается (учитывается, используется) всеми поисковыми системами без исключения.

Используется как отдельно, так и вместе с другими значениями:

 <meta name="robots" content="noindex, follow"/>  

Использование «meta name=»robots» content=»noindex»

Данная конструкция используется крайне редко, т.к. есть много других, более удачных способов для запрета к индексации.
Кроме того нужно учитывать один, может быть не очень очевидный факт: для того, чтобы учесть, что данную страницу нельзя индексировать — роботу таки нужно хотя бы первый раз её прочитать. В результате может оказаться, что запрещённая таким образом таки появится в индексе. После (в теории) она должна из него уйти, однако (на практике) при наличии сложных запрещающих условий на индексацию страниц сайта — совсем не факт.

Потому данный (давно устаревший) способ запрета индексации — рекомендовать нельзя.

noindex.by


You May Also Like

About the Author: admind

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *

Этот сайт использует Akismet для борьбы со спамом. Узнайте как обрабатываются ваши данные комментариев.