Анализ текста на уникальность


Инструменты копирайтера для анализа текста

Всем привет! Сегодня у меня в гостях снова мой друг, один из ведущих SEO-специалистов Беларуси, Антон Шабан. Многие из Вас читали его предыдущую статью. Мало того, что тот материал стал одним из рекордсменов по социальному отклику, так после его выхода я получил более двадцати писем с благодарностью и просьбой не откладывать продолжение в долгий ящик. И вот, этот день настал!

Скажу сразу. Эта статья на 100% практическая, и она очень длинная. Антон писал ее более 20-ти часов, У меня ушло в общей сложности более 8-ми часов на ее подготовку к публикации. Но она того стоит. Вне зависимости от того, новичок Вы в SEO-копирайтинге или профи, она для Вас полезна. В ней раскрываются и простые вещи, которые должен знать любой уважающий себя копирайтер, и фигуры высшего пилотажа, освоив которые любой контентщик может смело увеличивать свой гонорар в 2-3 раза.


Многие вещи из тех, которые описал Антон, я не знал, но уже сейчас применяю их и, что главное, успешно продаю своим клиентам.

Материал получился не просто большим. Он огромный. Эту статью можно сравнить с небольшой книгой.

Поначалу я даже хотел разбить материал на 2 или 3 части, но затем подумал, что Вам будет проще добавить в закладки одну страницу, чтобы возвращаться к ней время от времени. А чтобы Вам проще было сориентироваться, сделал небольшое оглавление.

А сейчас я с гордостью передаю слово Антону. К слову, эту информацию он изначально планировал включить в платный образовательный курс, но после двух недель уговоров согласился сделать общедоступной. Словом, запасайтесь кофе и печеньем. Перед Вами мега-статья о том, как проводить SEO-анализ текста с помощью 11 инструментов, о которых многие не знают, а некоторые — даже не догадываются об их существовании.

И снова здравствуйте, уважаемые читатели блога Даниила! Пользуясь случаем хотел бы поздравить вас всех с прошедшими Новым годом и Рождеством и пожелать творческих успехов! Сегодня я хочу представить вам вторую часть цикла гостевых статей и обсудить полезные инструменты и сервисы, которыми пользуются SEO-специалисты при работе с текстами. Более того, именно ими они просят проверять материалы копирайтеров. Эти сервисы часто встречаются в технических заданиях. Сразу хочу предупредить, что мы будем исследовать измеримые параметры текстов. Объективное качество текста, увы, никакими сервисами измерить не получится.


Если вы не читали первую часть цикла статей, то настоятельно рекомендую ознакомиться перед прочтением этой.

Все основные сервисы, рассмотренные в статье, бесплатные и доступны каждому. Однако, к сожалению, это также означает, что со временем эти сервисы могут перестать работать или исчезнут, если угаснет интерес их создателей.

Также в статье приведен один платный сервис, который значительно облегчает работу копирайтеру. Использовать его или нет – решать вам!

Зачем вообще нужны все эти SEO-сервисы?

Такой вопрос может закономерно возникнуть. В конце концов, заказчику, как правило, нужен классный текст, а не какие-то параметры. Как можно технически измерить качество материала, цепляет ли он, продает ли он? Никак, пока его не начнут читать, пока с этой страницы не начнут покупать, пока не поделятся в соцсетях.

Однако, есть ряд параметров, которые необходимы для успешного продвижения текста в поисковых системах.


Параметр На что влияет Можно ли автоматизировать проверку?
Уникальность Ранжирование (неуникальные тексты могут ранжироваться низко или завести сайт под фильтр) Да
Процент вхождений ключевых фраз Большой процент – переспам, понижение позиций Да
Вхождения ключевых фраз Нет вхождений – поисковику трудно понять, что текст соответствует этим ключевым фразам Да
«Вода» в тексте Заказчик переплачивает за бесполезный текст, качество текста для читателей и для поисковых систем снижается Частично
Орфография и пунктуация Качество текста для читателей и для поисковых систем Частично
Смысловая уникальность Качество текста для поисковых систем, уникальная польза для читателей Нет
Полезность Качество текста для читателей + читаем в прошлой статье про алгоритм Knowledge-Based Trust от Google Нет
Экспертность Качество текста для читателей. Вероятно, в будущем будет влияние экспертности автора на ранжирование. Нет

Если хоть какие-то параметры можно проверять автоматически – это стоит делать. Технологии, усложняются, ритм жизни ускоряется, а нам необходимо экономить драгоценное время.

Запомните: цели нарочно мучать копирайтера всеми этими сервисами нет ни у одного SEO-специалиста или вебмастера (по крайней мере среди моих знакомых). Надеюсь, после прочтения этой статьи вы будете лучше понимать, зачем просят проверять текст тем или иным способом.

Кроме того, знакомство с определенными сервисами открывает перед вами новые возможности:

  • Уменьшает время на проверку (позволяет либо больше времени уделять материалу, либо сократить время на создание и проработку текста).
  • Делает прозрачным понимание требований SEO-специалистов и вебмастеров.
  • Улучшает тексты, даже если от вас этого не требуют. Это позволяет увеличить стоимость ваших текстов и дает конкурентное преимущество.

Уникальность текста

Чем важна: базовый параметр. Если текст просто скопирован или сделан плохой рерайт, то в лучшем случае он просто не навредит.

Чем проверить: инструментов много, но я предпочитаю http://text.ru/ (в том числе и благодаря наличию онлайн-проверки).

Почему многие просят проверять по Text.ru? Потому что там не используется стандартный алгоритм проверки уникальности текста методом шинглов (он используется большинством сервисов), что позволяет достаточно успешно определять некачественный рерайт. Да, Text.ru часто маниакален в плане проверки уникальности, однако нужно просто рассматривать каждый случай в отдельности.

Время на проверку: 1-5 минут, в зависимости от сервиса.

Время на доработку: зависит от того, насколько добросовестно писался текст. Я свои тексты даже не проверяю, так как они по умолчанию авторские.

Кстати, пару месяцев назад на Etxt.ru также был введен новый метод проверки уникальности, который позволяет «отлавливать» рерайт (перестановку слов, изменение словоформ и т.д.)

Обнаружение рерайтинга через сервис Etxt


Проверка на рерайт в сервисе Etxt.

На что обращать внимание: для карточек товаров в интернет-магазине уникальность не важна. Маниакально переписывать описания товаров нет нужды. Для некоторых новостных сайтов также достаточно рерайта или частичного рерайта.

Также есть еще такой «грязный» метод увеличения уникальности: замена некоторых символов в русских словах на аналогичные английские. На практике я с такой халтурой не сталкивался, только если это опечатки. Но сервис текст.ру их находит и выделяет. Стоит проверять и править, чтобы поисковые системы верно понимали слова.

Выявление замены русских символов (кириллицы) английскими (латиницей)

Текст.ру позволяет выявлять замену русских букв (кириллицы) английскими аналогами (латиницей) и отлавливать «хитрых жуков», выдающих модифицированный копипаст за 100% оригинальный текст.

Тошнотность

Скажу вам честно: меня еще ни разу не стошнило от текста. Даже от самого плохого. Даже от самого спамного и дурацкого. Поэтому этот параметр для меня всегда равен нулю и лично я его в работе не использую.

Академическая тошнота — это отношение количества повторов самого часто употребляемого в документе слова к количеству слов во всем тексте. Если большая (более 5-7%), то это переспам.

Конечно, у разных сервисов могут быть различные способы подсчета тошноты, но проверка на переспам, которая будет рассмотрена ниже, на мой взгляд, позволяет оценить наличие проблем с процентом вхождений фраз.

Заспамленность текста


Чем важна: тексты с большим процентов вхождений ключевых слов могут пессимизироваться поисковыми позициями (позиции занижаются за спам), при большом количестве таких текстов сайт может попасть под санкции.

Чем проверить: http://istio.com/rus/text/analyz/

Время на проверку: 1 минута.
Время на доработку: 0-20 минут.

На что обращать внимание

Какой процент заспамленности текста допустим для SEO? На практике от вас могут требовать определенный процент или количество вхождений, однако, могу рекомендовать достаточно безопасную границу в пределах 2-3%. Лучше не более 2% — плотность самого частого ключевого слова в вашем SEO-тексте. Как проверить оптимально ли число вхождений? Очень просто. Открываем сервис, вставляем текст, нажимаем «Анализ». И все.

Анализ текста через сервис Istio

Анализ текста через сервис Istio.com

На выходе получаем такую вот картину (я проанализировал прошлую гостевую статью для блога Даниила).


Результаты проверки текста через сервис Istio

Результаты проверки текста через сервис Istio.com

Смотрим на столбец «% в тексте». Видно, что самое частотное слово — это слово «Текст». Его плотность не превышает 2% — безопасный уровень.

В ряде случаев большая плотность может не повредить, но попробуйте прочесть текст, где плотность какого-то слова 5% и вы сразу почувствуете, что читается сложно. Ниже будет рассмотрен сервис, который поможет вам найти точное необходимое число вхождений, если это потребуется.

Что касается указанной статьи, то там вызывают вопросы 2 слова: «год» и «Антон». Но, если поразмыслить, то «год» употребляется для обсуждения трендов и указания дат изменения алгоритмов, а вот мое имя слишком часто, аж 13 раз =).

Плотность ключевых слов в тексте

ТОП-10 слов в тексте с наибольшей плотностью.

Простой пример: если пишем текст про каркасные дома, то увидеть в ТОП10 фраз слово «окно» я не ожидаю. Проверить это поможет анализ самых частых слов текстов конкурентов, который мы проведем чуть ниже.

Количество уникальных фраз


Еще важный момент: помните в прошлой статье обсуждали тот момент, что в ТОП-10 находятся преимущественно большие тексты? Большие тексты содержат больше уникальных слов, что позволяет собирать больше трафика на статью за счет так называемого «длинного хвоста» запросов (про него обязательно напишу отдельную статью). Отсюда растут корни и LSI-копирайтинга. Так вот, в Istio вы можете посмотреть этот показатель в строке «Словарь». Показатель можно сравнивать с успешными статьями конкурентов.

Общее число слов и словарь в тексте

Общее число слов и словарь материала.

Не стоит специально стараться завысить этот показатель за счет использования редких словечек, архаизмов и неологизмов. Сам по себе он ничего не значит.

Зато можно постараться найти тематические слова, которые можно употребить в тексте, чтобы он лучше ранжировался или собирал больше трафика. Кроме того, эти слова и фразы смогут навести вас на мысли о том, что еще следует в тексте упомянуть.

Где их взять? Разберемся в конце статьи. Читайте дальше.

Объем текста

Чем важен: сам по себе — ничем, т.к. это может быть «вода», однако, как показывают результаты некоторых исследований, большие тексты ранжируются лучше. Кроме того, обычно по ТЗ требуется определенный объем или «вилка» (что на мой взгляд, предпочтительный вариант). Да и платят многие за «килознаки». Поэтому надо мерять.

Чем проверить: определяется любым сервисом, например, уже рассмотренным выше Istio.com.


Определение объема текста через сервис Istio

Определение объема текста через сервис Istio.com.

Либо в том же Word:

Определение объема текста через MS Word

Определение объема текста через MS Word.

Либо в text.ru или любом другом сервисе проверки уникальности текста:

Измерение объема текста через сервис Text.ru

Измерение объема текста через MS Word.

Время на проверку: пару секунд.

Стоп-слова (водность текста)

Вот и подошли к параметру «водность» текста или наличие стоп-слов.

Под стоп-словами в данном случае понимаем слова и фразы, которые не несут смысловой нагрузки, и текст ничего не теряет при их удалении. Например, «нетрудно догадаться, что», «без всякого сомнения» и пр. Да, в некоторых случаях эти фразы могут присутствовать. Например, когда статья пишется живым языком. Но в коммерческих текстах они лишние, да и при написании информационных статей я предпочитаю от них избавляться.


Чем важно: чем более содержательный текст, тем лучше. Да и переплачивать за «переливание из пустого в порожнее» никому не хочется.

Чем проверить: http://contentmonster.ru/empty/ — сервис проверки. Вставляем текст и http://contentmonster.ru/empty/list/ — список из 515 фраз, по которым идет проверка.

Проверим фрагмент этой статьи:

Проверка части статьи на наличие стоп-слов.

Проверка части статьи на наличие стоп-слов.

Ай-яй-яй… В свою защиту скажу, что если статья пишется живым разговорным языком, то наличие стоп-слов неизбежно, зато текст не выглядит сухим. Удалять стоит в случае переизбытка. Но я, пожалуй, удалю несколько =).

Время на проверку: 1 минута.

Время на доработку: 0-10 минут.

На что обратить внимание: сервисы могут обнаружить только определенные фразы, хотя текст может быть «водой» целыми предложениями или абзацами.

Еще один сервис, ставший популярным – Главред https://glvrd.ru/.

Его я также отношу к сервисам проверки стоп-слов, так как его оценка как раз и показывает соотношение количества стоп-слов ко всем остальным словам. Обычно у текстов, где меньше всякой ерунды, оценка выше.

На что обратить внимание: посмотрите, что подчеркивает. Действительно помогает задуматься, добавить что-то важное и полезное.

«Главредом» можно быстро оценить количество «воды» (сервис подсвечивает стоп-слова). Если вы заказчик, то можно указывать в ТЗ оценку по шкале «Главреда» не менее 7 баллов. 10 баллов добиваться смысла не вижу: велик риск получить на выходе сухой и безжизненный материал.

Текст должен цеплять, оценки сервиса не показатель качества. Поэтому если я получаю крутую статью, которая мне нравится, соответствует ТЗ и цели написания, то никаких проблем.

Проверил часть статьи про стоп-слова – я не безнадежен!

Анализ текста через сервис Главред

Проверка текста через сервис «Главред».

Наличие нужных по ТЗ слов

Я очень долго искал доступный инструмент подобного плана и наконец нашел!

Чем важно: нет нужных слов — поисковик не будет ранжировать по ключевым фразам. Кроме того, можно собирать тематические фразы и также их использовать (об этом ниже).

Чем проверить: http://cabinet.seo-case.com/fraznum.php (бесплатно, но нужна регистрация в сервисе «Семён Ядрён»).

Время на проверку: 1-2 минуты.

Время на доработку: зависит от того, употребили ли вы изначально все фразы.

Заходим в сервис, в левое поле вставляем фразы, в правое – наш текст (либо адрес страницы, где текст уже размещен, но адреса страниц сейчас почему-то некорректно там обрабатываются, вставляйте текст). Нажимаем «Анализировать» (не обращайте внимание на ошибку на кнопке =).

Проверка текста на наличие нужных по ТЗ слов

Проверка текста на наличие нужных по ТЗ слов.

Допустим, у меня текст про каркасные дома и по ТЗ там должны быть вот такие слова и фразы (как найти тематические слова самостоятельно рассмотрим на этом же примере чуть ниже).

Ключевые слова Тематические слова
дом
каркасный
каркасный дом
каркасное строительство
дома из каркаса
ключ
строительство
каркас
недорогой
панельный
минск
кредит
беларусь
купить
стоимость
домостроение
цена
изготовление
дача

домик
производство
покупать
минский
услуги

Вставляем эти фразы в левое поле, в правое – текст одного из сайтов.

В итоге получаем данные по наличию этих фраз или слов в тексте в указанной форме либо другой словоформе, а для фраз – есть ли они в пассажах:

Анализ текста на использование ключевых слов через сервис Семен Ядрен

Анализ текста на использование ключевых слов через сервис «Семен Ядрен».

А в конце аккуратная сводка: если слово выделено красным, то его вообще нет в тексте, даже словоформы!

Выходные данные на сервисе Семен Ядрен

Выходные данные по словоформам.

Если знаете аналоги этого сервиса, напишите в комментариях, ибо я очень долго его искал. Бывает, даю копирайтеру в ТЗ на текст и 30-50 тематических слов и фраз (для информационных текстов), проверять их наличие уж точно непросто и копирайтеру, и мне.

Орфография и пунктуация

Чем важна: неграмотные тексты неприятно читать. Кроме того, грамотность текста может влиять на ранжирование, но подробных исследований на эту тему я не видел. Тем не менее, у Яндекса среди инструментов для Вебмастеров не зря находится инструмент по проверке орфографии.

Чем проверить:

https://webmaster.yandex.ru/spellcheck.xml — инструмент от Яндекса для проверки страниц. Вставляем ссылку, проверяем.
https://tech.yandex.ru/speller/ — если нужно проверить текст, который не размещен в сети, используем этот инструмент.

Инструменты Яндекса достаточно ограничены, поэтому мой сервис-любимец – это Орфограммка (http://orfogrammka.ru/) — регистрируемся (либо входим через какой-то аккаунт), вставляем текст, нажимаем «Проверить».

Проверка орфографии текста через сервис Орфограммка

Проверка орфографии текста через сервис «Орфограммка».

В итоге получаем рекомендации по:

  • орфографии;
  • пунктуации;
  • грамматике;
  • стилистике;
  • типографике;
  • орфоэпии;
  • семантике.

Они упорядочены справа в меню. Вы можете выбрать, на какие обращать внимание.

результаты анализа текста

Вот у меня нашло «очепятку». Не буду позориться перед Даниилом и поправлю сам =)

Исправление опечаток

Исправляем опечатки.

Также можно проверять текст на орфографию и пунктуацию с помощью Word, сервисов проверки уникальности текста. Например, text.ru также ищет ошибки (но не очень успешно).

Текст.ру не очень успешно ищет ошибки

Сервис Текст.ру не особо успешно ищет ошибки.

Время на проверку: 2-3 минуты (сервис 1-2 минуты тратит на анализ текста).

Время на доработку: 0-30 минут. Зависит от грамотности!

На что обращать внимание: я обращаю внимание на орфографию, пунктуацию, грамматику. Стилистика и типографика – если есть время.

Бонус! Дополнительные инструменты для SEO-анализа текста

Ниже я расскажу еще про 3 сервиса, которые помогут вам проделать значительную работу по анализу вхождений в текстах конкурентов, поиску тематических слов в поисковой выдаче и в текстах на любых сайтах.

Сервис семантического анализа для создания SEO-текста

SEMparser.ru – это настоящий комбайн для решения некоторых, обозначенных выше задач.

Сервис помогает:

  • найти наиболее часто встречающиеся в ТОП10 страницы по ключевым запросам;
  • определить слова, которые подсвечиваются в выдаче;
  • сделать анализ текстов конкурентов.

Это позволяет изучить тексты конкурентов, которые лучше всего ищутся по нашим ключевым запросам.

Например, у нас есть ключевые фразы, которые находятся в ТЗ.

Список ключевых слов

Список ключевых слов.

Нажимаем «Добавить проект».

Дальше нужно будет задать название проекта и регион, в котором нужно искать сайты конкурентов. Регион – обязательно (если запросы коммерческие, то задаем город, где находится бизнес, если некоммерческие – вводите Москва, все равно по информационным запросам выдача будет геонезависимой).

Данные для анализа

Обязательно оставляем дополнительную опцию «Парсить подсветку из сниппетов Яндекса».

Далее загружаем вопросы в XLS (формат указан) и нажимаем «Запустить выполнение проекта».

Подтверждение отправки данных

Подтверждаем запуск. Сервис платный, поэтому спишет небольшой баланс (стоимость 1 запроса зависит от кол-ва запросов, которые вы покупаете, но один запрос стоит от 0.6 рублей. То есть 19 запросов – 11.4 рубля).

Подтверждение запуска проекта

Запускаем. После этого мы увидим список ключевых фраз. Если они перегруппировались, то просто перетаскиванием «сгоняем» их в одну группу.

Группировка ключевых запросов

Теперь воспользуемся тремя отличными отчетами:

  • найдем подсветки для указанных ключевых фраз (слова, выделенные жирным в выдаче) – кнопка B;
  • определим параметры текстов, которые ищутся в поиске – кнопка T;
  • определим страницы конкурентов, которые лучше всего ищутся в поиске по этим ключевым фразам – символ кубка.

Найдем подсветки – нажимаем кнопку B (это уже бесплатно). Получаем список фраз.

Подсветка сниппетов Яндекса

тут указаны все слова, которые подсвечиваются в выдаче. Среди них могут встретиться слова, которые не встречаются в словах из запросов. Например, можно найти такие:

домик
производство
покупать
минский
цена
стоимость
услуги

Как правило, если упомянуть их в тексте, можно повысить релевантность всего материала.

Важно! Обращайте внимание на то, что не нужно бездумно брать все полученные фразы. Берите только те, которые имеют отношение к текстам. Нет на странице отзывов – не нужно брать фразу «отзывы» и т.д.

Находим страницы сайтов конкурентов, которые лучше всего ищутся в поиске. Для этого нажимаем на иконку кубка.

Результаты

Получим вот такой отчет:

Результаты

Тут указаны 10 страниц сайтов, которые лучше всего ищутся по запросам. Можете их себе записать, пригодятся в дальнейшем. Обязательно просмотрите результаты, там могут оказаться тексты не того типа, как вам предстоит написать. Например, мне стоит удалить из списка конкурентов страницу, выделенную красным, так как это не коммерческий текст.

http://ghouse.by/tip/karkas
http://stroyexpress.by/
http://domovoi.by/
http://filartbel.by/doma/karkasno-shchitovye-doma
http://mdl.by/doma-pod-klyuch/karkasnye-doma
http://www.belsrub.by/proekty-domov/karkasnye-doma.html
http://woodplace.by/karkasnye-doma
http://karkasnik.by/uslugi/stroitelstvo/
http://www.stroitelstvosovety.ru/drugoe/karkasnyj-dom-svoimi-rukami
http://megoprom.by/g436798-karkasno-schitovye-doma

Делаем анализ текстов. Нажимаем на букву Т.

Выборка

Настройки можно оставить по умолчанию.

Настройки выдачи

В итоге будет проанализирован ТОП10 самых видимых документов (они приведены выше). Чтобы в анализ не попала страница, выделенная красным, мне нужно выбрать ТОП8 (просто исключить страницу нельзя). Выбираю и нажимаю «Получить параметры текстов».

Настройки выдачи

Немного ожидания и вуаля!

Результаты манипулиций с анализом

Получаем ссылку, которую можно дать копирайтеру для проверки либо проверить себя (если вы копирайтер).

На вкладке «Параметры текстов» можно посмотреть средние данные по текстам. А именно видим, что нужен текст порядка 5 000 символов без пробелов. Конечно, большую погрешность вносит первый текст, там неправильно снялась длина текста.

Таблица с данными

На вкладке «Слова из текстов» вы можете найти рейтинг слов и их частотности в текстах конкурентов.

Рейтинг слов и их частотности

Тут, кстати, можно найти тематические слова. Слова, которые есть в запросах, выделены жирным.

Тематические слова

Остальные слова можно записать себе в список тематических и употреблять в тексте. Например: проект, материал, преимущество, работа, готовый и пр.

Важно! Нет никаких гарантий, что их включение даст плюс. Но многие из них на самом деле могут помочь подтянуть низкочастотные запросы либо раскрыть тему полнее.

На вкладке «Проверка» можно ввести текст и проверить его на соответствие анализу наиболее успешных страниц конкурентов. Проанализируем текст лидера.

Проверка текста лидера

Проверка текста лидера выдачи.

В результате вы увидите, что текст лидера не соответствует средним значениям и не содержит ряда слов, что не мешает ему занимать первые строчки. Если бы сервис находил диапазон вхождений по конкурентам, было бы лучше, т.к. попасть в точное среднее значение сложно, да и смысла нет.

Сервис покажет количество и процент слов, вычисленных на основе анализа конкурентов, к этому же числу, но по вашему тексту.

Сравнение текстов

Сравнение нашего материала и текста лидера выдачи.

Важно! Такая «подгонка под ТОП» может дать положительный результат в конкурентных тематиках, но не означает гарантию успеха. По данным Яндекса, порядка 50 факторов из 800 относятся к текстовым. Это значит, что страницы, которые вы анализируете могут быть в ТОПе не за счет материалов, а сами тексты могут и вовсе оказаться спамными.

Такой анализ можно проводить для страниц, которые содержат текст (статьи, описания услуг) по конкурентным запросам, но мучаться с точной подгонкой не стоит. Главное не спамить и использовать вхождения слов, которые действительно тематические.

Поиск подсветок в поисковой выдаче

У Яндекса есть технология «Спектр», которая позволяет подмешивать в выдачу результаты поиска, которые раскрывают различные значения запроса. Подробнее советую прочитать у самого Яндекса. Это те же фразы, которые собрал нам SemParser, только получим их бесплатно.

Нам же стоит посмотреть, какие фразы подсвечиваются в поисковой выдаче, чтобы по возможности использовать их в тексте. Для этого воспользуемся следующим бесплатным сервисом — http://arsenkin.ru/tools/sp/

Вводим в него ключевые фразы, выбираем регион и нажимаем «Найди мне подсветки».

Ключевые фразы

Ждем пару секунд. После переходим на вкладку «Лемматизированные».

Лематизированные слова

Там смотрим, какие подсветки нашло и какие можно взять. Например, «отзывы» и «своими руками» я брать точно не буду, так как отзывов нет и текст рассказывает о продаже домов, а не изготовлении своими руками.

Чуть ниже находятся слова из запросов. Чтобы не спамить, можно давать копирайтеру не список запросов, а слова из них. Превратить запросы в список слов из запросов можно вот таким нехитрым способом.

Лематизированные слова из запросов

Слова, задающие тематику, собираются не по текстам конкурентов, а по поисковой выдаче. То есть это те слова, которые встречаются в сниппетах поисковой выдачи по нашему запросу, например, по запросу «каркасные дома» часто встречается слово «проект».

Сниппеты с подсветками

Это позволяет сделать вывод, что вероятно, это слово является тематическим и его использование может помочь привлечь низкочастотный трафик.

Либо просто все используют это слово и нам оно ничего не даст =).

38

Поиск тематических слов и словосочетаний в текстах конкурентов

Смысл сервиса таков: если у конкурентов в текстах часто встречаются какие-то слова, то и у нас они должны быть (с большой долей вероятности).

Осталось найти успешных конкурентов. Однако, если помните, мы уже нашли их в сервисе SemParser: 10 страниц, которые лучше всего ищутся в поиске по нашим запросам. Давайте их проанализируем!

http://lemmatop.yula-group.ru/ — сам сервис.

Вводим адреса (максимум 200) и нажимаем «Поехали». Я рекомендую для одной группы запросов анализировать не менее 10 страниц. В примере мы исключили одну нетематическую страницу.

Ввод адресов сайтов

В результате справа получаем список фраз и частоту. Частота обозначает количество текстов, в которых встречается указанное слово. Вот несколько интересных экземпляров. Явно нужно написать про проекты, фундамент, отделку, сроки постройки. Есть слова, не очень понятные без контекста, вслепую их брать не стоит. Красным выделены фразы, которые я бы сразу точно добавил к тематическим (хотя, не представляю, как без этих фраз можно написать хороший текст про строительство каркасных домов).

проект — 8
щитовой — 6
фундамент — 6
высокий — 6
отделка — 6
преимущество — 6
время — 5
дополнительный — 5
низкий — 5
тип — 5
массивный — 5
заказывать — 5
срок — 5
дачный — 5
работа – 5

В данном случае я просмотрел фразы, которые встречались минимум в 5 текстах, но есть еще ряд интересных и явно тематичных слов, которые можно «выцепить»: монтаж, утепление, конструкция, прочность, стена.

Обратите внимание, что в сервисе есть еще вкладка «Биграммы». Биграммы – это сочетания из двух слов. Они могут помочь найти какие-то часто использующиеся сочетания слов.

Леммы и биграммы

В данном случае из неочевидного (очевидными буду считать фразы, которые сильно перекликаются с нашими ключевыми фразами) можно отметить фразы: готовый проект, каркасно-панельные, каркасно-щитовые, устойчивость к деформации, низкий дом (вот они к чему слова «низкий» и «высокий»).

Что ж, на этом все! Спасибо, что дочитали эту огромную статью («лонгрид», как нынче модно говорить) до конца. Надеюсь, что вы открыли для себя какие-то новые инструменты и стали лучше понимать схему анализа при составлении технических заданий.

Советую попробовать эти инструменты и сделать свои собственные выводы. Помните, что никакой сервис не может измерить, насколько хорош ваш текст, насколько хорошо он будет продавать, насколько он вовлечет пользователя.

Пусть эта сугубо техническая и сухая статья сурового SEO-специалиста не отбивает желание творить. Я хотел поделиться текущим доступным инструментарием и смею надеяться, что это мне удалось.

Буду рад отклику, вашему мнению, вопросам и отзывам.

В следующей и заключительной части цикла статей я постараюсь дать ряд дополнительных советов копирайтерам «со своей колокольни», которые помогут получить конкурентное преимущество и повысить ценность вашей работы для вебмастеров и SEO-специалистов.

shard-copywriting.ru

Как проверить свои тексты на уникальность максимально эффективно?

Все очень просто. Берете свою статью, текст или любой другой документ, который нужно проверить и прогоняете его по максимальному количеству сервисов.

Все эти сервисы не идеальны. Один может показать 100% уникальность документа, другой 80%, а третий 90%. Хорошая новость состоит в том, что все они подсвечивают те слова, которые следует заменить. Я делаю проверку сразу же в трех.

Топ 9 сервисов для проверки текстов на уникальность

1. Text — бесплатный онлайн сервис. Простой и удобный. Не требует регистрации. Если нужно проверить большое количество документов, то придется регистрироваться. Это бесплатно. Text делает глубокую проверку и выявляет дубли и рерайт статей.

2. Content-watch — антиплагиат онлайн-сервис. Загрузить текст можно размером до десяти тысяч символов. В день доступно всего 7 проверок. Для увеличения лимитов придется купить подписку. Если требуется проверка небольшого количества документов, то бесплатной версии вполне хватит.

3. Pr-cy — с легкостью поможет найти неуникальные тексты. Сервис поможет понять насколько качественно работают ваши копирайтеры.

4. Plagiarisma — этот онлайн антиплагиат сервис позволяет проверять не только статьи, но другие документы, например, рефераты и дипломные работы. Просто загрузите файл в любом формате и посмотрите результат. Также доступна версия для компьютера.

5.Istio — простой и бесплатный анализ статей. Через этот сервис можно найти людей, которые будут писать тексты для сайта.

6. Antiplagiat — название говорит само за себя. Помимо простой проверки текста, доступна версия “Антиплагиат ВУЗ”. В основном сервис предназначен для проверки рефератов и других работ.

7. Etxt — один из самых популярных сервисов в рунете по проверке статей. Чтобы пользоваться онлайн версией, придется зарегистрироваться.

Изначально программа была разработана для компьютеров. В этой версии можно проверить все страницы своего сайта и найти тех, кто их копирует. Программу легко поставить на windows и MAC OX.

8. Advego — вторая по популярности программа для компьютеров. Простой и понятный интерфейс. Полностью бесплатная. Предназначено только под windows.

9. Плагиата.НЕТ — еще одна бесплатная утилита для проверки документов на уникальность. Поддерживает несколько текстовых форматов. Можно проверить весь сайт целиком. Не уникальные слова подсвечивает и показывает первоисточник. Установка не требуется.

Вывод

Все сервисы по функционалу друг на друга похожи. Выберите для себя 2-3 и пользуйтесь ими. В некоторых есть и другие полезные функции, например, проверка количества ключевых слов и другие SEO показатели. А также не забудьте проверить текст на ошибки, ведь такой текст намного приятнее читать.

А какие ваши любимые сервисы?

sergeysmirnovblog.ru

Описание

Полностью бесплатный сервис по проверке текстов на плагиат. Для проверки не требуется регистрация.

Результаты проверки доступны по секретной ссылке, которой Вы можете поделиться.

Эффективные алгоритмы определения рерайта позволяют учитывать изменение формы слов и их перестановку, добавление. Так же определяются и прямые заимствования из других источников.  

Использование метода разбавления текста водой не сработает. Теперь при определении уникальности не учитываются распространенные слова, которые не учитывают поисковые машины.

Результатом проверки является % уникальности и % заимствований, с указанием конкретных сайтов.

Результаты проверки хранятся минимум неделю.

Охраняйте свои тексты от плагиата!

Как написать уникальную статью

Человек, занимающийся рерайтингом и копирайтингом, всегда должен писать статьи, обладающие большой уникальностью. Существует несколько способов, которые помогут добиться высокого показателя данного параметра.
Сразу стоит отметить, что к уникальным текстам можно отнести такие статьи, у которых данный параметр выше 80% при проверке сервисом. Конечно, желательно, добиваться 100%-го результата, но из-за обязательных ключей это может быть невозможным, и в этом случае постараться свести текст к 90%.
Для того, чтобы написать уникальную статью, желательно хорошо разбираться в заданной теме и не пользоваться какими-либо источниками. Таким образом, автор с большой вероятностью получит на выходе качественный текст, не копирующий фразы и предложения с других сайтов. Если же после проверки  процент оказался ниже ожидаемого, то требуется исправить неуникальные фразы, выделенные цветом.
Когда автор делает рерайт готового источника, то для достижения высокой уникальности требуется полностью переделывать исходник, не копируя длинные фразы или предложения. Если же избежать копипаста не получается из-за наличия устойчивых выражений, цитат и прочих неизменяемых элементов, то они должны распределяться по тексту максимально отдаленно друг от друга. И тогда процент уникальности будет высоким.

Рекомендации

Для подсветки совпадений для конкретного URL необходимо нажать на цветной %.

Для проверки большого текста, делите его на несколько по 15 тыс. символов и делайте несколько проверок.

Стоит обращать внимание ни только на общую уникальность, но и на уникальность отдельных источников. Так, например, наличие только зелёных источников говорит о высокой уникальности текста. Наличие красного цвета как в общей уникальности, так и в источниках указывает на низкую уникальность.

progaonline.com

Программы антиплагиаты

Раньше, программный поиск плагиата, был самым популярным способом, многие до сих пор считают его самыми эффективным. Но сейчас, это может быть менее удобно. Большие тексты проверяются значительно дольше в отличии от online-сервисов, имеется ввиду от 10 тыс. знаков. Также, поисковые системы используют «человеческую верификацию» и если у ПС возникают подозрения в том, что поисковые запросы посылаются роботом, он просит ввести капчу.

Таким образом, проверяя текст на уникальность в программе, придется вводить капчу, каждые 1-30 сек. Есть специальные ресурсы, такие как Rucaptcha, которые будут вводить капчи вместо вас, не бесплатно конечно. Если интересно кто и зачем это делает, ответ здесь: заработок на вводе капчи.

Программа Количество капч
Поддержка декапчеров
Уникальность
1 Advego Plagiatus
Много
2 вида
3%/0%
Рек. настройки
(Глубокий поиск)
2 Etxt Антиплагиат
Мало
4 вида
3%/0%
Рек. настройки
(Глубокий поиск)

Замер уникальности, в данном случае, был сделан «на всякий случай». Дело в том, что программы используют шингловый метод поиска. Они берут несколько последовательно стоящих слов из текста и сравнивают их по точному соответствию в поисковой выдаче.

Размер шингла можно менять в настройках, обычно это 2-10 слов, если установить минимальное значение, можно получить довольно низкую уникальность в совершенно уникальной статье. Поэтому следует придерживаться рекомендуемых настроек для каждой программы.

Результат проверки в программах, выражается двумя показателями (Уникальность/Рерайт) Последний очень относительный, не принимайте его за основу. Он сообщает процент лексических совпадений.


Advego Plagiatus программа1) Advego Plagiatus — одна из первых программ в своем роде, небольшое количество настроек, легко использовать. Многие заказчики статей, на различных биржах копирайтинга, используют ее как основу для определения допустимого порога уникальности. Программа заслужила это за годы качественной и бесперебойной работы. Она является собственностью биржи Advego.ru и предоставляется совершенно бесплатно.

Настройка advego plagiatusa
Рекомендуемые настройки

Проверка уникальности → настройка:

  • Пункт на который стоит обратить внимание: «Прерывать при совпадении более, %» — можно установить 50% — программа прекратит поиск плагиата при нахождении 50% совпадений.
  • Если появляется много капчей, можно попробовать отключить Nigma. Больше всего посылает капчей Яндекс, но отключив его, нельзя быть уверенным, что результат будет верным.

Дополнительный функционал:

  • Декапчеры: 2 вида.

Etxt Антиплагиат программа2) Etxt Антиплагиат — единственный конкурент advego, имеет множество положительных отзывов и более широкий функционал. В наших тестах, вводить капчу приходилось гораздо реже, чем у Advego Plagiatus. Результаты проверок были схожими, поэтому говорить о том, что используются более мягкие алгоритмы, мы не можем. Владельцем программы является биржа Etxt.ru, тоже полностью бесплатна.

Предварительная настройки не обязательны, для более точной проверки выбирайте пункт «Глубокая проверка». Стандартно, в опциях установлен размер шингла — 3, его изменение не приводит к значительному изменению результата, что очень странно. Можете поэкспериментировать: Операции → Настройки.

Дополнительный функционал:

  • Декапчеры: 4 вида.
  • Проверка по ссылке + массовая проверка.
  • Проверка документов + сортировка по папкам в зависимости от уникальности.
  • Проверка по картинкам (низкая эффективность), если нужно поверить несколько, лучше использовать поиск по картинке.

ГЛАВНОЕ ПРЕИМУЩЕСТВО ПРОГРАММ — ВОЗМОЖНОСТЬ ПРОВЕРКИ ТЕКСТОВ ОТ 15000 СИМВОЛОВ (БЕСПЛАТНО).

В таблицу планировалось добавить программу Плагиата.НЕТ, но проведя несколько первых тестов, ее работоспособность (невидимые капчи от google, долгая проверка) оставляет желать лучшего. Все это следствие того, что она не обновлялась с 2014 года, поэтому рекомендовать мы ее не стали.

blogforest.ru

Как проверить текст на уникальность с помощью онлайн сервисов?

Самый удобный способ проверить страницу на плагиат — это использовать бесплатные или платные программы и онлайн ресурсы.

Advego

Advego Plagiatus — популярная бесплатная программа для проверки контента. Может найти частичные или полные копии текстового документа. Удобна для проверки на плагиат больших текстов (до 100 000 символов). Имеет функции быстрой и глубокой проверки.

При глубокой проверке дает более точные результаты уникальности.

  • Порядок работы:
  • Скачиваем программу.
  • Устанавливаем и запускаем.
  • В пустое поле вставляем нужный текст.
  • Нажимаем «Проверка уникальности» и выбираем тип проверки. Глубокая или быстрая.

проверка текста на уникальность advego plagiatus

Результат будет дан в виде дроби. (47% / 2%)

показатель поиск по фразам advego plagiatus

Всегда следует уделять внимание первому показателю «Поиск по фразам» — По нему определяется уникальность текста.

«Поиск по словам» может выдавать невысокий результат: это будет означать, что данный текст, скорее всего, написана рерайтом. В этом ничего страшного нет. Но показатель «поиска по фразам» всегда должен быть максимально высоким (90% и выше).

Etxt

Etxt.ru — эта бесплатная программа позволять не только выполнять анализ уникальности текста, но и делать SEO проверку и анализировать на плагиат изображения.

Вставляем контент в поле «Текст» и нажимаем «Проверить уникальность».

показатель поиск по фразам antiplagiarism net

Text.ru

Text.ru — Популярный антиплагиат онлайн-ресурс для проверки статей. Вы просто заходите на сайт, вставляете контент в пустое поле и нажимаете «Запустить проверку».

показатель поиск по фразам text.ru

Регистрация на ресурсе не обязательна, но она может дать небольшие преимущества: увеличится допустимое количество проверок в день, также в очереди на проверку ваши тексты будут стоять выше.

Помимо процента уникальности, сервис дает отчет по орфографии и делает SEO-анализ текста.

Content Yoda

Content Yoda — один из самых мощных инструментов для полного анализа текста.

После регистрации становится доступен пробный тариф, который позволяет проверять уникальность текста, переспам, наличие нужных ключевых слов, водянистость. После истечения срока действия пробного тарифа сервис предложит оформить платный пакет.

показатель поиск по фразам content yoda

Рекомендуем Content Yoda как лучший инструмент по комплексному анализу текстов.

Важно!

Уникальность далеко не главный показатель качества контента.

Существуют такие параметры, как водность, читабельность, структурирование. Поэтому выбирайте копирайтера не по умению писать уникальный контент, а по умению его качественно и всеобъемлюще излагать. Стоимость такого контента обычно выше среднего.

Как проверить на уникальность англоязычный текст?

Способы проверки англоязычного контента на уникальность мало чем отличаются от способов проверки русскоязычного. Помимо вышеуказанных сервисов вы также можете пользоваться:

Copyscape

Базовую проверку страниц Copyscape может делать бесплатно. Для этого в пустое поле вставьте адрес страницы, которую нужно проверить на плагиат, нажмите «Go» и сервис покажет на каких еще ресурсах встречается контент с указанной страницы.

показатель поиск по фразам copyscape

Проверка непосредственно текста на плагиат составляет $0,05 (за каждую проверку). После регистрации на сайте вы вносите нужную сумму на баланс и можете пользоваться сервисом.

Duplichecker

Онлайн сервис Duplichecker позволяет проверять текст непосредственно на сайте (добавляя его в пустое поле), либо загружать файлы с текстовым контентом.

После того, как вставили текст в пустое поле, нажимаем Check Plagiarism и внизу под этой кнопкой появится список страниц с похожим или таким же контентом.

Незарегистрированные пользователи могут выполнять 3 проверки уникальности статьи в день. Для зарегистрированных пользователей ограничений нет.

показатель поиск по фразам dupli checker

Также уникальность англоязычного текста можно проверить уже описанными выше сервисами Advego Plagiatus и Content Yoda.

Как увеличить уникальность текста

Стандартный способ — это переписать неуникальные части текста. В первую очередь старайтесь переписывать те части в которых подряд идет более чем 3–4 неуникальных слова (все неуникальные места текста будут подсвечены после проверки, как на скриншотах выше).

После того, как эти места текста будут поправлены, при повторной проверке программа(или сервис) выдаст вам более высокие результаты по уникальности.

В случае же если уникальность текста низкая, мы рекомендуем переписать весь текст, а не стараться дотянуть значения до нужных параметров.

livepage.pro

Зачем нужен SEO-анализ текста

Поисковые системы оценивают качество и релевантность статьи по содержащимся в ней словам и словосочетаниям (коллокациям). Чем больше в тексте тематичных ключевых фраз, тем больше шансов, что он получит высокую оценку.

Соответственно, если в тексте будет мало ключевых слов, но много «воды» — стоп-слов, вставных слов, шаблонных фраз, качество статьи будет низким.

Но и слишком большое количество ключевиков — тоже плохо, такой документ получит отметку «переспам» и вряд ли будет показан в поисковой выдаче.

Оценить эти показатели поможет сервис семантического анализа, который покажет процент ключевых слов и количество стоп-слов в тексте.

SEO-анализ текста Адвего определяет:

  • плотность ключевых слов, процент ключевых фраз;
  • частотность слов;
  • количество стоп-слов;
  • объем текста: количество символов с пробелами и без пробелов;
  • количество слов: уникальных, значимых, всего;
  • водность, процент воды;
  • тошноту текста, классическую и академическую;
  • количество грамматических ошибок.

Наш онлайн сервис показывает семантическое ядро текста страницы — все значимые и ключевые слова, что позволит оценить, по каким запросам она будет показываться выше после того, как проведет поиск ключевых слов в тексте.

Также семантический анализ показывает все стоп-слова и грамматические ошибки.

Пример отчета проверки семантическего SEO анализа текста онлайн

Семантический SEO анализ текста онлайн

Как рассчитывается тошнота текста

Классическая тошнота определяется по самому частотному слову — как квадратный корень из количества его вхождений. Например, слово «текст» встречается на этой странице 16 раз, классическая тошнота будет равна 4.

Важно! Максимально допустимое значение классической тошноты зависит от объема текста — для 20 000 знаков тошнота, равная 5, будет нормальной, а для 1000 знаков — слишком высокой.

Академическая тошнота определяется как отношение самых частотных и значимых слов по специальной формуле. Нормальное значение — в пределах 5-15%.

По тошноте текста можно судить о натуральности текста и его SEO-оптимизации под поисковые запросы. Высокий показатель тошноты онлайн для поисковиков является плохим знаком.

Как рассчитывается водность текста

Процент воды в Адвего определяется как отношение незначимых слов к общему количеству слов. То есть чем больше в статье значимых слов, тем меньше в итоге «воды».

Конечно, невозможно написать текст совсем без воды, нормальный показатель — 55%-75%.

Чтобы уменьшить процент водности, необходимо почистить текст от широко распространенных фраз и терминов, вставных слов: «в современном мире», «так сказать», «всем известно» и т. п. Также повышает качество текста употребление специализированных терминов и профессиональной лексики.

advego.com

Информация

Антиплагиат онлайн на Text.ru позволяет проверить текст совершенно бесплатно.

Эффективные алгоритмы антиплагиата онлайн делают проверку глубокой и качественной.

Процедура проверки на плагиат проста: всего несколько кликов — и вы узнаете процент уникальности текста. Если в сети есть дубликаты текстов, они обязательно найдутся. Вы также можете проверить текст на ошибки с помощью сервиса проверки орфографии.

При регистрации на сервисе у вас будут автоматически сняты ограничения проверки, предназначенные для гостей, и вы получите возможность проверять гораздо большее количество текстов с помощью нашего сервиса плагиат онлайн.

Новый алгоритм проверки на плагиат

На сервисе Text.ru работает алгоритм проверки текстов на уникальность, выполняющий анализ текстов по усовершенствованной методике. Чтобы ваша работа с сервисом проверки была прозрачной и комфортной, мы дадим некоторые рекомендации по взаимодействию с актуальным алгоритмом.

Какие тексты «не любит» алгоритм

Данный алгоритм проверки текста на плагиат онлайн принципиально отличается от проверки методом шинглов. Какие последствия это имеет для работы с текстами?

  • Осталась в прошлом техника некачественного рерайта с изменением каждого пятого или четвертого слова. В текстах, написанных подобным образом, будет обнаружен высокий процент совпадений с исходником.
  • Также мы рады сообщить, что наш алгоритм обнаруживает плагиат и после перестановки слов, фраз и предложений местами.
  • При работе с антиплагиатом уникальность не повысится от изменения падежей, времен и других грамматических категорий слова.
  • «Доливая» в исходное предложение новые слова, рерайтер так же не избавится от плагиата.

Таким образом, наш бесплатный антиплагиат онлайн подсвечивает совпадения наиболее точно и полно.

Какие тексты «любит» алгоритм

Чтобы достичь 100% уникальности при рерайтинге, необходимо выполнить качественную переработку текста.

  • Обращайте особое внимание на густоподсвеченные области — избавившись от них, вы повысите уникальность текста.
  • Рекомендуется выполнять более глубокий рерайтинг: замену слов синонимами, переформулирование фраз и т.д.

Сделаем алгоритм ещё внимательнее!

Если в результатах проверки вы обнаружили постороннюю, на ваш взгляд, ссылку, где совпадения случайные, или, напротив, в результатах не отобразилась ссылка на страницу, где есть совпадения с проверяемым текстом, то пишите на [email protected] (обязательно укажите ссылку на результат проверки).

text.ru


You May Also Like

About the Author: admind

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *

Этот сайт использует Akismet для борьбы со спамом. Узнайте, как обрабатываются ваши данные комментариев.