Как пользоваться поисковыми системами

Илья Сегалович – человек, который придумал Яндекс. Точнее он придумал название: Yet Another Index (с англ. еще один указатель), а Аркадий Волож, желая подчеркнуть русскость новой программы, предложил поставить в начале букву «Я». Так на свет появился «Яndex».

Логотип Яндекс

Но что же такое Яндекс?

Яндекс — это система поиска в сети Интернет, переросшая в целый портал с кучей полезных сервисов. Рассказывать о сервисах можно много и долго, поэтому остановимся на Яндексе, как системе поиска.

Интересный факт: с момента своего основания Яндекс сотрудничает со студией Артемия Лебедева. В тоже время, логотип и желтая форма поиска появились только в третьей версии (1999 год) дизайна, а привычный уголок в седьмой (2002 год).

Как работает система поиска Яндекс?

Как и любой из сайтов, сайт Яндекса доступен через сеть Интернет. Его поисковый робот (специальная программа) копирует информацию с сайтов в свою базу данных. Когда пользователь делает запрос, система производит поиск на наличие указанных ключевых слов в имеющихся данных и выводит список ссылок на соответствующие страницы. При этом учитывается ряд факторов, определяющих позицию той или иной ссылки в выдаче.

Основная задача системе – предоставить пользователю информацию наиболее соответствующую указанному запросу. В тоже время, следует помнить, что программа работает строго по заданному алгоритму, а для получения оптимального результата, от пользователя потребуется некоторых минимальных навыков.

Как пользоваться поисковой системой Яндекс?

Яндекс не требует от вас знания специальных команд для поиска. Достаточно набрать в форме поиска вопрос. Например: где раки зимуют?, звезда северного полушария и т.д. Ну и кликнуть кнопку «Найти».

Морфология. Независимо от того, в какой форме вы употребили то или иное слово в запросе, поиск учитывает все его формы. Это называет учет морфологии слов. Для поиска точной формы слова возьмите его в кавычки или поставьте перед ним восклицательный знак.

Ищем цитату. Если вы хотите найти точную цитату (или фразу), просто задайте искомую фразу в кавычках. Например: "никто не обнимет необъятного".

Ищем имена. Слова с большой и маленькой буквы – две разные формы одного слова, поэтому все равно, какой регистр вы используете в запросе. Исключением может служить использование оператора точной формы. Так по запросу !козьма вы найдете все страницы, где присутствует эта словоформа в любом регистре, а по запросу !Козьма — только страницы, на которых имеется форма «Козьма» с большой буквы. Следует отметить, что этот оператор будет полезен в том случае, когда искомое имя собственное совпадает с именем нарицательным. Например: село !Кошки.

Обязательно найти слово. В любом языке есть слова, которые встречаются намного чаще других. Слава которые встречаются слишком часто, чтобы быть значимыми для поиска, называются стоп-словами. Как правило, это местоимения, предлоги и частицы. Поисковые машины обычно игнорируют стоп-слова, даже если они встречаются в тексте запроса. Исключением может служить использование оператора «плюс» в начале слова (без пробела). Например: никто +не обнимет необъятного.

Исключить слово из поиска. Чтобы исключить страницы, на которых встречается определенное слово, поставьте перед ним два символа тильды или один минус (без пробела). Например, если вы ищите описание Парижа, а не многочисленные предложения турагенств, можно задать следующий запрос: путеводитель по Парижу ~~ агентство ~~ тур — или: агентство тур. Следует отметить, что исключенные слова должны стоять в конце запроса.

wmas.msk.ru

1. Сканирование и индексация страниц

Пред­ставьте, что Интер­нет – это сеть стан­ций метро круп­ного мега­по­лиса.

Каж­дая стан­ция – это отдель­ный доку­мент (чаще всего веб-стра­ница, но ино­гда файл PDF, JPG или дру­гого фор­мата). В каче­стве путе­во­ди­теля поис­ко­вые системы исполь­зуют ссылки, кото­рые помо­гают им объ­е­хать весь город и посе­тить каж­дую стан­цию.

Ссы­лоч­ная струк­тура Интер­нета необ­хо­дима для объ­еди­не­ния всех стра­ниц в еди­ное целое.

Ссылки помо­гают поис­ко­вым робо­там, кото­рых также назы­вают пау­ками или крау­ле­рами, нахо­дить мил­ли­оны вза­и­мо­свя­зан­ных доку­мен­тов. Когда поис­ко­вые роботы обна­ру­жи­вают оче­ред­ную стра­ницу, они рас­шиф­ро­вы­вают ее код и сохра­няют на жест­ких дис­ках. Впо­след­ствии, когда в этом воз­ни­кает потреб­ность, они воз­вра­ща­ются за этими дан­ными, чтобы дать ответ на запрос поль­зо­ва­теля.

Дата центр

Чтобы хра­нить мил­ли­арды стра­ниц и полу­чать к ним момен­таль­ный доступ, поис­ко­вые системы исполь­зуют дата-цен­тры по всему миру. В этих гигант­ских хра­ни­ли­щах нахо­дятся тысячи машин, кото­рые обра­ба­ты­вают огром­ное коли­че­ство инфор­ма­ции. Ведь поль­зо­ва­тели, кото­рые ищут какую-либо инфор­ма­цию, не любят ждать. Порой даже задержка на 1 или 2 секунды вызы­вает у них недо­воль­ство. Именно поэтому поис­ко­вые системы не пере­стают совер­шен­ство­ваться и стре­мятся выда­вать резуль­таты как можно быст­рее.

2. Предоставление ответов

Поис­ко­вые системы – это сво­его рода машины отве­тов. Когда чело­век вво­дит какой-либо запрос, поис­ко­вым систе­мам необ­хо­димо «пере­ло­па­тить» мил­ли­арды доку­мен­тов и сде­лать две вещи: дать поль­зо­ва­телю под­хо­дя­щие ответы и рас­по­ло­жить их в порядке умень­ше­ния реле­вант­но­сти. Задача SEO – повли­ять на реле­вант­ность и зна­чи­мость этих стра­ниц.

Под реле­вант­но­стью поис­ко­вые системы под­ра­зу­ме­вают не только нали­чие на стра­нице клю­че­вых фраз, соот­вет­ству­ю­щих запросу поль­зо­ва­теля. Этот под­ход прак­ти­ко­вался еще на рас­свете Интер­нета, когда резуль­таты поис­ко­вой выдачи остав­ляли желать луч­шего. По мере раз­ви­тия поис­ко­вые системы раз­ра­бо­тали мно­же­ство более эффек­тив­ных спо­со­бов предо­став­ле­ния цен­ных резуль­та­тов, кото­рые соот­вет­ствуют ожи­да­ниям поль­зо­ва­те­лей и пол­но­стью удо­вле­тво­ряют их запросы. На реле­вант­ность вли­яют сотни фак­то­ров, мно­гие из кото­рых детально рас­смот­рены в этом руко­вод­стве.

Как поисковые системы оценивают значимость страниц?

В насто­я­щее время поис­ко­вые системы под­ра­зу­ме­вают под зна­чи­мо­стью попу­ляр­ность стра­ниц. Чем больше поль­зо­ва­те­лей посе­щает сайт, стра­ницу или доку­мент, тем зна­чи­мей он в гла­зах поис­ко­вых систем. Такой под­ход пол­но­стью оправ­дал себя на прак­тике, поэтому поис­ко­вые системы про­дол­жают исполь­зо­вать мет­рики для изме­ре­ния попу­ляр­но­сти сай­тов.

Как пользоваться поисковыми системами

Попу­ляр­ность и реле­вант­ность опре­де­ля­ется не вруч­ную, а при помощи спе­ци­аль­ных алго­рит­мов, кото­рые отсе­и­вают непод­хо­дя­щие резуль­таты, а затем рас­по­ла­гают остав­ши­еся ответы в порядке их зна­чи­мо­сти. Эти алго­ритмы вклю­чают в себя сотни ком­по­нен­тов, кото­рые назы­ва­ются фак­то­рами ран­жи­ро­ва­ния.

Как преуспеть в SEO?

На пер­вый взгляд может пока­заться, что слож­ные поис­ко­вые алго­ритмы про­сто невоз­можно постичь. Но на самом деле даже сами поис­ко­вые системы дают советы по поис­ко­вой опти­ми­за­ции. Вот что реко­мен­дует Google для повы­ше­ния пози­ций сайта.

Рекомендации Google для веб-мастеров:

  • Созда­вайте сайты для поль­зо­ва­те­лей, а не для поис­ко­вых систем. Не обма­ны­вайте посе­ти­те­лей и не исполь­зуйте раз­ные формы выдачи инфор­ма­ции для поль­зо­ва­те­лей и для поис­ко­ви­ков (этот чер­ный метод опти­ми­за­ции назы­ва­ется кло­акинг).
  • Созда­вайте стра­ницы с тек­сто­выми ссыл­ками и с чет­кой иерар­хи­че­ской струк­ту­рой. На каж­дую стра­ницу должна вести как мини­мум одна ста­ти­че­ская тек­сто­вая ссылка.
  • Созда­вайте полез­ные и инфор­ма­тив­ные сайты. Про­пи­шите эле­менты <title> и зна­че­ния атри­бута ALT.
  • Созда­вайте чита­бель­ные URL. Исполь­зуйте 301 реди­рект или тег rel=“canonical” для дуб­ли­ро­ван­ного кон­тента.

С реко­мен­да­ци­ями по опти­ми­за­ции сайта от Яндекса вы можете озна­ко­миться по этой ссылке.

Вы должны пони­мать, что реко­мен­да­ции поис­ко­вых систем – лишь вер­хушка айс­берга и что суще­ствует мно­же­ство дру­гих фак­то­ров ран­жи­ро­ва­ния и мето­дов поис­ко­вой опти­ми­за­ции сай­тов.

Не нужно бояться SEO!

За более чем 15 лет суще­ство­ва­ния Интер­нет-поиска Интер­нет-мар­ке­то­логи нашли спо­собы полу­чать инфор­ма­цию о том, как поис­ко­вые системы оце­ни­вают реле­вант­ность сай­тов. SEO-опти­ми­за­торы успешно при­ме­няют эти зна­ния на прак­тике.

blog.contentmonster.ru

работа на компьютереДля начала, давайте рассмотрим правила работы с поисковыми системами. Распространённые поисковые системы, такие как: Google, Yandex, Rambler, Nigma, Aport, MSN и т.д., думаю, представлять не стоит.

У всех нас часто возникает потребность найти что-либо на огромном пространстве Всемирной паутины. Мы открываем страничку поисковой системы и вводим в строку поиска интересующее нас слово или словосочетание, которое называется поисковый запрос (или просто запрос).

В ответ на наш запрос, поисковая машина выдаёт список страниц сайтов, содержащих информацию, соответствующую нашему запросу. Сайты, выданные поисковиком на наш запрос, называются поисковой выдачей или просто выдачей.

Как пользоваться поисковыми системамиНасколько информация сайтов из выдачи по нашему запросу будет соответствовать тому, что мы ищем, зависит от правильного составления поискового запроса, т.е. от того, какие слова/слово мы ввели в строку поиска. Другими словами, насколько выдача будет релевантна нашему запросу. Релевантность — соответствие документов, появившихся в результате поиска, самому запросу.

Умея грамотно формулировать поисковый запрос, мы многократно увеличим вероятность быстрейшего нахождения нами нужной информации.

Давайте рассмотрим несколько правил составления запроса:

  • Слова в запросе надо писать грамотно. Ошибка в одной букве может существенно затянуть процесс поиска.
  • Для достижения необходимого результата уточняйте запрос, используя ключевые слова. Чем точнее будет составлен запрос — тем выше вероятность найти ответ в первых строчках выдачи. Если вы ищите сведения по автомобилю Toyota, то ваш вопрос должен быть «автомобиль toyota», а не «автомобиль». Если вас интересует творчество Льва Толстого, то введите в строку поиска, кроме имени писателя, ещё и слово «творчество» через пробел.
  • Пользуйтесь синонимами. Если запрос «реферат» не принёс желаемого результата, попробуйте заменить его на «курсовая работа».
  • Поиск является регистрозависимым. Все запросы желательно вводить в нижнем регистре, т.е. не заглавными буквами. Исключения из этого — названия, пишущиеся с большой буквы.

Для более конкретных запросов в Гугл используйте специальный язык:

  • Знаки «+» «-» используются для включения/исключения определённых слов из поиска. Если вам требуется найти страницы в интернете с анекдотами про вождей, но вы не хотели бы упоминаний о Ленине, то вам нужно оформить такой запрос:
    поисковый запрос
    Это команда поисковой машине искать страницы, на которых в последовательном порядке будут слова: «анекдоты», «вожди», но слова Ленин там не будет. Заметьте, что между знаками и словами пробелов нет, но между словами они должны быть. Этот же метод можно применять к поиску различных документов и т.д.
  • Гугл не учитывает включённые в запрос слова без смысловой нагрузки, предлоги, стоп-слова. Если хотите, чтобы учитывал — поставьте «+» спереди. Например: «погода +на декабрь» — предлог «на» будет учитываться.
  • Знак альтернативы «|» говорит о том, что надо найти хотя бы одно слово из перечисленных. Если вам требуется найти страницы, на которых содержится хотя бы одно из слов: «ромашки», «васильки», «лютики», «ландыши», то ваш запрос должен выглядеть так:
    запрос в гугл
    Можно заменить знак «|» на «OR» (OR — только в верхнем регистре).
  • При введении в строку поска слова, поисковая машина ищет и выдаёт результаты не только с точным совпадением, но и с его различными словоформами. Если вы ищите «гипсокартон», то, чем дальше от начала списка, тем чаще будет встречаться не «гипсокартон», а словоформы, вида: «гипсокартонный», «гипсокартоном», «гипсокартона» и т.д.
    Если же вас интересует только конкретное слово — поставьте перед ним знак точного соответствия «!»:
    запрос в гугл
    Для поиска точной фразы можно использовать и оператор «кавычки». Вам будут показаны только точные вхождения этой фразы. Просто заключите в кавычки текст запроса.
  • Если вам нужен поиск только по определённому сайту, задайте это через «site:адрес сайта» после основного слова запроса и вы получите результаты поиска только по указанному сайту. Пример:
    запрос в гугл

Много дополнительных параметров поиска по Google можно задать, нажав на надпись «Расширенный поиск» справа от строки поиска. Подсказки самой системы Google по расширенному поиску можно увидеть здесь.

www.liveinternet.ru

Как использовать поисковую систему Яндекс

В наше время поисковые системы становятся одним из самых важных источников информации. Самые популярные из них по ежедневной аудитории и доходам почти догнали крупнейшие телеканалы. Если всё так и пойдёт дальше, то очень скоро основные поисковики станут главным оружием в информационных войнах.

В этот список пoпaли наиболее известные в Интернете (точнее, в его русскоязычной части — Рунете) поисковые системы. Список поможет быстро ознакомиться со всеми популярными системами поиска и сравнить результаты их работы. Также полезной будет возможность всегда иметь под рукой несколько сервисов для поиска нужного в Интернете.

Ничего тайного или секретного на этой странице нет. Это действительно просто список крупнейших поисковых систем. И всё.

Google

Поисковая система Google — самая популярная в мире. Наглая, как и все американцы (слова дебильного и наглого автора), но предоставляющая много возможностей. В общем, бесспорный мировой лидер среди поисковых роботов.

Помимо поиска у Google имеется множество других сервисов различной направленности.

Яндекс

Отечественная поисковая система яндекс — самая популярная «искалка» Рунета. Помимо сервиса поиска имеет кучу других, полезных для русского человека сервисов (чем «русский человек» отличается от других людей в Интернете? Или все-таки отличается…).

Bing

Поисковая система Bing от Microsoft заменила все предыдущие поисковики от этой всемирно известной компании. И, надо сказать, не случайно. Bing на порядок лучше старых поисковых систем от Microsoft.

Спутник

Российская поисковая система Спутник создана по заказу руководства России. Спутник— первый в мире государственный поисковик. Это является как его плюсом, так и минусом.

Видео: Как использовать поисковую систему Яндекс

bravedefender.ru

1.
2.
3.
4.
5.
6.

1. Введение

уже давно стали неотъемлемой частью российского Интернета. Поисковые системы сейчас – это огромные и сложные механизмы, представляющие собой не только инструмент поиска информации, но и заманчивые сферы для бизнеса.

Большинство пользователей поисковых систем никогда не задумывались (либо задумывались, но не нашли ответа) о принципе работы поисковых систем, о схеме обрабатки запросов пользователей, о том, из чего эти системы состоят и как функционируют…

Данный мастер-класс призван дать ответ на вопрос о том, как работают поисковые системы. Однако, Вы не найдете здесь факторов, влияющих на ранжирование документов. И тем более не стоит рассчитывать на подробное объяснение алгоритма работы Яндекса. Его, по словам Ильи Сегаловича, — директора по технологиям и разработке поисковой машины «Яндекс», можно узнать, лишь «под пыткой» самого Ильи Сегаловича…

2. Понятие и функции поисковой системы

Поисковая система — это программно-аппаратный комплекс, предназначенный для осуществления поиска в сети Интернет и реагирующий на запрос пользователя, задаваемый в виде текстовой фразы (поискового запроса), выдачей списка ссылок на источники информации, в порядке релевантности (в соответствии запросу). Наиболее крупные международные поисковые системы: , , . В русском Интернете это – , , .

Рассмотрим подробнее понятие поискового запроса на примере поисковой системы «Яндекс». Поисковый запрос должен быть сформулирован пользователем в соответствии с тем, что он хочет найти, максимально кратко и просто. Допустим, мы хотим найти информацию в «Яндексе» о том, как выбрать автомобиль. Для этого, открываем главную страницу «Яндекса», и вводим текст поискового запроса «как выбрать автомобиль». Далее, наша задача сводится к тому, чтобы открыть предоставленные по нашему запросу ссылки на источники информации в Интернет. Однако, вполне можно и не найти нужную нам информацию. Если таковое произошло, то либо нужно перефразировать свой запрос, либо в базе поисковой системе действительно нет никакой актуальной информации по нашему запросу (такое может быть при задании очень «узких» запросов, как, например «как выбрать автомобиль в Архангельске»)

Первоочередная задача любой поисковой системы – доставлять людям именно ту информацию, которую они ищут. А научить пользователей делать «правильные» запросы к системе, т.е. запросы, соответствующие принципам работы поисковых систем, невозможно. Поэтому разработчики создают такие алгоритмы и принципы работы поисковых систем, которые бы позволяли находить пользователям искомую ими информацию.

Это означает, поисковая система должна «думать» так же, как думает пользователь при поиске информации. Когда пользователь обращается с запросом к поисковой машине, он хочет найти то, что ему нужно, максимально быстро и просто. Получая результат, он оценивает работу системы, руководствуясь несколькими основными параметрами. Нашел ли он то, что искал? Если не нашел, то сколько раз ему пришлось перефразировать запрос, чтобы найти искомое? Насколько актуальную информацию он смог найти? Насколько быстро обрабатывала запрос поисковая машина? Насколько удобно были представлены результаты поиска? Был ли искомый результат первым или же сотым? Как много ненужного мусора было найдено наравне с полезной информацией? Найдется ли нужная информация, при обращении к поисковой системе, скажем, через неделю, или через месяц?

Для того, чтобы удовлетворить ответами все эти вопросы, разработчики поисковых машин постоянно совершенствуют алгоритмы и принципы поиска, добавляют новые функции и возможности, всячески пытаются ускорить работу системы.

3. Основные характеристики поисковой системы

Опишем основные характеристики поисковых систем:

  • Полнота

    Полнота — одна из основных характеристик поисковой системы, представляющая собой отношение количества найденных по запросу документов к общему числу документов в сети Интернет, удовлетворяющих данному запросу. К примеру, если в Интернете имеется 100 страниц, содержащих словосочетание «как выбрать автомобиль», а по соответствующему запросу было найдено всего 60 из них, то полнота поиска будет 0,6. Очевидно, что чем полнее поиск, тем меньше вероятность того, что пользователь не найдет нужный ему документ, при условии, что он вообще существует в Интернете.

  • Точность

    Точность — еще одна основная характеристика поисковой машины, которая определяется степенью соответствия найденных документов запросу пользователя. Например, если по запросу «как выбрать автомобиль» находится 100 документов, в 50 из них содержится словосочетание «как выбрать автомобиль», а в остальных просто наличествуют эти слова («как правильно выбрать магнитолу и установить в автомобиль»), то точность поиска считается равной 50/100 (=0,5). Чем точнее поиск, тем быстрее пользователь найдет нужные ему документы, тем меньше различного рода «мусора» среди них будет встречаться, тем реже найденные документы не будут соответствовать запросу.

  • Актуальность

    Актуальность — не менее важная составляющая поиска, которая характеризуется временем, проходящим с момента публикации документов в сети Интернет, до занесения их в индексную базу поисковой системы. Например, на следующий день после появления интересной новости, большое количество пользователей обратились к поисковым системам с соответствующими запросами. Объективно с момента публикации новостной информации на эту тему прошло меньше суток, однако основные документы уже были проиндексированы и доступны для поиска, благодаря существованию у крупных поисковых систем так называемой «быстрой базы», которая обновляется несколько раз в день.

  • Скорость поиска

    Скорость поиска тесно связана с его устойчивостью к нагрузкам. Например, по данным ООО «Рамблер Интернет Холдинг», на сегодняшний день в рабочие часы к поисковой машине Рамблер приходит около 60 запросов в секунду. Такая загруженность требует сокращения времени обработки отдельного запроса. Здесь интересы пользователя и поисковой системы совпадают: посетитель желает получить результаты как можно быстрее, а поисковая машина должна отрабатывать запрос максимально оперативно, чтобы не тормозить вычисление следующих запросов.

  • Наглядность

    Наглядность представления результатов является важным компонентом удобного поиска. По большинству запросов поисковая машина находит сотни, а то и тысячи документов. Вследствие нечеткости составления запросов или неточности поиска, даже первые страницы выдачи не всегда содержат только нужную информацию. Это означает, что пользователю зачастую приходится производить свой собственный поиск внутри найденного списка. Различные элементы страницы выдачи поисковой системы помогают ориентироваться в результатах поиска. Подробные пояснения по странице результатов поиска, например у «Яндекса» можно посмотреть по ссылке .

4. Краткая история развития поисковых систем

В начальный период развития Интернет, число его пользователей было невелико, а объем доступной информации сравнительно небольшим. В большинстве своем, доступ к сети Интернет имели лишь сотрудники научно-исследовательской сферы. В это время задача поиска информации в Интернете не была столь актуальной, как в настоящее время.

Одним из первых способов организации доступа к информационным ресурсам сети стало создание открытых каталогов сайтов, ссылки на ресурсы в которых группировались согласно тематике. Первым таким проектом стал сайт Yahoo.com, открывшийся весной 1994 года. После того, как количество сайтов в каталоге значительно увеличилось, была добавлена возможность поиска нужной информации по каталогу. В полном смысле это еще не было поисковой системой, так как поисковая область была ограничена только ресурсами, присутствующими в каталоге, а не всеми Интернет ресурсами.

Каталоги ссылок широко использовались ранее, однако практически полностью утратили свою популярность в настоящее время. Так как даже современные, огромные по своему объему каталоги, содержат информацию лишь о ничтожно малой части сети Интернет. Самый большой каталог сети DMOZ (его еще называют Open Directory Project) содержит информацию о 5 миллионах ресурсов, тогда как база поисковой системы Google состоит из более чем 8 миллиардов документов.

Первой полноценной поисковой системой стал проект WebCrawler, вышедший в свет в 1994 году.

В 1995 году появились поисковые системы Lycos и AltaVista. Последняя долгие годы была лидером в области поиска информации в сети Интернет.

В 1997 году Сергей Брин и Ларри Пейдж создали поисковую машину Google в рамках исследовательского проекта в Стэндфордском университете. В настоящий момент Google — самая популярная поисковая система в мире!

В сентябре 1997 года была официально анонсирована поисковая система Yandex, являющаяся самой популярной в русскоязычном Интернете.

В настоящее время существуют три основные поисковые системы (международные) – Google, Yahoo и , имеющие собственные базы и алгоритмы поиска. Большинство остальных поисковых систем (коих насчитывается большое количество) использует в том или ином виде результаты трех перечисленных. Например, поиск AOL (search.aol.com) использует базу Google, а AltaVista, Lycos и AllTheWeb – базу Yahoo. 

5. Состав и принципы работы поисковой системы

В России основной поисковой системой является «Яндекс», далее — Rambler.ru, Google.ru, Aport.ru, Mail.ru. Причем, на данный момент, Mail.ru использует механизм и базу поиска «Яндекса».

Практически все крупные поисковые системы имеют свою собственную структуру, отличную от других. Однако можно выделить общие для всех поисковых машин основные компоненты. Различия в структуре могут быть лишь в виде реализации механизмов взаимодействия этих компонентов.

Модуль индексирования

Модуль индексирования состоит из трех вспомогательных программ (роботов):

Spider (паук) – программа, предназначенная для скачивания веб-страниц. «Паук» обеспечивает скачивание страницы и извлекает все внутренние ссылки с этой страницы. Скачивается html-код каждой страницы. Для скачивания страниц роботы используют протоколы HTTP. Работает «паук» следующим образом. Робот на сервер передает запрос “get/path/document” и некоторые другие команды HTTP-запроса. В ответ робот получает текстовый поток, содержащий служебную информацию и непосредственно сам документ.

Ссылки извлекаются из тэгов a, area, base, frame, frameset, и др. Наряду со ссылками, многими роботами обрабатываются редиректы (перенаправления). Каждая скачанная страница сохраняется в следующем формате:

  • URL страницы
  • дата, когда страница была скачана
  • http-заголовок ответа сервера
  • тело страницы (html-код)

Crawler («путешествующий» паук) – программа, которая автоматически проходит по всем ссылкам, найденным на странице. Выделяет все ссылки, присутствующие на странице. Его задача — определить, куда дальше должен идти паук, основываясь на ссылках или исходя из заранее заданного списка адресов. Crawler, следуя по найденным ссылкам, осуществляет поиск новых документов, еще неизвестных поисковой системе.

Indexer (робот- индексатор) — программа, которая анализирует веб-страницы, скаченные пауками. Индексатор разбирает страницу на составные части и анализирует их, применяя собственные лексические и морфологические алгоритмы. Анализу подвергаются различные элементы страницы, такие как текст, заголовки, ссылки структурные и стилевые особенности, специальные служебные html-теги и т.д.

Таким образом, модуль индексирования позволяет обходить по ссылкам заданное множество ресурсов, скачивать встречающиеся страницы, извлекать ссылки на новые страницы из получаемых документов и производить полный анализ этих документов.

База данных

База данных, или индекс поисковой системы — это система хранения данных, информационный массив, в котором хранятся специальным образом преобразованные параметры всех скачанных и обработанных модулем индексирования документов.

Поисковый сервер

Поисковый сервер является важнейшим элементом всей системы, так как от алгоритмов, которые лежат в основе ее функционирования, напрямую зависит качество и скорость поиска.

Поисковый сервер работает следующим образом:

  • Полученный от пользователя запрос подвергается морфологическому анализу. Генерируется информационное окружение каждого документа, содержащегося в базе (которое и будет впоследствии отображено в виде , то есть соответствующей запросу текстовой информации на странице выдачи результатов поиска).
  • Полученные данные передаются в качестве входных параметров специальному модулю ранжирования. Происходит обработка данных по всем документам, в результате чего, для каждого документа рассчитывается собственный рейтинг, характеризующий релевантность запроса, введенного пользователем, и различных составляющих этого документа, хранящихся в индексе поисковой системы.
  • В зависимости от выбора пользователя этот рейтинг может быть скорректирован дополнительными условиями (например, так называемый «расширенный поиск»).
  • Далее генерируется сниппет, то есть, для каждого найденного документа из таблицы документов извлекаются заголовок, краткая аннотация, наиболее соответствующая запросу и ссылка на сам документ, причем найденные слова подсвечиваются.
  • Полученные результаты поиска передаются пользователю в виде SERP (Search Engine Result Page) – страницы выдачи поисковых результатов.

Как видно, все эти компоненты тесно связаны друг с другом и работают во взаимодействии, образовывая четкий, достаточно сложный механизм работы поисковой системы, требующий огромных затрат ресурсов.

По информации обработка поискового запроса в системе «Рамблер» происходит, так, как это изображено на рисунке.

Запрос поступает в поисковую систему через маршрутизатор Cisco 6000 series. Cisco передает его наименее загруженной машине первого уровня — frontend (1.1 — 1.3, на рис. машине 1.3). Frontend, в свою очередь, отправляет запрос дальше, на один из восьми proxy-серверов, также выбирая наиболее свободный сервер (2.1 — 2.8, на рис. машине 2.2). Одновременно frontend отправляет запрос на машины, осуществляющие поиск по товарам (3.1 — 3.2, на рис. машине 3.1) и по базе Тор 100 (4.1 — 4.2, на рис. машине 4.1). На proxy проводится поиск по ссылочному индексу, и его результаты вместе с поисковым запросом передаются на машины, которые содержат основную индексную базу, — backends (5.1.х — 5.7.х, на рис. машинам 5.1.2, 5.2.11, 5.3.1 и т.д.) Та же информация отправляется на машины с «быстрой базой» (6.1 — 6.2).

На текущий момент в поиск включено 77 backend’ов. Они сгруппированы по 11 машин, и каждая группа содержит копию одной из частей поискового индекса. Таким образом, информация о сайтах, условно входящих в красный сектор Интернета, находится на backend’ах первой группы (5.1.1 — 5.1.11 на рис), оранжевый сектор — на backend’ах второй группы (5.2.1 — 5.2.11) и т.д. Proxy-сервер выбирает наименее загруженный backend в каждой группе машин и отправляет на него поисковый запрос с результатами ссылочного поиска. На backend’ах осуществляется поиск по частям индексной базы и ранжирование с учетом результатов поиска по ссылочному индексу. При ранжировании для всех найденных документов высчитываются веса по конкретному запросу.

После того, как запрос обработан на backend’ах, информация о результатах и ранжировании отдается обратно на proxy-сервер. Туда же поступают отсортированные результаты с машин «быстрой базы». Proxy интегрирует данные, полученные с восьми машин: клеит дубли, объединяет зеркала сайтов, переранжирует документы в общий список по весам, рассчитанным на backend’ах. Так, первым в списке найденного может быть документ с машины 5.3.1, вторым и третьим — с 6.1, четвертым — с 5.5.2 и т.д. На proxy-сервере также реализуется построение цитат к документам и подсветка слов запроса в тексте. Полученные результаты отдаются на frontend.

Помимо информации с proxy-сервера, frontend получает результаты из поиска по товарам и из базы Тор 100, отсортированные, с цитатами и подсветкой слов запроса. Frontend осуществляет окончательное объединение результатов, генерирует html со списком найденного, вставляет баннеры и перевязки (ссылки на различные разделы Рамблера) и отдает html Cisco, который маршрутизирует информацию пользователю.

При написании мастер-класса были использованы материалы и данные ,

6. Заключение

Теперь подытожим все вышесказанное.

  • Первоочередная задача любой поисковой системы – доставлять людям именно ту информацию, которую они ищут.
  • Основные характеристики поисковых систем:
    1. Полнота
    2. Точность
    3. Актуальность
    4. Скорость поиска
    5. Наглядность
  • Первой полноценной поисковой системой стал проект WebCrawler, вышедший в свет в 1994 году.
  • В состав поисковой системы входят компоненты:
    1. Модуль индексирования
    2. База данных
    3. Поисковый сервер

Надеемся, наш мастер-класс позволит Вам поближе ознакомиться с понятием ПС, лучше узнать основные функции, характеристики и принцип работы поисковых систем.

www.seonews.ru

Как правильно искать в Google?

Для начала, не стоит забывать что алгоритм выдачи Google нечувствителен к регистру, проще говоря если вы введёте в запрос «Россия» или «россия» то результат поиска не изменится. Однако данный поисковик весьма чувствителен к алгоритму поисковых операторов, именно по этой причине результаты поиска по запросам «Windows OR Linux» и «Windows or Linux» могут координально отличаться.

Следующие, что стоит учитывать, это то что поисковик Google не учитывает многие слова – связки, например, такие как «и», «а», «но» и подобные. По этой причине результат поисковой выдачи никак не зависит от их употребления.

В – третьих, для того чтобы правильно искать в этом поисковике, следует помнить о наличии определенных операторов (символы или слова уточняющие поиск) и научиться ими пользоваться.

Такими операторами, пользуется не только Google, но и другие поисковики, например, Yandex.

Как пользоваться поисковыми системами

Итак, операторы Google которые помогут вам в поиске нужной информации:

«+» — лучше использовать тогда, когда нужно найти документы содержащие более двух слов, к примеру, «SEO + инструменты».

«-» — нужно использовать для исключения из выдачи документов, содержащих какое – нибудь слово например, «напитки — безалкогольные». В таком случае поисковик найдет исключительно алкогольные напитки.

«OR» — необходим для поиска документов, содержащих одно из нескольких слов, к примеру, «женщина OR девушка».

«“”» — нужно для того, чтобы найти документы, в которых есть определенная фраза в таком же виде, в каком она используется в качестве поискового запроса, например «купить телевизор Тверь»

«~» — необходим для поиска синонимов слов, которые указаны в запросе, например, «имиджевые ~ смартфоны».

«..» — используется в том случае, если необходимо найти документы в которых содержатся числовые значения в указанных интервалах, например «300…500 рублей в сутки».

Существуют и более популярные операторы Google для правильного поиска, среди которых среднестатистическому пользователю этой поисковой системы могут потребоваться следующие.

«daterange:» — нужен для поиска документов созданных в определенный промежуток времени, к примеру, «пожар в Киеве daterange:20092011-21102010».

«filetype:» — используется при поиске ссылок на документ определенного типа, например, «автобиография Солженицына filetype:rtf».

«site:» — нужен для того, чтобы отыскать все страницы нужного вам сайта или страницы сайта, содержащих определенное слово, например, «site:dirfreesoft.ru антивирус».

«phonebook:» — весьма нужный оператор, который ищет телефонные номера по указанным параметрам, к примеру, «phonebook: гостиницы Омск».

Оказывается не так уж и сложно искать в Google правильно если знаешь как.

Как пользоваться поисковыми системами

Как правильно искать в Yandex?

Ответ на этот, вроде бы глупый вопрос на деле знают отнюдь далеко не все пользователи Яндекса. Причина кроется в том, что наибольшее количество пользователей интернет ресурсами далеко не полностью используют возможности поисковых программ, как раз по этому в определенных случаях у многих пользователей поисковиков могут возникать какие – либо препятствия и трудности при поиске нужной информации.

Ну так и как же правильно пользоваться поисковой системой Яндекса – самым популярным поисковиком в русскоязычном сегменте Всемирной Сети?

1. Если необходимо найти определенную, конкретно сформулированную фразу. Поиск такие фраз наиболее удобно использовать с помощью оператора » «, иначе выражаясь для того чтобы найти web-документ в котором находиться нужная вам фраза, её следует напечатать в кавычках. Например, «Какие файлы можно исключить из проверки на наличие вирусов?»

2. Если нужно найти цитату, но некоторые слова вы запамятовали или попросту не знаете. Сложности в этом нет. В таком случае следует заключить в кавычки полностью всю фразу, а на места забытых слов нужно поставить знак «*». Например, «Я к вам * чего же боле».

3. Если нужно сформировать выдачу по нескольким словам или фразам одновременно. Для такой операции следует привлечь к работе оператора |, его нужно использовать после каждого искомого слова или фразы. Например, малина | земляника | клубника.

4. Если вам предстоит отыскать несколько слов, которые находятся в одном предложении. При выполнении это задачи нужно воспользоваться оператором &, его нужно ставить между искомыми словами. К примеру, памятник Маяковскому & Самара.

5. Если нужно отыскать документ, которые содержит то или иное слово. Для этого следует воспользоваться оператором +. Его следует использовать перед искомыми словами и не следует разделять пробелом. Так же запрос может содержать уточняющие слова или фразы. Например, памятник Чапаеву +сквер.

6. Если из поиска вам необходимо исключить документы, в которых содержится какое – либо конкретное слово. То нужно использовать оператор -. Его ставят перед словами которые нужно исключить и не разделяют пробелом. Например, современный ноутбук –купить.

7. Если нужно найти информацию только с определенного сайта. В таком случае поможет оператор site. Его используют одновременно с двоеточием и ставят непосредственно перед названием сайта. Например, PDF site:dirfreesoft.ru

8. Если вам потребуется отыскать документы того или иного типа. При поиске таких файлов следует воспользоваться оператором mine. Его также используют с двоеточием. Например, инструкция к HTS mine:doc.

9. Если нужно найти информацию на определенном языке. При такой задаче нужно воспользоваться оператором lang, после которого следует ставить двоеточие и уточняют выбранный язык для документов которые вы ищете. Например, Angels and Demons lang:ru.

pomogaemkompu.temaretik.com

Каждый из нас пользуется поиском по интернету, но не каждый знает, как пользоваться поисковой системой правильно, чтобы избежать лишней траты времени. Вкратце расскажу об алгоритме поиска поисковой системы Яндекс. Итак, начнем.

Для начала разберем, что же такое правильный запрос. Правильным запросом считается словосочетание из нескольких слов. Но не одного. Если Вы введете одно слово, например, «дизайн«, то поисковая система покажет все результаты, связанные с данным словом, включая все значения. Поэтому следует запрашивать более конкретно, например: ландшафный дизайн, веб-дизайн и т.д.

Если же вам нужно найти какую-то цитату, то просто введите ее в ковычках «» и Яндекс покажет все страныцы на которых употребляется нужная Вам цитата. Также можно использовать и другой метод, поставив перед словом знак + без пробела. Пример: +Молилась +ли +ты +на +ночь, +Дездемона?

Если нужно исключить из поиска определенные слова, о перед словом нужно ставит знак минус. Обязательное присутствие необходимых слов на любом расстоянии друг от друга, можно добиться, использовав знак &, проставив его между словами. Запрос !дом, найдет все варианты, используя это слово именно в таком варианте. А !!дом, покажет вариант слова в склонении: дом, дома, дому и т.д.

Если Вы ищете слово Автомобиль, но хотите исключить на страницах слово продажа, используйте такой вариант: Автомобиль~продажа.

Это основные элементарные запросы, которые облегчат Вам поиск. Теперь вы знаете как пользоваться поисковыми системами и сэкономить драгоценное время. А если вы хотите раскрутить свой сайт в поисковых системах, то подобный метод можно использовать в Яндекс вордстат.

serblog.ru

ПАРТНЕРСКАЯ СЕТЬ YOUTUBE — videospray.net ПОДКЛЮЧАЙТЕСЬ!

Эффективный поиск. Принципы пользования поисковыми системами
Поисковые системы обеспечивают пользователям оперативный доступ к любым видам информации, размещенной в сети Интернет.
Но для их эффективного использования необходимо освоить некоторые тонкости работы с ними.
Первое правило продуктивной работы с поисковой системой — это максимально точная формулировка запроса. Чем точнее вы составите фразу, по которой будет производиться поиск, тем меньше лишней и ненужной информации будет в результатах.
Большинство поисковых систем имеют функции расширенного поиска.
В них вы можете указать конкретный интерет-ресурс, на страницах которого необходим поиск, или, наоборот исключить какой-либо сайт. Расширенный поиск также предоставляет возможность поиска информации в определенном регионе, исключение результатов с какими-либо словами и много других функций, облегчающих работу.
Для того, чтобы уточнить свой запрос, можно воспользоваться поискам в найденном. Для этого, после появления результатов поиска, необходимо ввести уточняющую фразу и поставить флажок «Искать в найденном».
Некоторые команды позволяют настраивать результаты поиска прямо в строке запроса. Если вы, например, ищете книгу «Анна Каренина» а результаты поиска выдают информацию о фильме, достаточно составить запрос следующим образом: Анна Каренина —фильм.
Значок минуса перед словом позволяет исключить из результатов тексты, где оно встречается. Значок + между словами, наоборот, обеспечивает результаты, где есть все слова из запроса.
Поисковые системы позволяют задать формат интернет-ресурсов, на которых производится поиск. Если вы хотите найти что-то на форумах, в блогах или в новостях, достаточно вопользоваться соответствующим разделом поисковика.
Часто поиск оканчивается неудачей из-за ошибок в правописании или опечаток. В этом случае многие поисковые системы предлагают альтернативный запрос с правильным написанием, но лучше все же проверить правильность написания.

automobilrevue.net

You May Also Like

About the Author: admind

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *

Этот сайт использует Akismet для борьбы со спамом. Узнайте как обрабатываются ваши данные комментариев.