В индексе участвуют


Автоматическая переиндексация сайта не выполняется:
*при загрузке файлов по ФТП
при создании новых сообщений форума
при возвращении активности ранее деактивированным элементам
при загрузке статических страниц через интерфейс системы
при импорте элементов инфоблоков
*при импорте учебных курсов

Обновить поисковый индекс необходимо:
после импорта данных через файл CSV
после активации ранее неактивных элементов
*изменения параметров морфологического поиска
после добавления элементов инфоблоков
*после добавления файлов через ФТП
*после изменения, добавления правил сортировки
*создания списка «стоп»-слов

Ручная переиндексация:
не требуется никогда
*необходима при изменениях адресов форумов, блогов
*требуется при добавлении информации не через интерфейс системы
*требуется для модуля Социальная сеть, если выполнялась переиндексация сайта
необходима только по требованию системы
*необходима при изменении информации без изменения даты
требуется при изменения адресов в настройках компонентов при использовании инфоблоков
*необходима при изменениях в учебных курсах


Ограничение области поиска может быть задано с помощью настроек компонента:
«Форма поиска»
*»Страница поиска»

Чтобы динамическая страница могла участвовать в поиске по её свойствам необходимо:
включить инфоблок в список индексируемых в настройках модуля «Поиск»
*поставить соответствующие опции в настройках свойств инфоблока.
включить инфоблок в список индексируемых в настройках модуля «Информационные блоки»

В индексе участвуют:
*информационные блоки, для которых в настройках свойств указано соответствующее разрешение
*статические страницы, для которых задан заголовок $APPLICATION -> SetTITLE<>
статические страницы, в настройках свойств которых разрешено участие в поиске
любые статические страницы
информационные блоки, для которых в настройках свойств указано правильные адреса страниц

Результат поиска выдается в соответствии с
*правами пользователя
*заданными ограничениями на область поиска
ограничениями модулей и компонентами системы

Ограничения на область поиска в настройках модуля «Поиск» можно наложить:
*на тип файла по маске
на вид информации (статическая или динамическая)
*на размер файла
*на конкретные папки и файлы
на количество индексируемых документов


Использование Google Sitemap позволяет:
*быстрее попасть в результаты поисковой выдачи
*уменьшить нагрузку на сайт
получить преимущества при ранжировании
*более полно проиндексировать сайт

Для правильной работы поиска необходимо чтобы URL страниц, заданных в настройках инфоблока вели
*на реальные страницы с компонентами или программным кодом, обрабатывающим передаваемые ему параметры
на реальные страницы
на реальные страницы с компонентами, в которых подключены именно эти инфоблоки

Для определения документов, не участвующих в поиске, на странице настроек модуля «Поиск» служит поле:
Маска включения
Символы, по которым не производится разделение документа на слова
*Маска исключения

Поисковая фраза: «немецкий автомобиль» не (опель или opel) (1938 или 1939) — для модуля «Поиск» означает найти
немецкие автомобили производства ранее 1938 или позднее 1939 года не Опель.
*немецкие автомобили производства всех компаний, кроме Опель, 1938 или 1939 года выпуска с точной фразой в тексте «немецкий автомобиль».
немецкие автомобили производства всех компаний, кроме Опель, 1938 или 1939 года выпуска.
немецкие автомобили производства 1938 или 1939 года не Опель.

Вес — это:
*инструмент, позволяющий отдать при выдаче результатов поиска предпочтение документам той или иной тематики
значение, определяющее релевантность документа запросу
*параметр правила сортировки в поисковой выдаче


Использование быстрого поиска
*увеличивает скорость выдачи результатов
ограничивает число найденых документов
*ухудшает ранжирование

Правила сортировки используются для:
исключения определенных документов из поиска
снижения нагрузки на сервер при выполнении переиндексации сайта
*управления порядком вывода информации в списке результатов поиска

Ограничения на область поиска по статической и динамической информации можно задать:
в настройках свойств инфоблока
в настройках свойств страницы
в настройках модуля Поиск
*в настройках компонента Страница поиска

На странице «Переиндексация сайта» (Настройки > Поиск > Переиндексация) можно выполнить переиндексацию
*блогов
*форумов
cоциальной сети
*инфоблоков
*статических страниц
*учебных курсов

Чтобы статическая страница могла участвовать в поиске необходимо:
*создать заголовок страницы
сохранить страницу с именем index.php
задать ключевые слова страницы

www.diary.ru

1. Автоматическая переиндексация сайта не выполняется:

+ при загрузке файлов по ФТП
— при создании новых сообщений форума
— при возвращении активности ранее деактивированным элементам
— при загрузке статических страниц через интерфейс системы
— при импорте элементов инфоблоков
+ при импорте учебных курсов



Вам нужно провести конференцию или аналогичное мероприятие? Аренда конференц залов в Киеве — вот, что Вам нужно. Доступные цены и высочайшее качество гарантировано!


2. Обновить поисковый индекс необходимо:

— после импорта данных через файл CSV
— после активации ранее неактивных элементов
+ изменения параметров морфологического поиска
— после добавления элементов инфоблоков
+ после добавления файлов через ФТП
+ после изменения, добавления правил сортировки
+ создания списка «стоп»-слов


3. Ручная переиндексация:

— не требуется никогда
+ необходима при изменениях адресов форумов, блогов
+ требуется при добавлении информации не через интерфейс системы
+ требуется для модуля Социальная сеть, если выполнялась переиндексация сайта

— необходима только по требованию системы
+ необходима при изменении информации без изменения даты
— требуется при изменения адресов в настройках компонентов при использовании инфоблоков
+ необходима при изменениях в учебных курсах


4. Ограничение области поиска может быть задано с помощью настроек компонента:


— «Форма поиска»
+ «Страница поиска»


5. Чтобы динамическая страница могла участвовать в поиске по её свойствам необходимо:

— включить инфоблок в список индексируемых в настройках модуля «Поиск»
+ поставить соответствующие опции в настройках свойств инфоблока.
— включить инфоблок в список индексируемых в настройках модуля «Информационные блоки»


6. В индексе участвуют:

+ информационные блоки, для которых в настройках свойств указано соответствующее разрешение
+ статические страницы, для которых задан заголовок $APPLICATION -> SetTITLE<>

— статические страницы, в настройках свойств которых разрешено участие в поиске
— любые статические страницы
— информационные блоки, для которых в настройках свойств указано правильные адреса страниц


7. Результат поиска выдается в соответствии с

+ правами пользователя
+ заданными ограничениями на область поиска

— ограничениями модулей и компонентами системы


8. Ограничения на область поиска в настройках модуля «Поиск» можно наложить:

+ на тип файла по маске
— на вид информации (статическая или динамическая)
+ на размер файла
+ на конкретные папки и файлы

— на количество индексируемых документов


9. Использование Google Sitemap позволяет:

+ быстрее попасть в результаты поисковой выдачи
+ уменьшить нагрузку на сайт

— получить преимущества при ранжировании
+ более полно проиндексировать сайт



10. Для правильной работы поиска необходимо чтобы URL страниц, заданных в настройках инфоблока вели

+ на реальные страницы с компонентами или программным кодом, обрабатывающим передаваемые ему параметры
— на реальные страницы
— на реальные страницы с компонентами, в которых подключены именно эти инфоблоки


11. Для определения документов, не участвующих в поиске, на странице настроек модуля «Поиск» служит поле:

— Маска включения
— Символы, по которым не производится разделение документа на слова
+ Маска исключения


12. Поисковая фраза: «немецкий автомобиль» не (опель или opel) (1938 или 1939) — для модуля «Поиск» означает найти

— немецкие автомобили производства ранее 1938 или позднее 1939 года не Опель.
+ немецкие автомобили производства всех компаний, кроме Опель, 1938 или 1939 года выпуска с точной фразой в тексте «немецкий автомобиль».
— немецкие автомобили производства всех компаний, кроме Опель, 1938 или 1939 года выпуска.
— немецкие автомобили производства 1938 или 1939 года не Опель.


13. Вес — это:

+ инструмент, позволяющий отдать при выдаче результатов поиска предпочтение документам той или иной тематики
— значение, определяющее релевантность документа запросу
+ параметр правила сортировки в поисковой выдаче



14. Использование быстрого поиска

+ увеличивает скорость выдачи результатов
— ограничивает число найденых документов
+ ухудшает ранжирование


15. Правила сортировки используются для:

— исключения определенных документов из поиска
— снижения нагрузки на сервер при выполнении переиндексации сайта
+ управления порядком вывода информации в списке результатов поиска


16. Ограничения на область поиска по статической и динамической информации можно задать:

— в настройках свойств инфоблока
— в настройках свойств страницы
— в настройках модуля Поиск
+ в настройках компонента Страница поиска


17. На странице «Переиндексация сайта» (Настройки > Поиск > Переиндексация) можно выполнить переиндексацию

+ блогов
+ форумов

— cоциальной сети
+ инфоблоков
+ статических страниц
+ учебных курсов


18. Чтобы статическая страница могла участвовать в поиске необходимо:

+ создать заголовок страницы
— сохранить страницу с именем index.php
— задать ключевые слова страницы

studizba.com


Лабораторная работа № 12 «Система поиска по сайту»

Цель

Получить практические навыки настройки и использования системы поиска по сайту в системе управления контентом «1С-Битрикс:Управление сайтом».

Теоретическое введение

Модуль «Поиск»

Модуль Поиск используется для индексирования и организации поиска информации на сайте средствами системы управления контентом«1С-Битрикс:Управление сайтом». Модуль позволяет осуществлять поиск как статической, так и динамической информации. Таким образом, пользователи сайта могут осуществлять поиск информации в любом каталоге товаров, новостях, сообщениях форума и в любом статическом разделе сайта.

При проведении поиска учитывается уровень прав пользователя, создавшего запрос. Т.е. поиск информации по запросу пользователя будет осуществляться в разделах и на страницах сайта, правом на доступ к которым обладает данный пользователь.

При организации поиска возможна установка ограничений на область поиска: разделы сайта, форматы файлов, типы информации, участвующей в поиске. Также можно выбирать данные, которые будут индексироваться для поиска.

Поисковый индекс

Поиск информации на сайте выполняется на основе поискового индекса (индексных таблиц). В индексе участвуют статические файлы и информационные блоки.

В индексе, а, следовательно, и в поиске участвуют только те статические страницы, для которых задан заголовок.


Вся текстовая информация, которая попадает на сайт в виде статических HTML страниц или через интерфейс модулей (например, модуль Информационные блоки) индексируется автоматически.

Переиндексация

В некоторых случаях, например, после загрузки файлов по FTP может понадобиться ручная переиндексация сайта: пока индекс поиска не создан заново, новые страницы не будут выводиться в результатах поиска.

Морфологический поиск

Модуль Поиск системы «1С-Битрикс:Управление сайтом»позволяет осуществлять морфологический поиск на сайте. В этом случаи при создании индекса (и, соответственно, при поиске) учитываются все формы индексируемых слов.

Например, при индексации слова телефон, база данных индекса будет учитывать различие в падежных окончаниях (телефона,телефону и т.д.), а также его множественное число

(телефоны, телефонов, телефонами т.д.).

Соответственно, при поиске по запросу телефон будут найдены страницы, содержащие не только словотелефон, но и слователефона,телефону,телефоны,телефонов,телефонам и т.д.

studfiles.net

Администратор КП. Администратор системы.

1. Кто может создавать/изменять записи о кадровых перестановках в компании?


+ администратор портала
— пользователи группы Отдел кадров
— группы пользователей, имеющие уровень доступа «запись» к модулю Интранет
+ группы пользователей, имеющие уровень доступа «изменение» к инфоблоку, в котором хранятся записи о кадровых перестановках

2. Чтобы правило применялось к почтовым сообщениям автоматически, в поле «Применять при событиях» (форма редактирования правила, модуль «Почта») следует выбрать значение:

+ при получении
— при принудительном вызове

3. Опция в настройках модуля библиотеки документов "Использовать склейку истории изменений документа" предполагает:

+ сохранение в истории первоначальной версии экземпляра документа
— сохранение в истории всех версий экземпляров документа
+ сохранение в истории предпоследней версии экземпляра документа
— полную очистку истории изменений документа

4. Ограничения на область поиска по статической и динамической информации можно задать:

+ в настройках компонента Страница поиска
— в настройках свойств инфоблока
— в настройках свойств страницы
— в настройках модуля Поиск

5. Администратор контроллера на подчиненных сайтах может:

+ авторизовываться и выполнить необходимые действия без учета уровня прав, установленных локальными администраторами.
— авторизовываться и выполнять действия в соответствии с правами, заданными локальными администраторами.

6. Перенос сайта с локального компьютера на удаленный сервер средствами системы:

— невозможен
+ осуществляется созданием резервной копии, переносом архива на удаленный сервер с последующей распаковкой скриптом restore.php и настройкой
— осуществляется с помощью скрипта BitrixSetup
— осуществляется с помощью "Резервного копирования", но базу данных необходимо перенести самостоятельно

7. После подключения сервера memcached с помощью модуля веб-кластер

+ сервер будет использоваться в кластере вместо файлового кеша
— сервер будет использоваться в кластере совместно с файлами кеша
+ в случае отказа всех memcached-серверов подсистема кеширования снова начинает использовать файловый кеш

8. Может ли начальник просматривать календари своих подчиненых?

— Нет
+ Да
— В зависимости от настроек конкретного календаря

9. При подключении внешней папки как файлового хранилища невозможна работа с документами в режиме

+ документооборота
+ документооборота и бизнес-процессов
+ бизнес-процессов

10. Если пользователь удален из списка пользователей корпоративной сети, то:

— он сохранит прежний доступ к сайту.
+ при попытке получить доступ к ресурсам сайта он получит отказ в авторизации.
+ его аккаунт будет сохранен в системе управления сайтом.

11. Чтобы динамическая страница могла участвовать в поиске по её свойствам необходимо:

— включить инфоблок в список индексируемых в настройках модуля «Информационные блоки»
— включить инфоблок в список индексируемых в настройках модуля «Поиск»
+ поставить соответствующие опции в настройках свойств инфоблока.

12. Если при редактировании подключения к облачному хранилищу на закладке "Правила" в колонке "Список модулей" оставить поле пустым

+ то под действие правила подпадают файлы любых модулей
— то под действие правила не будут попадать файлы ни одного из модулей
— то под действие правила подпадают файлы только главного модуля

13. Для того чтобы выполнять получение почтовых сообщений вручную, на странице настройки почтового ящика в поле «Проверять с периодом» следует указать:

— период времени (в минутах), по истечении которого пользователь будет выполнять проверку новых сообщений на сервере
— 1
+ 0

14. После распаковки резервной копии сайта будет предложено выполнить настройку соединения с базой данных, если при создании резервной копии:

— была изменена конфигурация файла dbconn.php
— из состава резервной копии были исключены файлы больше указанного размера
+ в состав резервной копии была включена база данных

15. При публикации списка курса необходимо:

— компонент "Список курсов" — комплексный и создание страницы не требуется
+ создать страницу для детального просмотра курсов и указать ее в настройках компонента

16. На странице «Переиндексация сайта» (Настройки &gt; Поиск &gt; Переиндексация) можно выполнить переиндексацию

+ инфоблоков
— cоциальной сети
+ статических страниц
+ блогов
+ форумов

17. Где указывается сервер, на котором размещен почтовый ящик?

— в настройках главного модуля
— в настройках модуля "Почта"
— в любом из перечисленных
+ в настройках почтового ящика

18. Разрешение на использование Универсальных списков в рамках Социальной сети дается в настройках модуля

+ Универсальные списки
— Социальная сеть

19. Поисковая фраза: "немецкий автомобиль" не (опель или opel) (1938 или 1939) — для модуля "Поиск" означает найти

— немецкие автомобили производства 1938 или 1939 года не Опель.
+ немецкие автомобили производства всех компаний, кроме Опель, 1938 или 1939 года выпуска с точной фразой в тексте «немецкий автомобиль».
— немецкие автомобили производства ранее 1938 или позднее 1939 года не Опель.
— немецкие автомобили производства всех компаний, кроме Опель, 1938 или 1939 года выпуска.

20. Средства системы позволяют выполнять поиск по:

— учебным курсам
+ офисным документам
+ информации, хранящейся в инфоблоках, форумах, блогах
+ содержимому статических страниц
+ пользователям

21. Проактивный фильтр не работает для групп пользователей:

+ для которых в правах доступа к модулю «Проактивная защита» разрешена операция «Обход проактивного фильтра»
— если разрешено использования одноразовых паролей
— если включен механизм хранения данных сессий пользователей в базе данных
— добавленных в стоп-лист

22. При входе на подключенный к контроллеру сайт через логин на контроллере

— Происходит прозрачная авторизация без создания локального пользователя
+ На сайте создается локальный пользователь с соответствующим именем и правами

23. Публичный сотрудник это пользователь

+ , который всегда доступен для общения и включения в любую рабочую группу экстранета
+ со свойством UF_PUBLIC
— из группы Администратор экстранета
— из группы Техподдержки экстранета

24. Если подключенный сайт отмечен в контроллере как неактивный, то:

+ он недоступен для любых посетителей.
— на управляемом сайте не выводится информация с управляющего сайта.
— управление этим сайтом со стороны контроллера невозможно.

25. Если перед удалением сайта из контроллера он был предварительно отсоединен, то:

+ после удаления на сайте будут возвращены настройки, установленные до подключения к контроллеру.
— запись будет удалена, а сам сайт будет работать с теми настройками, которые были установлены контроллером.

26. Изменить место хранения кеша при установленном модуле веб-кластер можно

— в настройках главного модуля
+ в административной части сайта на странице "Memcached"
— в настройках модуля веб-кластер
+ в файле "bitrixmodulesclustermemcache.php"

27. При подключении сайта к контроллеру

— На подключенном сайте хранится зашифрованный пароль администратора контроллера
+ На подключенном сайте создается локальный пользователь-администратор, пароль от которого в зашифрованном виде хранится на контроллере

28. Страница "Веб-сервера"

— носит как информационный характер, так и позволяет добавить в кластер новые узлы
— позволяет добавить в кластер новые узлы
+ носит информационный характер

29. Импорт пользователей из AD/LDAP осуществляется:

— автоматически
— для всех серверов
+ из выбранного администратором сервера (вручную)

30. Проверка целостности файлов системы осуществляется на странице:

+ Контроль целостности
— Проверка сайта
— Агенты

31. Красный индикатор у опроса в списке опросов означает что:

+ флаг активности опроса не установлен
— текущая дата попадает в интервал проведения опроса
— флаг активности установлен
+ текущая дата не попадает в интервал проведения опроса

32. Просмотр всех обращений в службу техподдержки доступен:

— клиентам техподдержки
+ администратору техподдержки
— сотрудникам техподдержки

33. Поиск можно ограничить:

+ по типу файла
+ по папкам
— по пользователям
— по тегам
+ по размеру файла

34. Чтобы статическая страница могла участвовать в поиске необходимо:

— задать ключевые слова страницы
— сохранить страницу с именем index.php
+ создать заголовок страницы

35. Страница "Сервер БД" модуля Монитор производительности в административной части сайта показывает

— содержимое базы данных
+ сводную статистику производительности сервера базы данных и рекомендации по настройке
— сводную статистику производительности сервера базы данных

36. Ограничения на область поиска в настройках модуля «Поиск» можно наложить:

+ на тип файла по маске
— на количество индексируемых документов
+ на конкретные папки и файлы
+ на размер файла
— на вид информации (статическая или динамическая)

37. Для доступа к сайту экстранета пользователи должны быть включены

+ в группу Все пользователи
— в соответствующие группы экстранета
— в группу Сотрудники

38. Время исполнения страниц можно посмотреть

+ внизу каждой страницы публичной части сайта, если включена Отладка.
— в публичной и административной части сайта в специальной форме.
+ в формах монитора производительности в административной части, если включен сбор статистики.

39. Время реакции на обращение в службу поддержки определяется:

+ SLA
— уровнем сложности проблемы
— уровнем критичности обращения

www.nulled.cc

Гипотезы

Так как официальной информации о дополнительном индексе Google не так много, в сообществе оптимизаторов возникают две гипотезы.

1) Страницы из дополнительного индекса не участвуют в ранжировании.
2) Исходящие ссылки с этих страниц не работают.

Целью данного анализа является проверить достоверность гипотез.

Методология анализа

Для проведения анализа, сперва, необходимо разделить страницы сайта по индексам — какие попали в основной, какие в дополнительный. Для этого используется оператор поиска “site” и конструкция site:devaka.ru/&. С помощью двух запросов к Google сначала берется общий индекс, потом основной, сканируются все страницы и их разница дает страницы из дополнительного индекса.

Для проверки первой гипотезы для нескольких сайтов проводится анализ трафика в Google Analytics, а именно, проверяются страницы входа при выбранном сегменте “Google (organic)” (спасибо Мише Сливинскому за наводку). Анализируется доля трафика, приходящегося на страницы в основном и дополнительном индексе. Судя гипотезе, страницы из дополнительного индекса не должны получать поисковый трафик.

При проверке второй гипотезы берется несколько случайных ссылок со страниц в “соплях” и проводится анализ их работоспособности, где под работоспособностью понимается нахождение акцептора по точному текстовому анкору в ссылке.

Проведение и результаты анализа

При анализе была произведена проверка нескольких сайтов, но мы рассмотрим процесс на примере блога devaka.ru.

Общий индекс можно получить по запросу “site:devaka.ru” (с указанием filter=0, чтобы вытащить в том числе дубли).

Общий индекс при поиске по сайту

Основной индекс был получен по запросу “site:devaka.ru/&”.

Результаты основного индекса Google при поиске внутри сайта

Из скриншотов (здесь отображены не первые результаты) уже видно, что страница /articles/ не отображается при втором запросе, но есть в выдаче при первом.

Всего было получено:

598 результатов из общего индекса.
504 результата из основного.
94 результата в “соплях”.

Ниже приведены страницы, которые попали в дополнительный индекс.

Далее данный список сравнивался с данными из Google Analytics — количеством трафика из Google за последний месяц. Получилась следующая таблица (приведена в неполном виде).

Сводная таблица по трафикогенерирующим страницам блога

На страницы дополнительного индекса пришлось 31 посетитель за последний месяц из Google, в то время как всего 30 976 посетителей. То есть, на дополнительный индекс пришлось порядка 0,1% трафика, хотя эти страницы составляют около 16% всего индекса (для анализируемого сайта).

Распределение трафика между основным и дополнительным индексами Google

Интересно, какие именно страницы получили трафик?

Трафикогенерирующие сопли :)

На эти страницы заходили по следующим запросам:
— “как оптимизировать видео devaka”
— “юзабилити и seo devaka”
— “http://www.google.com/search?q=cache:https://devaka.ru/articles/howto-write-articles” – кто-то искал ссылки в кеше, по всей видимости.
— Остальные “(not provided)”

Таким образом, мы видим, что на страницы из дополнительного индекса заходили преимущественно те люди, которые искали на сайте devaka.ru (использовали бренд-запросы).

Если анализировать ссылки на полученных страницах в дополнительном индексе, то видим, что они работают (например, эта страница, проверочный запрос).

Проверка работоспособности ссылок со страниц в дополнительном поиске

Итоги анализа

В результате анализа мы подтвердили первую гипотезу и опровергли вторую. То есть, действительно, страницы в дополнительном индексе не участвуют в ранжировании, если только текст не ищется непосредственно на них. В нашем случае эти страницы получили 0,1% гугловского трафика (преимущественно по бренд-запросам). Однако, ссылки со страниц в дополнительном индексе все же работают, по крайней мере при поиске по точному вхождению текста ссылки акцептор находится.

Какие заключения можно сделать, исходя из результатов анализа? Я для себя сделал следующие:

1. Стоит следить за качеством индекса для своего сайта. Не всегда больше страниц — лучше. Большое количество страниц в индексе (от 15% до 99% у больших порталов) могут получать всего 0,1 – 1% поискового трафика.

2. В дополнительный индекс попадают малоинформативные страницы и дубли. Из тех страниц, что мне удавалось анализировать, в дополнительном индексе присутствуют чаще всего дубли (как внутренние, так и с внешних ресурсов, например, если на сайте активно копируют контент, то дополнительный индекс для сайта может расти), а также страницы, на которых помимо сквозных блоков присутствует очень мало текста (меньше 70-80 слов) или только ссылки (в независимости от объемов).

3. “Сопли” редко переиндексируются. Судя логам сервера, страницы в “соплях” малозначимы для роботов и переиндексируются очень редко, ими сложно манипулировать и покупать с них ссылки не имеет экономического смысла.

4. Некоторые страницы попадают в дополнительный индекс, если большая часть их уникального текста дублируется на странице-категории. Это было замечено для некоторых документов, у которых нет внешних дублей. Часть их текста просто копируется на странице-категории. В связи с этим, анонсы в категории лучше пускать уникальные, чтобы оставлять уникальным текст самой статьи.

В любом случае “сопли” это плохо ?

devaka.ru

Что такое индекс поисковой системы?

Индекс поисковой системы – это база данных, в которой находится информация обо всех документах (страницах с сайтов, файлов), которые могут участвовать в поиске.

Не все страницы включаются в индекс. Например, если страница вашего сайта признается роботом поисковой системы как низкокачественная, она может не включаться в индекс и не принимать участие в поиске. Аналогичная судьба часто ожидает страницы-дубли или документы, содержащие скопированные с других сайтов тексты.

В Google имеется основной индекс и дополнительный (supplemental index).

В дополнительный индекс попадают документы, которые имеют более низкое качество, чем документы из основного индекса. Они не участвуют в основном поиске, их редко посещает робот Google, они практически не приносят трафик на сайт.

В дополнительный индекс Google обычно попадают:

  • страницы с неуникальным контентом,
  • страницы, на которых практически отсутствует контент и страницы с текстом менее 500 символов,
  • дубли,
  • иногда в дополнительный индекс могут попадать страницы с низким весом.

Почему важно проверять количество страниц в индексе?

Очень важно отслеживать индексацию страниц, потому что от этого зависит трафик из поисковых систем. Если страница не проиндексирована, она не сможет появиться в выдаче по какому-либо запросу.

Также важна скорость индексации сайта. Если она низкая, в индексе будут устаревшие версии страниц, а новые документы будут попадать в поиск с большой задержкой. Чтобы решить эту проблему, посмотрите статью, как ускорить индексацию сайта.

Как узнать, сколько страниц в индексе Яндекса или Google?

Есть несколько способов проверить количество страниц в индексе поисковых систем:

1. Введите в поисковую строку запрос: site:site.com (где site.com – это URL или адрес главной страницы сайта), как на скриншоте ниже:

количество страниц в индексе Google

Под строкой поиска вы увидите примерное количество страниц в индексе поисковой системы. В примере выше указано число страниц в индексе Google. Этот способ позволяет узнать число страниц в базе поисковой системы у любого сайта, в том числе конкурента.

2. Проверить количество страниц в индексе Google, можно в сервисе Google для вебмастеров. Аналогичный сервис в Яндексе – это Яндекс.Вебмастер. В нем можно посмотреть число страниц в индексе данной поисковой системы. Для просмотра данных потребуется подтвердить права на сайт в сервисах. Поэтому данный способ не подходит для анализа сайтов конкурентов.

Сервис

Раздел, в котором находится информация о числе проиндексированных страниц

Google для вебмастеров

Индекс Google -> Статус индексирования

Яндекс.Вебмастер

Индексирование -> Структура сайта

Если у вас есть доступ в Яндекс.Вебмастер, зайдите на вкладку «Индексирование» -> «Страницы в поиске» и над графиком выберите отображение «История». Здесь вы сможете посмотреть не только число страниц в индексе, но и историю индексирования сайта.

3. При помощи онлайн-сервисов, например, многие бесплатные сервисы для проведения аудитов сайтов выводят информацию о количестве страниц в индексе.

Как проверить страницу в индексе Яндекса или Google?

Часто вебмастеру требуется узнать, находится в индексе конкретная страница сайта или нет. Самый простой способ узнать это – ввести поисковый запрос, состоящий из адреса страницы. Если в результатах поиска вы увидите искомую страницу, значит, она находится в индексе:

проверка наличия страницы в индексе Google

В Яндекс.Вебмастер есть функция, которая позволяет не только проверять, в индексе страница или нет, но и следить, чтобы важные страницы не выпадали из поиска. Чтобы добавить страницу в список отслеживаемых, зайдите в раздел «Индексирование» -> «Важные страниц» и в открывшейся форме добавьте нужные страницы:

отслеживание изменений на важных страницах в Яндексе

Можно настроить отслеживание до 100 страниц, что достаточно для многих проектов. Если вам нужно отслеживать больше документов на сайте, то можно воспользоваться сервисом Топвизор. Он позволяет проверять, в индексе страницы сайта или нет, без ограничения по числу документов. Помимо проверки индексации сайта, сервис позволяет снимать позиции по запросам, группировать запросы и многое другое.

Как вернуть или добавить страницу в индекс?

В панелях для вебмастеров имеются специальные сервисы, позволяющие отправить страницу на переиндексацию или добавить новую страницу с сайта в поисковую систему:

  • Переобход страниц в Яндекс.Вебмастер
  • Отправить страницу на индексацию в Google

Второй способ отправить страницу на переиндексацию – это добавить ссылки на страницу в социальные сети, новостные ресурсы и другие интернет-ресурсы, которые часто посещают роботы поисковых систем.

Если вы отправили страницу на индексацию, но она не появилась в поиске, скорее всего, робот посчитал документ малополезным. Нужно доработать страницу, чтобы она попала в индекс.

adblogger.ru

1С-Битрикс: Управление сайтом

Курс «Администратор. Базовый»

Поиск

Введение

Курс предназначен для базовой подготовки пользователей, осуществляющих

администрирование сайтов, созданных на «1С-Битрикс: Управление сайтом».

Изучение курса позволяет освоить основные методы администрирования системы, а

также пополнить знания по темам, изученным в курсе «Контент-менеджер».

При условии качественного изучения материалов курса, по его окончании специалист

должен уметь:

устанавливать и настраивать систему;

осуществлять необходимые процедуры по переносу разработанного сайта на хостинг;

использовать возможности интерфейса по управлению системой;

управлять доступом к системе, сайтами, пользователями, группами пользователей;

работать с модулем Информационные блоки;

работать с модулем Поиск;

работать с инструментами системы;

выполнять работу по конфигурированию веб-системы для оптимальной работы.

Для прохождения курса:

Обязательно:

наличие базовых навыков компьютерной грамотности и навыков работы с ОС Windows;

наличие представлений о WWW и организации доступа к веб-серверу.

Рекомендуется иметь:

базовые навыки установки и администрирования *NIX-систем Поиск Модуль Поиск используется для индексирования и организации поиска информации на сайте. Модуль позволяет осуществлять поиск как статической, так и динамической информации. Таким образом, пользователи сайта могут осуществлять поиск информации в любом каталоге товаров, новостях, сообщениях форума, социальной сети и в любом статическом разделе сайта.

Важно! При проведении поиска учитывается уровень прав пользователя, создавшего запрос. Т.е. поиск информации по запросу пользователя будет осуществляться в разделах и на страницах сайта, правом на доступ к которым обладает данный пользователь.

При организации поиска возможна установка ограничений на область поиска: разделы сайта, форматы файлов, типы информации, участвующей в поиске. Также можно выбирать данные, которые будут индексироваться для поиска.

Внимание! Содержимое включаемых областей не индексируется поиском.

Настройки модуля «Поиск»

Условия поиска задаются в настройках модуля Поиск (Настройки Настройки продукта Настройки модулей Поиск). Большая часть настроек модуля не требует комментариев. При необходимости узнайте о значении полей в пользовательской документации.

Закладка «Индексация»

Ограничить поиск можно по целому ряду параметров. Например, по размеру файлов, типу файлов, папкам, которые не нужно индексировать.

Поле Максимальный размер индексируемого документа в килобайтах позволяет ограничить документы, участвующие в поиске, по их размеру. Пустое значение означает отсутствие ограничения.

Поле Маска включения позволяет задать маску, по которой будут выбираться документы, участвующие в поиске;

В поле Маска исключения определяется условие, на основе которого документы будут исключаться из индекса и поиска.

В поле Код свойства страницы в котором хранятся теги указывается код свойства страницы, в котором хранятся теги.

Закладка «Морфология»

На закладке Морфологический поиск можно разрешить или запретить морфологический поиск на сайте и настроить его параметры.

Морфологический поиск – возможность поисковой системы искать слово в документах во всех его морфологических формах.

При морфологическом анализе модуль Поиск разбивает предложения на слова, используя стандартные символы-разделители (пробел, точка, запятая и т.п.). Однако, существуют символы, которые, не будучи буквами, все же являются частями слов (например, дефисы). Чтобы в подобных случаях разбивка слов не выполнялась, в поле Cимволы, по которым не производится разделение документа на слова укажите символы, которые морфологический анализатор должен рассматривать как части слов.

По умолчанию там стоит дефис.

Примечание: Морфологический поиск поддерживает работу со всеми языками, установленными в системе.

Закладка «Поиск»

На закладке Поиск задаются собственно параметры поиска.

Для некоторых проектов вполне допустимо и использование опции Использовать быстрый поиск (с ухудшенным ранжированием). В этом случае поиск по сайту будет работать быстрее, но ранжирование не будет оптимальным, то есть документы, максимально точно отвечающие запросам, не будут собираться в начале первой страницы, а будут выводиться по мере нахождения.

Ранжирование (англ. ranking) – это процесс выстраивания найденных по запросу пользователя страниц в порядке наибольшего соответствия искомому запросу.

С помощью поля Максимальное количество документов в результатах поиска можно ограничить количество документов, которые будут показаны из всего результата поиска.

Поле Сколько дней хранить поисковые запросы для подсказки определяет время, в течение которого будут храниться поисковые запросы, выводимые в подсказке.

Закладка «Статистика»

На закладке «Статистика задаются параметры хранения статистики поисковых фраз и запросов.

Статистика – это инструмент для сбора и анализа информации с целью дальнейшей корректировки контента сайта под типовые поисковые запросы.

Компоненты Поиска Для выполнения поиска на сайте используются компоненты Форма поиска (search.form) и Стандартная страница поиска (search.page).

Примечание: Подробнее про компоненты поиска вы можете посмотреть на странице пользовательской документации.

Форма поиска Форма поиска предназначена для ввода условия поиска (поисковой фразы или слов) и размещается в шаблоне сайта с помощью специального компонента Форма поиска (search.form):

Внешний вид и место размещения формы поиска зависят от шаблона и дизайна сайта:

После нажатия посетителем кнопки Поиск, система выполнит поиск информации и перенаправит посетителя на страницу поиска.

Страница поиска Страница поиска содержит специальное поле для ввода условий поиска. Также на странице поиска выводятся непосредственно результаты поиска:

Страница поиска создается с помощью компонента Стандартная страница поиска (bitrix:search.page). Данный компонент может быть размещен на любой странице сайта при ее создании или редактировании с помощью визуального HTML-редактора:

Примечание: На странице поиска облако тегов будет отображаться только в том случае, если в качестве шаблона компонента выбран шаблон tags. В компоненте предусмотрено еще несколько различных шаблонов.

Параметры компонента позволяют необходимым для вас образом настроить не только внешний вид страницы поиска, но и условия поиска информации.

Примечание: Подробное описание каждого параметра компонента приведено в пользовательской документации по продукту.

Компоненты поиска поддерживают автоматическое определение раскладки клавиатуры.

Нет необходимости набирать заново текст, система сама определит раскладку клавиатуры для введенного слова.

Примеры настройки компонента Стандартная страница поиска (bitrix:search.page)

1. Чтобы поиск информации осуществлялся только на статических страницах сайта, нужно в группе свойств Источник данных в поле Ограничение области поиска выбрать Статические файлы и нажать кнопку OK:

После выполнения данных действий в группе свойств Источник данных будет добавлено дополнительное поле Путь к файлу начинается с любого из перечисленных, позволяющее ограничить перечень каталогов и файлов сайта, в которых будет осуществляться поиск с помощью данного компонента. Например:

2. Можно задать ограничения по поиску динамической информации. Например, на сайте есть страница Новости магазина, содержащая список новостей интернетмагазина (информационный блок Новости магазина, тип Новости).

Предположим, необходимо, чтобы посетители могли осуществлять поиск информации среди новостей.

Для решения поставленной задачи нужно выполнить следующие действия:

– &nbsp– &nbsp–

После этого в группе свойств будет добавлено дополнительное поле Искать в информационных блоках типа тип_инфоблока. В данном поле нужно указать информационный блок, элементы которого (в данном случае новости) выводятся на странице Новости магазина:

Индексация Поиск информации на сайте выполняется на основе поискового индекса (индексных таблиц).

Индексирование – процесс сбора, классификации и сохранения данных с целью облегчить быстрый и точный поиск информации.

В индексе участвуют:

– &nbsp– &nbsp–

Вся текстовая информация, которая попадает на сайт в виде статических HTML страниц или через интерфейс модулей (например, модуль Информационные блоки, модуль Форум и т.д.) индексируется автоматически.

– &nbsp– &nbsp–

В индексе, а, следовательно, и в поиске участвуют только те статические страницы, для которых задан заголовок ($APPLICATION — SetTITLE).

В индексе, а, следовательно, и в поиске участвуют только те информационные блоки, для которых в настройках свойств указано соответствующее разрешение.

Разрешение можно задать по разделам и по элементам.

Во всех случаях, когда происходит добавление информации, минуя интерфейс системы, либо информация изменена без изменения даты, требуется ручная переиндексация.

Например, после импорта товаров в каталог или после загрузки файлов по FTP понадобиться ручная переиндексация сайта. Или вернули активность элементам инфоблока (дата не изменилась).

Инфоблоки переиндексируются автоматически при внесении элементов или разделов.

Важно то, что настройки инфоблока и настройки соответствующего компонента должны обязательно совпадать, иначе поиск будет выдавать неправильные URL найденных страниц.

Изменения адресов в настройках компонентов при использовании инфоблоков фиксируются также автоматически. А вот изменения адресов форумов, блогов требуют ручной переиндексации.

Обновление индексных таблиц выполняется с помощью формы Переиндексация сайта (Настройки Поиск Переиндексация):

Так как на сайте может быть представлен значительный объем информации, процедура переиндексации может занять довольно продолжительное время. Для того что сократить затраты времени, можно выполнить переиндексацию только измененных файлов (опция Переиндексировать только измененные), либо выбрать сайт и/или модуль, данные которых будут участвовать в переиндексации (поля Сайт и Модуль).

Примечание:

В некоторых случаях есть смысл не использовать функцию Переиндексировать только измененные, а прибегнуть к радикальному методу: удаление и восстановление модуля Поиск. Определенные операции по обновлению данных могут выполняться дольше, чем создание нового индекса. В частности это касается случаев использования таблиц InnoDB и большой базы данных.

Например, вы создали большое число элементов инфоблока (скажем, 50000). Во время этой работы в свойствах инфоблока не были включены опции Индексировать разделы (элементы) с целью снижения нагрузки на сайт.

Затем вы активируете эти опции. Автоматически этот инфоблок в поиск не попадет, нужна ручная индексация. Вот в таком случае и лучше использовать прием удаления модуля Поиск из системы (с удалением файлов поискового индекса) и восстановление его обратно.

Индексирование производится поэтапно, продолжительность выполнения одного шага задается в поле Шаг.

Чем больше время – тем лучше. (При незаполненном поле переиндексация выполняется в один шаг, что и рекомендуется делать на локальной установке при разработке проекта.) Но на время выполнения операции индексирования на удаленном сервере накладывает ограничения хостинг. Установку времени выполнения шага рекомендуется назначать не больше, чем время выполнения скрипта, задаваемое хостинговой кампанией. В большинстве случаев подходит значение параметров в 50 секунд на один шаг.

В процессе индексации можно также удалить все фразы, которые будут отображаться в подсказке при наборе слова в поле поиска. Для этого служит опция Удалить поисковые фразы для подсказки.

Внимание! После выполнения переиндексации модуль Социальная сеть должен быть переиндексирован отдельно из публичного раздела.

Для этого:

Перейдите в разделы социальной сети (где установлены компоненты Социальная сеть (socialnetwork), Социальная сеть – группы (socialnetwork_group),

Социальная сеть – пользователь (socialnetwork_user)):

– &nbsp– &nbsp–

Правила сортировки После ввода пользователем строки поискового запроса и нажатия кнопки Поиск, система отбирает из поискового индекса страницы, соответствующие запросу. Перед показом пользователю результаты поиска сортируются по следующим параметрам:

по релевантности – степень релевантности документа поисковому запросу определяется исходя из наличия на странице слов, участвующих в поиске, и их удаленности друг от друга;

по дате изменения (последнего обновления) страницы.

Пользователь может выбрать режим сортировки на странице с результатами поиска, нажав на одну из двух ссылок в конце списка найденных документов: Сортировать по релевантности или Сортировать по дате:

Вместе с тем, очень часто требуется при выводе результатов поиска отдать предпочтение документам той или иной тематики. Например, может потребоваться «поднять» в результатах поиска товары, которые требуют скорейшего сбыта. Для достижения подобных целей служит специальный механизм, при помощи которого можно задать требуемый вес (ранг, page rank) желаемым страницам. При отображении результатов поиска, страницы, соответствующие заданным правилам сортировки, будут отображены в самом начале списка, в соответствии с весами, указанными в правилах.

Фиксированный вес может быть присвоен:

статическим файлам (требует указания полного пути к таким файлам);

информационным блокам (дополнительно могут быть указаны тип информационных блоков, информационный блок и элемент, которым следует отдать предпочтение);

форумам (могут быть указаны форум, тема выбранного форума и сообщение).

блогам (должен быть указан ID блога).

социальной сети (могут быть указаны ID группы или ID пользователя).

Управление правилами сортировки осуществляется на странице Список правил сортировки (Настройки Поиск Правила сортировки):

Назначение или изменение правил сортировки делится на два этапа:

первый этап: управление правилами сортировки — создание, правка или удаление правил;

второй этап: обновление поискового индекса для вступления новых правил в силу.

Для создания нового правила служит кнопка Добавить, расположенная на контекстной панели.

С помощью полей формы можно выбрать модуль, для элемента которого будет настроено правило сортировки.

для статических файлов можно указать приоритет для конкретного файла;

для информационных блоков можно указать приоритет для типа инфоблоков, отдельного инфоблока, раздела и элемента инфоблока;

для модуля форумов можно создать правило для форума, темы на форуме или отдельного сообщения.

Примечание: При заполнении полей параметров можно остановиться на любом уровне. Например, можно при настройке правил для информационного блока указать только тип и сам инфоблок. Или даже на типе инфоблока.

Кроме того, укажите вес (ранг) правила. Документы, соответствующие критериям правила, будут расположены в списке результатов поиска в соответствии с рангом сортировки. Чем больше значение веса, тем выше в списке будет отображен документ.

При сохранении правило добавляется в общий список.

После создания нового правила следует выполнить обновление поискового индекса с помощью кнопки Обновить:

По окончании процедуры обновления индекса будет выведено сообщения о ее результатах:

Примечание: Чтобы после редактирования или удаления правил, изменения вступили в силу также нужно выполнить обновление индекса.

Морфологический поиск Модуль Поиск системы «1С-Битрикс: Управление сайтом» позволяет осуществлять морфологический поиск на сайте. В этом случаи при создании индекса (и, соответственно, при поиске) учитываются все формы индексируемых слов.

Например, при индексации слова телефон, база данных индекса будет учитывать различие в падежных окончаниях (телефона, телефону и т.д.), а также его множественное число (телефоны, телефонов, телефонам и т.д.).

Соответственно, при поиске по запросу телефон будут найдены страницы, содержащие не только слово телефон, но и слова телефона, телефону, телефоны, телефонов, телефонам и т.д.

Для активизации морфологического поиска нужно отметить соответствующую опцию в настройках модуля Поиск (Настройки Настройки продукта Настройки модулей

Поиск) и полностью переиндексировать сайт:

Примечание: Алгоритм морфологического анализа разбивает предложения на слова, используя в качестве разделителя все знаки, не являющиеся буквами алфавита (пробел, точка, запятая и т.п.). В то же время, существуют символы, которые, не будучи буквами, все же являются частями слов (например, дефис в слове: южноафриканский).

Чтобы в подобных случаях разбивка слов не выполнялась, в поле Cимволы, по которым не производится разделение документа на слова (при морфологическом анализе) можно указать символы, которые морфологический анализатор должен рассматривать как части слов.

Статистика Результаты статистики поисковых фраз отображаются в разделе Статистика (Настройки

Поиск Статистика). Статистику можно рассматривать в 3 разрезах:

Статистика переходов – развернутый отчет о поисковых фразах, времени ввода, места перехода, количества найденных документов и т.д.

Список фраз позволяет просмотреть список поисковых фраз, используемых людьми на сайте;

Список тегов – перечень установленных тегов сайта.

Логические операторы Поиск позволяет использовать логические операторы, облегчающие поиск нужной информации. Система допускает использование пяти видов логических операторов:

Операторы языка запросов Оператор Синонимы Описание

– &nbsp– &nbsp–

Примеры использования логических операторов:

свежая рыба или пылесос По такому запросу находится информация, в которой встречаются либо слова свежая и рыба, либо слово пылесос.

свежая рыба не скумбрия По такому запросу находится информация, в которой встречаются слова свежая и рыба и не встречается слово скумбрия.

свежая рыба не (селедка или ставрида) По такому запросу система найдет все страницы сайта, где упоминается свежая рыба любых сортов, кроме селедки или ставриды.

Облако тегов С помощью модуля Поиск реализована полноценная технология поиска по тегам, т.е.

индексирование происходит не только по тексту, но и по тегам, если они, конечно, указаны.

Достаточно часто бывает очень удобно использовать поочередно оба поисковых механизма. Например, сначала отобрать страницы по нужному тегу, а потом вести поиск с помощью поискового индекса, в отобранных по тегам результатах.

Теги — это темы информационного сообщения. Под информационным сообщением понимается многое: элемент инфоблока, сообщение в форуме, блоге, теги фотографий и так далее.

На данный момент ввод тегов возможен в статистических страницах, элементах информационных блоков, в блогах и форумах. Формат ввода тегов: через запятую и пробел.

Добавление тегов к материалам сайта Например, укажем теги для элемента инфоблока. Для этого перейдем на закладку

Дополнительно формы редактирования параметров инфоблока:

Причем при вводе первых букв тега, система подсказывает теги, которые уже есть в продукте с сортировкой по частоте использования или по имени (при установленном флажке правее поля Теги). Такая возможность позволяет пользователям выбирать сходные теги, допускать меньше ошибок, что обеспечивает лучший поиск по тегам.

Кроме того, имеется возможность создавать теги из публичной части сайта. Например, при создании новой темы на форуме:

Таким образом, за счет расширения функционала модуля поиска, реализован полноценный механизм индексации материалов сайта по тегам.

Облако тегов Теперь рассмотрим, как используется механизм поиска по тегам, имеющий название Облако тегов.

Облако тегов – это визуальное представление списка ярлыков (или категорий).

Частота упоминаний, ссылок в Интернете с определенного сайта, терминов, имен отображается на специальной странице в виде изображения этих слов в формате гиперссылок. Размер тега тем больше, чем выше релевантность данного слова (термина, имени), т.е. чем больше размер, тем больше документов на сайте связано этим тегом. Цвет тега говорит о том, как давно этот тег был использован в документах последний раз.

Для реализации этого механизма в модуле Поиск имеются компоненты: Облако тегов (bitrix:search.tags.cloud), Форма ввода тегов (bitrix:search.tags.input) и Стандартная страница поиска (bitrix:search.page) (для компонента добавлен шаблон tags с поддержкой облака тегов).

Рассмотрим на примере, как разместить облако тегов на сайте. Для этого создадим новую страницу, в рабочей области которой разместим компонент Облако тегов (bitrix:search.tags.cloud):

Для просмотра результата перейдем в публичный раздел:

Примечание: Предварительно должны быть настроены теги к материалам сайта, в противном случае страница будет пустой.

Воспользуемся какой-нибудь ссылкой, например, компонент. По ссылке перейдем к странице поиска, для создания которой использовался компонент Стандартная страница поиска (bitrix:search.page) с шаблоном tags:

На этой странице облако тегов перестраивается, выводятся только те теги, которые соответствуют результатам поиска по первому тегу. Если вы используете строку поиска, то это также приводит к перестроению облака на основании результатов.

Google Sitemap Google Sitemap – простой инструмент управления доставкой информации о страницах сайта в базу данных Google, одной из самых мощных и популярных поисковых систем.

Применение Google Sitemap особенно важно для динамических сайтов, страницы которых генерируются автоматически, поскольку это гарантирует наличие информации обо всех страницах сайта в базе данных Google.

Примечание: Формат Google Sitemap поддерживается многими поисковыми системами, в частности, Yandex’ом.

Инструмент Google Sitemap позволяет получить гарантию того, что:

поисковая система Google проиндексирует все имеющиеся в этом файле страницы вашего сайта Google будет регулярно сканировать этот файл на наличие новых страниц для индексации.

В результате:

Уменьшение нагрузки на сайт за счет более быстрого нахождения и добавления страниц сайта в индекс Google и более быстрого нахождения Google’ом изменившихся страниц.

Более быстрое попадание сайта в результаты поисковой выдачи Google.

Более полное индексирование сайта поисковой системой. Часто определенное количество страниц сайта не индексируется, хотя ссылки, ведущие на них, корректно распознаются поисковыми роботами. Причина – расположение ссылок на эти страницы в глубине сайта, т.е. поисковый робот просто не доходит до них и, соответственно, не находит эти страницы.

– &nbsp– &nbsp–

Файлы Google Sitemap по своей сути являются XML-файлами, однако создание их вручную крайне трудоемко и требует много времени. При помощи формы Создание Google Sitemap можно быстро создать карту сайта для передачи ее Google.

Форма создания Google Sitemap доступна на странице Создание Google Sitemap (Настройки Поиск Google Sitemap):

Внимание! При создании файлов Google Sitemap все файлы вида sitemap_*.xml, расположенные в корневой папке выбранного сайта, будут перезаписаны.

– &nbsp– &nbsp–

Если отметить опцию Включать в Google Sitemap только темы форумов, но не сообщения, то при создании в карту будут писаться только первые сообщения темы форума с датой модификации, равной последнему добавленному в тему сообщению.

После генерации файл индекса для Google Sitemap будет доступен для скачивания на локальный компьютер:

Адреса файлов в сообщении выведены в виде гиперссылок. То есть, файлы можно открыть в другой закладке браузера, не загружая файлы на локальный компьютер.

Инструмент при создании файла не использует все возможности Google Sitemap. В частности не используются теги changefreq и priority. После создания файла Google Sitemap вы можете открыть его для редактирования и вручную добавить указанные теги с параметрами.

Примечание:

Тег Change frequency – говорит о том, как часто обновляется веб-страница.

Возможные значения: never, weekly, daily, hourly, monthly, yearly.

Тег Рriority – устанавливает приоритет, который Google назначит для конкретной веб-страницы в ранжировании страниц вашего сайта. Возможные значения: 0.0 (низший приоритет), 1.0 (высший приоритет), 0.5 (средний приоритет).

Полезные советы Эффективность полнотекстового поиска можно значительно увеличить, если исключить из индекса слова встречающиеся очень часто. Например, если в каждом сообщении на форуме встречается слово привет, то поиск по этому слову выдаст все сообщения, что не может удовлетворить инициатора такого запроса. Такие слова называются «СТОП словами».

Практика показывает, что при использовании списка стоп-слов размер индекса уменьшается примерно на 10–15%, а возможный прирост скорости поиска бывает в десятки раз (20–50).

Рассмотрим 3 этапа решения поставленной задачи:

Определение наиболее «популярных» слов Исключение слов из полнотекстового индекса Переиндексация Определение наиболее «популярных» слов Первое, что необходимо сделать – это определить СТОП слова, для этого выполните следующее:

Перейдите на страницу SQL запрос (Настройки Инструменты SQL запрос)

Выполните следующий запрос:

select STEM,count(*) from b_search_content_stem group by STEM order by count(*) desc limit 100 В результате на странице будут отражены 100 самых популярных терминов на сайте:

Внимание: Этот запрос может быть очень «тяжелым». Не торопитесь и выполните его во время наименьшей нагрузки на сайт. Если есть актуальная резервная копия не на удаленном сайте, то лучше выполнить его на ней.

Как вариант можно создать страницу со следующим содержимым:

Это позволит быстро скопировать список самых популярных слов.

Внимание: Обязательно удалите эту страницу после ее выполнения!

Исключение слов из полнотекстового индекса Для исключения слов из полнотекстового индекса и поисковых запросов добавьте в

init.php через запятую слова, которые необходимо исключить:

define(«STEMMING_STOP_RU», «ЗДЕСЬ, СПИСОК, СТОП, СЛОВ»);

Примечание: Система поддерживает стемминг 2-х языков русского и английского.

Для первого обрабатывается константа STEMMING_STOP_RU, для второго – STEMMING_STOP_EN.

Переиндексация После внесенных изменений необходимо выполнить полную переиндексацию для обновления поискового индекса.

Обновление индексных таблиц выполняется с помощью формы Переиндексация сайта (Настройки Поиск Переиндексация).

Примечание: Подробнее про индексацию смотрите на странице Индексация.

Обратите внимание:

Наиболее эффективным будет удаление/установка модуля поиска без сохранения таблиц.

Начиная с версии форума 5.9.3, у модуля появилась настройка, значительно ускоряющая переиндексацию – Количество документов, переиндексируемых за шаг. Разумное значение 2–3 тысячи.

По окончании переиндексации обязательно необходимо выполнить оптимизацию БД на странице Проверка/восстановление таблиц (Настройки Инструменты Оптимизация БД).

Типичные ошибки Поиск выдает ссылки на несуществующие страницы (404 — HTTP not found) Неправильно указанный URL страницы детального просмотра элемента в настройках информационного блока приводит к ошибкам поиска. Этот URL используется при формировании страницы результатов поиска – соответственно, если проставленный в настройках инфоблока URL указывает на несуществующую страницу, то по ссылке пользователь попадт не на страницу детального просмотра найденного элемента, а на 404-ю.

Примечание: Для того чтобы разделы и элементы инфоблока участвовали в поиске в форме настройки инфоблока, также должны быть установлены опции Индексировать разделы для модуля поиска и Индексировать элементы для модуля поиска. Подробное описание полей формы можно посмотреть на странице пользовательской документации.

Также похожая ситуация возникает, если компонент работает в режиме ЧПУ, а URL, выставленный в этом поле, не в ЧПУ – в этом случае следует указать URL по правилами ЧПУ.

Проблема может возникать и ссылками на страницы форума и блога. В этом случае следует проверить корректность шаблона пути к сообщению форума, блога.

Внимание! После изменения путей обязательно выполните переиндексацию сайта.

nauka.x-pdf.ru


You May Also Like

About the Author: admind

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *

Этот сайт использует Akismet для борьбы со спамом. Узнайте, как обрабатываются ваши данные комментариев.