Настройки поиска по вашему сайту»

Алгоритм ранжирования поиска по сайту

Таблица релевантности (первое поколение)

После значительного улучшения алгоритмов работы поискового сервиса - поиск стал вестись не только по тексту, но и по заголовкам (<title></title>) страниц.

Ниже приведена таблица релевантности суть которой - показать как происходит выбор наиболее релевантной страницы.

«Строгое соответствие» означает что найдено точное совпадение запроса с текстом страницы
«Не строгое соответствие» означает что найдено не точное (со склонениями) совпадение запроса с текстом страницы
«Не найден» означает что запрос не найден в тексте страницы

Наиболее релевантной считается та страница, которая набрала наибольшее количество очков.




Переработана таблица релевантности с учетом поиска по ссылкам. (второе поколение - текущее)

Реализована возможность поиска по тексту ссылок. Т.е. если на какую либо страницу идет ссылка с текстом релевантным запросу пользователя то такая страница считается релевантной.

При выводе страницы найденной по ссылке – под сниппетом отображается надпись «Найдено по ссылке» за которой следует текст ссылок на эту страницу в который была найдена искомая фраза.

Ниже приведена таблица релевантности суть, которой - показать, как происходит выбор наиболее релевантной страницы.

Данная таблиц релевантности учитывает поиск по ссылкам внутри сайта!

В самом левом столбце отображается вес страницы, в которой была найдена искомая фраза.
Наиболее релевантной считается та страница, которая имеет наибольший вес.

Основное отличие данной таблицы заключается не только в появлении еще одного столбца, но и в неравномерном распределение весов для страниц, т.е. в предыдущей таблицы левый столбец с весами страниц равномерно нарастал с верху в низ от 0 до 8 а в новой он имеет скачкообразный вид. Максимальное значение веса имеет страница, в которой искомая фраза была найдена в тексте заголовке и тексте ссылки ведущей на нее с какой либо другой страницы.

Основные принципы, выраженные в данной таблице:

  • Страница, в которой искомая фраза найдена в тексте релевантнее чем страница в которой искомая фраза была найдена в заголовке и тексте ссылки ведущей на нее с какой либо другой страницы;
  • Страница, в которой искомая фраза найдена заголовке релевантнее чем страница в которой искомая фраза была найдена в тексте ссылки ведущей на нее с какой либо другой страницы;
  • Страница, в которой искомая фраза найдена в тексте ссылки ведущей на нее с какой либо другой страницы - имеет наименьший вес.

 

Но как мы видим по таблице - распределение весов неравномерно - это накладывает следующие свойства:

  • Страница в которой искомая фраза найдена по строгому соответствию в тексте ссылки ведущей на нее с какой либо другой страницы релевантнее чем страница, в которой искомая фраза была найдена в заголовке и тексте по нестрогому соответствию;
  • Страница в которой искомая фраза найдена по строгому соответствию в заголовке релевантнее чем страница, в которой искомая фраза была найдена в тексте по нестрогому соответствию.

«Строгое» означает что найдено точное совпадение запроса с текстом страницы
«Не строгое» означает что найдено не точное (со склонениями) совпадение запроса с текстом страницы
«Не найден» означает что запрос не найден в тексте страницы