Алгоритм ранжирования поиска по сайту
Таблица релевантности (первое поколение)
После значительного улучшения алгоритмов работы поискового сервиса - поиск стал вестись не только по тексту, но и по заголовкам (<title></title>) страниц.
Ниже приведена таблица релевантности суть которой - показать как происходит выбор наиболее релевантной страницы.
«Строгое соответствие» означает что найдено точное совпадение запроса с текстом страницы
«Не строгое соответствие» означает что найдено не точное (со склонениями) совпадение запроса с текстом страницы
«Не найден» означает что запрос не найден в тексте страницы
Наиболее релевантной считается та страница, которая набрала наибольшее количество очков.
Переработана таблица релевантности с учетом поиска по ссылкам. (второе поколение - текущее)
Реализована возможность поиска по тексту ссылок. Т.е. если на какую либо страницу идет ссылка с текстом релевантным запросу пользователя то такая страница считается релевантной.
При выводе страницы найденной по ссылке – под сниппетом отображается надпись «Найдено по ссылке» за которой следует текст ссылок на эту страницу в который была найдена искомая фраза.
Ниже приведена таблица релевантности суть, которой - показать, как происходит выбор наиболее релевантной страницы.
Данная таблиц релевантности учитывает поиск по ссылкам внутри сайта!
В самом левом столбце отображается вес страницы, в которой была найдена искомая фраза.
Наиболее релевантной считается та страница, которая имеет наибольший вес.
Основное отличие данной таблицы заключается не только в появлении еще одного столбца, но и в неравномерном распределение весов для страниц, т.е. в предыдущей таблицы левый столбец с весами страниц равномерно нарастал с верху в низ от 0 до 8 а в новой он имеет скачкообразный вид. Максимальное значение веса имеет страница, в которой искомая фраза была найдена в тексте заголовке и тексте ссылки ведущей на нее с какой либо другой страницы.
Основные принципы, выраженные в данной таблице:
- Страница, в которой искомая фраза найдена в тексте релевантнее чем страница в которой искомая фраза была найдена в заголовке и тексте ссылки ведущей на нее с какой либо другой страницы;
- Страница, в которой искомая фраза найдена заголовке релевантнее чем страница в которой искомая фраза была найдена в тексте ссылки ведущей на нее с какой либо другой страницы;
- Страница, в которой искомая фраза найдена в тексте ссылки ведущей на нее с какой либо другой страницы - имеет наименьший вес.
Но как мы видим по таблице - распределение весов неравномерно - это накладывает следующие свойства:
- Страница в которой искомая фраза найдена по строгому соответствию в тексте ссылки ведущей на нее с какой либо другой страницы релевантнее чем страница, в которой искомая фраза была найдена в заголовке и тексте по нестрогому соответствию;
- Страница в которой искомая фраза найдена по строгому соответствию в заголовке релевантнее чем страница, в которой искомая фраза была найдена в тексте по нестрогому соответствию.
«Строгое» означает что найдено точное совпадение запроса с текстом страницы
«Не строгое» означает что найдено не точное (со склонениями) совпадение запроса с текстом страницы
«Не найден» означает что запрос не найден в тексте страницы