Методы ранжирования Яндекса
В нашей статье мы рассмотрим методы ранжирования, которые применяются в технологии Спектр и классификация алгоритмов ранжирования применительно к Яндексу. Для продвижения сайта важно понимать то, как именно и по каким принципам формируются списки выдачи в поисковых системах. Поэтому необходимо изучение ранжирования применительно к информационному поиску (Learning to Rank for Information Retrieval).
Методы ранжирования можно условно классифицировать на три вида:
1. Поточечный подход (pointwise approach) — в этом подходе для каждой пары запрос-документ выдается какое-то численное значение, характеризующая релевантность (та самая дырка в XML выдаче и значение Relevance). И сам Поточечный подход может использоваться в методах машинного обучения.
2. Попарный подход (pairwise approach) — в попарном подходе на вход системы подаются два документа, которые необходимо сравнить. Т.е. из двух документов выбирается документ, который наилучшим образом выдает ответ на запрос.
3. Списочный подход (listwise approach) — в данном случае на вход поступают сразу все документы, которые отвечают на запрос-документ. Дальше применяется какая-либо ранжирующая модель, благодаря которой на выходе получаем отранжированный список.
Например, Матрикснет ложится в классификацию Learning to Rank for Information Retrieval, т.е. его можно причислить к Поточечному подходу, однако сама технология Спектр не ложится в классификацию Learning to Rank for Information Retrieval.
Да и в итоге сам Спектр является гибридным методом, т.к. условно говоря, на входе модель ранжируется по Поточечному подходу, а на выходе, при построении итоговой выдачи, список формируется по Списочному подходу.
Т.е. сами по себе поисковые системы не используют в чистом виде какой-то конкретный подход, а на различных этапах расчета могут применяться различные классификаторы ранжирования.
А напоследок дарю полезную ссылку — вот вам опера на компьютер, с возможностью дополнить ее всяческими плагинами и прочими дополнениями. Кстати, никак не соберусь написать в этом блоге о том, как настроить экспресс-панель в опере под себя, но когда-нибудь руки мои доберутся и вы узнаете, как сделать в экспресс-панели оперы не 9 и не 25 эскизов, а хоть 200.