Как Яндекс вручную оценивает релевантность
Ниже публикую инструкцию Яндекса для своих асессоров по ручной оценке страниц на предмет их соответствия поисковому запросу. Копия этой инструкции предоставлена Николаем Дубровским (Коля Дубр) 2 апреля 2010 г. Оригинал смотрите на странице
http://dubrowsky.ya.ru/replies.xml?item_no=4226&ncrnd=2190.
- Предварительная оценка
Шкала предварительной оценки состоит из оценок "404", "Вирус", ..., "Порноконтент", "Порнореклама", "Порноконтент+реклама"
Это технические опции, которые непосредственно не относятся к релевантности. Если документ с виду не содержит порноконтент, ставим оценку "не порно" и т.д.
После того, как предварительная оценка поставлена, открывается основная шкала.
- Оценка по шкале релевантности
Шкала релевантности содержит семь оценок: "Витальны", "Полезный", "Релевантный+", "Релевантный-", "Нерелевантный", "Спам", "Не про то".
- Витальный сайт - официальный сайт предприятия, товара, услуги, сервиса или человека. Также витальные страницы есть у законов, официальных документов (в том числе инструкций) и художественных произведений. Далеко не каждый запрос
предполагает существование витального сайта, но по некоторым запросам их может быть два и больше. Одним словом, главный критерий витального сайта - официальный ответ на запрос.
- Полезный ресурс не только отвечает на запрос, но кроме этого дает пользователю дополнительную информацию по его запросу. Также оценку "Полезный" заслуживают тематические сайты, с большим количеством информации по интересующей теме, а еще
поддомены витального сайта, сайты филиалов искомой фирмы или факультетов искомого вуза.
- Релевантный+ - документ отвечает на запрос пользователя.
- Релевантный- документ соответствует теме запроса, но на сам запрос не отвечает. Например, для запроса "карта-схема города Твери" релевантным- будет либо карта не того типа (топографическая или др.), либо карта одного района Твери вместо
всего города, либо карта в слишком мелком масштабе.
- Нерелевантный документ не отвечает запросу.
- Спам - это вредоносные сайты и страницы. Обман пользователя, бессмыслица и мусор.
- Не про то - это оценка для документов, которые содержат слова запроса, но смысл запроса в них искажен. Это может происходить из-за омонимии, разрыва словосочетания, пропуска важного слова, поиска других форм слова. Когда по запросу "Лев
Толстой" находят Татьяну Толстую или вообще материалы про полных людей - это "не про то".
Знание этой инструкции охладит те горячие головы, которые попробуют воспользоваться вроде как нестандартными путями продвижения сайтов, на деле являющиеся чистой авантюрой.