Потребность конкретного пользователя, набравшего поисковый запрос. У разных пользователей, набравших один и тот же запрос — могут быть разные потребности.
ЧТО ТАКОЕ ИНТЕНТ?
Под интентом в информационном поиске подразумевается потребность пользователя. По каждому запросу присутствует основной интент и дополнительные (дополнительные потребности). В случае с коммерческими запросами в Яндексе как раз для этого внедрена технология СПЕКТР, которая к основным результатам выдачи подмешивает сайты, соответствующие дополнительной потребности.
У большого числа запросов на самом деле есть несколько интентов, и пользователи, набравшие один и тот же поисковый запрос, могут подразумевать разные вещи. Рассмотрим запрос [такси], где существуют два основных интента. Первый — это непосредственно служба такси, например, желание вызвать такси, в аэропорт, и вторая потребность — это желание посмотреть онлайн или скачать фильм «Такси».
КЛАССИФИКАЦИЯ ПОИСКОВОГО ЗАПРОСА ПО ИНТЕНТУ
На примере запроса [телефоны Москвы] нам требуется произвести классификацию, подходит ли данный поисковый запрос для сайта, продающего мобильные телефоны. Для этого необходимо определить его интент. Для каждого поискового запроса требуется выявить топ термов, которые встречаются в результатах выдачи, то есть, в заголовках и сниппетах документов. Если мы рассматриваем запрос [телефоны Москвы], то помимо слов из запроса и их синонимов в выдаче чаще других будут встречаются следующие слова: справочник; адрес; телефонный; поиск. Исходя из этих четырех слов, можно быстро понять, что данный поисковый запрос не является коммерческим, люди в первую очередь ищут справочники и имеют желание осуществить поиск либо адреса либо телефона.
Если у вас есть задача регулярной классификации поискового запроса по интенту, есть два возможных пути. Это автоматизация и ручной труд.
Ручной труд здесь довольно неплохо решает задачу. Вам требуется посмотреть на поисковый запрос, в большинстве случаев становится понятно, какой интент у этого поискового запроса. В случае, если вам не очень понятно, вы идете в результаты выдачи Яндекса и смотрите, какие типы сайта встречаются в нем, какую тематику они содержат. Если этот тип и тематика соответствуют продвигаемому вами проекту, то вы оставляете данный запрос, если нет — отсеиваете.
Если перед вами стоит задача классификации большого семантического ядра или вы работаете в какой-то непонятной, сложной тематике, где есть смесь целевых и нецелевых поисковых запросов, вам может помочь автоматизация данного процесса. В этом случае вы по каждому поисковому запросу выявляете частотные термы, которые встречаются в выдаче, производите некоторое обучение, то есть, составляете списки стоп-слов (минус-слов), и в случае, если по поисковому запросу в топ частотных термов, которые встречаются в результатах выдачи входят эти стоп-слова, то данные фразы отсеиваются.
При работе с тематикой [телефоны], вы могли бы составить первый список из двух стоп-слов: [справочник] и [адрес]. Соответственно, по каждому поисковому запросу вы определяете топ частотных термов и производите базовую задачу классификации.
В решении задачи также помогают и дополнительные факторы. В случае с запросом [телефоны Москвы] удачно сработал фактор отсутствия объявлений в спецразмещении Яндекс.Директ. Соответственно, по запросу [телефоны Москвы] с такой частотой, отсутствие каких-либо сайтов в спецразмещении говорит о том, что запрос является либо не целевым для коммерческих сайтов, либо очень низкоконверсионным и не подходит для продвижения.
Также помогают такие факторы, как геозависимость, частота, конкуренция по запросу, но основной подход — это сбор частотных термов по фразам и дальнейшее исключение запросов с вхождением в них собранных слов-запросов.