Ведущий поисковик российского сегмента сети интернет, компания «Яндекс», анонсировал в своём блоге запуск нового алгоритма ранжирования, получившего название «Краснодар». Интерес как пользователей поисковика, так и оптимизаторов получила технология «Спектр», рассчитанная дать полные ответы на запросы, сформулированные неоднозначно.
Специалисты «Яндекса», обладая полной статистикой поисковых запросов, сообщают, что каждый пятый вопрос поисковой машине является неоднозначным. Как правило, речь идет о высокочастотных однословных запросах, например, {пицца}. Определить точно, что имел ввиду пользователь, набирая без уточняющих слов данный запрос в строке поиска крайне трудно: человек мог искать пиццерии города, телефон службы доставки пиццы на дом или рецепты приготовления пиццы в домашних условиях. По запросу {наполеон} поисковая машина должна определить, хотел ли пользователь найти информацию об историческом герое, торте или коньяке.
Проблема неоднозначных запросов касается не только однословных запросов. Так, по запросу {война и мир} часть пользователей ищет роман-эпопею Л.Н.Толстого, а часть хочет посмотреть или скачать одноименный кинофильм.
Поисковая технология «Спектр» оправдывает своё название – она учитывает сразу несколько неоднозначно определенных результатов выдачи, которые мог иметь в виду пользователь. Таким образом, человек, задающий неявный запрос поисковый машине, должен гарантированно найти ответ на свой вопрос в результатах первой десятки результатов поиска.
Как работает «Спектр»?
Поисковая технология «Спектр» обрабатывает статистику всех запросов, вводимых пользователями в строке поиска, и относит каждый запрос, называемый объектом, к определенной категории. Уже сейчас технологией выделено порядка 60 категорий, хотя специалисты Яндекса говорят, что это число будет увеличиваться. Среди наиболее популярных категорий, выделяемых уже сейчас, можно назвать «города», «поэты», «лекарства», «товары», «автомобили» и т.д. Так, запрос {калина хэтчбек} содержит слово «калина», являющийся объектом и относится к категории «автомобили», а объект «орел» относится сразу к двум категориям – «города» и «животные/птицы».
Также «Спектр» учитывает множество желаний пользователей, задающих неоднозначные запросы. К каждой из 60-ти категорий относится от 2-х до нескольких десятков желаний и потребностей человека. Так, при поиске определенного товара технология должна обеспечить пользователю не только спектр ответов на запрос, но и дать ответ на все возможные потребности, а именно информацию о том, где можно купить этот товар в регионе пользователя, предоставить ему «отзывы» и «обзоры», поскольку, как правило, именно эту информацию хотят получить люди при поиске конкретного товара.
«Спектр» оценивает также и вероятностные характеристики того, о чем именно спрашивает пользователь на основе статистики уточняющих запросов, объема информации в интернете по конкретной цели и другим данным. Таким образом, повышается вероятность нахождения ответа именно на тот вопрос, который задавал пользователь в неявном виде.
Процесс анализа поисковых запросов происходит автоматически с периодичностью несколько раз в неделю для актуальности массива данных.
Актуальность и точность информации обеспечивается в «Спектре» также и по данным интернет-справочников и энциклопедий, таких как Wikipedia, контент которых «Спектр» может обрабатывать и оперативно узнавать о неизвестных ему объектах и создавать новые категории.
Дополнительная информация: