Google подал заявку на патент о системе и методах индивидуальной сортировки результатов поиска Personalization of placed content ordering in search results. Летом мы уже слы?али о заявках на патенты для рекламных объявлений, связанные с таргетингом и персонализацией на основе истории поведения пользователя. Сейчас мы видим попытки Google использовать собранную информацию о пользователе для ранжирования результатов поиска:

A system and method for using a user profile to order placed content in search results returned by a search engine. The user profile is based on search queries submitted by a user, the user’s specific interaction with the documents identified by the search engine and personal information provided by the user. Placed content is ranked by a score based at least in part on a similarity of a particular placed content to the user’s profile. User profiles can be created and/or stored on the client side or server side of a client-server network environment.

Основа новой системы ранжирования – индекс профиля (Profile Rank), как дальней?ее развитие Page Rank и существующего алгоритма ранжирования. Нужно заметить, что новая система имеет отличия от персонализированного поиска. Google Personalized Search работал только внутри самого поиска, когда пользователь согла?ался составлять свою историю запросов и когда он был зарегистрированным пользователем. Profile Rank следит за действиями пользователя даже когда он не работает в поисковой системе Google. Дополнительную информацию, такую как возраст, образование, географическое положение и т.д., пользователь может раскрывать по своему желанию.

?нтересно, что каждый документ будет иметь свой вес, в том числе в зависимости от тематики. У каждого сайта может быть свой индекс QueryScore, зависящий от соответствия запросу. Далее вычисляется GenericScore=QueryScore*PageRank. А Profile Rank, или PersonalizedScore, будет рассчитываться по формуле, в которой используются меры соответствия найденного документа параметрам из профиля пользователя: PersonalizedScore=GenericScore*(TermScore+CategoryScore+LinkScore)

В патенте учтена ситуация, когда за одним компьютером могут работать несколько пользователей, например, в библиотеках. ?дентификация пользователя может осуществляться при его авторизации на сайте. Возможен также другой способ. Google предлагает определять пользователя по тому, как он перемещает курсор мы?ки, печатает на клавиатуре, по разному использует разные программы.

Должно быть очень занимательное чтиво, правда довольно объемное. Лорен Бейкер с Search Engine Journal предлагает даже распечатать и перечитывать по нескольку раз. Ведь здесь можно многое почерпнуть о будущем развитии поиска в Google.