Сервис «Новотека: персональный поиск» объявил о возможности открыть в публичный доступ сделанный пользователем поисковик. Это значит, что можно создать поисковик по определенному количеству сайтов и открыть его для всех.

?нтерфейс сервиса сделан с учетом того, чтобы им могла пользоваться самая ?ирокая аудитория с разным уровнем навыков. Сайты индексируются 1 раз в день, общее место выделяемое для базы – 1 Гб. Для каждого сайта можно установить квоту на размер выкаченной информации.

На одном аккаунте можно создавать несколько поисковиков. Под каждый созданный поисковик выделятся адрес на сервере Новотеки, но есть возможность установки скриптов на своем сайте. Вне?ний вид легко меняется с помощью файла CSS.

Посмотреть на работу сервиса можно на примере поисковиков:

Сервис Персонального поиска Новотеки работает в бета-версии, но уже сейчас имеются достаточно гибкие настройки каждого сайта и каждого поиска.

?горь А?манов кратко обозначил будущее развитие сервиса: «Даль?е мы планируем дать пользователям разнообразные средства настройки, статистику, возможность обмениваться поисковиками и т.п.» В платной версии сервиса, когда он покинет бету, результаты работы можно будет забирать в XML формате. При ранжировании документов вне?ние ссылки не учитываются. ?мя робота – Novoteka personal search/1.0.

Важное отличие Персонального поиска Новотеки от сервиса Rollyo или от платформы Alexa Web Search: пользователь сам управляет индексацией. Подробнее – в комментариях на Вебпланете.

Теперь личные впечатления от усиленного тестирования сервиса.

В поиске работают операторы языка запросов, используемые в Новотеке. Кстати, чтобы узнать количество документов в базе конкретного поисковика, можно ввести в форму запроса точку.

Сейчас, мне кажется, в сервисе не хватает следующих возможностей:

  • группировки по сайтам (или доменам) в выдаче
  • использования запрещающих и разре?ающих масок для страниц (сейчас только по папкам в домене)
  • вывода общего количества проиндексированных документов
  • объединение сайтов, подлежащих индексации, в группы
  • выбора сортировки результатов по релевантности и по времени

Я считаю, что главная отличительная черта у тематического поисковика – чистота его индекса, иначе он не будет отличаться от Яндекса. Чистоты индекса можно добиться только добавляя в индексацию строго определенные домены, то есть не методом исключений, а методом разре?ений – по принципу «индексировать ТОЛЬКО то что разре?ено». Поэтому прежде всего хотелось бы чтобы в качестве разре?енных или запрещенных URL воспринимались не только папки или домены, но и более сложные комбинации. Например, для литературного форума магазина «Все книги России» мы могли бы добавить только одну разре?ающую маску: http://www.knigirossii.ru/forum/viewtopic.php?p=, что означало бы, что индексируются только страницы обсуждений и не индексируются не нужные нам профили пользователей, служебные страницы, версии для печати и т.д.

?того: Время для представления публике такого сервиса выбрано крайне подходящим. Когда везде слы?ны возгласы недовольных текущим положением дел в боль?их поисковых сервисах, когда в Рунете появились несколько новых PPC, из-за которых дорвейщики стали обращать внимание на русскоязычные поисковые ма?ины, когда количество сайтов в Рунете еще не сильно велико и можно вручную (и даже по памяти) собрать нужные тематические ресурсы. Появление тематических поисковиков должно всем понравится. Даже в бета-версии функциональности Персонального поиска Новотеки вполне хватает. В интерфейсе я не обнаружил ни одного бага. Разработчики откликаются на каждое письмо с подробным ответом и принимают все комментарии к сведению.