Нигма хочет свой индекс

Блог СоНоты углядел новость от мета-поиска Нигма. Нигма собирается создать свой индекс Рунета и стать не мета-поиском, а просто поиском. Альфа-тестирование закончится уже к концу года (торопятся успеть рань??е Вебальты).

Нигма ре??ила начать гонку размера индекса в Рунете. На Западе, как мы помним, размер индекса почти в два раза боль??ий для Yahoo абсолютно ничего не изменил.

Поисковая система Запрос и количество найденных документов
кондиционеры 2 seo камертон
Нигма 17 593 614 496 268 914 1 641 135 261 580
Яндекс 9 463 590 304 163 542 603 126 182 836

?? это после того, как Яндекс почистил базу от дублей, Нигма будет хвастаться миллиардом документов. Каких документов?

Двухстадийный алгоритм морфологического поиска – если на??лось точное вхождение запроса, то вторая стадия (собственно морфология) не включается. Второй Google? Вроде морфология при каждом запросе работает. Каков же тогда порог, при котором считается, что найдено сли??ком мало документов и нужно включать морфологию?

Нигма хочет свой индекс: 7 комментариев

  1. Maxime

    Количество результатов Нигмы — это только из её собственного индекса, или с учётом мета-поиска ?

  2. minaton Автор записи

    Только из ее индекса. Там это можно сделать, сняв ненужные галочки.

  3. лавренко

    сейчас если найдено более 400 документов, морфология при поиске не включается. но при аннотировании найденных документов мы морфологию используем всегда. а у гугла морфологии нету, ср. запрос «экслерами» с «экслер».

  4. minaton Автор записи

    Виктор, спасибо за цифры. Можно сказать, что морфология у вас всегда работает 🙂 Не получается придумать такие запросы, в ответ на которые в Нигме будет найдено мень??е 400 документов 🙂

  5. Shegiya

    ммм.. а вот на запрос «амфибрахий» нигма выдаёт 265 документов) а я??а 1 358
    кстати интересно как у них считается релевантность документа с морфологически изменёным словом, относительно документа с точным вхождением….

  6. Maxime

    Есть гипотеза, что Нигма по запросу не число документов в своей базе показывает, а оценку этого числа для всего РуНета, по типу как они считали сколько всего документов в РуНете.
    Что-то слабо верится, чтобы поисковик, выдающий боль??е документов чем Яндекс по всем четырём случайным запросам, работал на одной ма??инке 🙂

  7. Maxime

    Ещё запрос подсказали «Гоаие» — нигма ничего не находит 🙂 А яндекс — молодец 🙂

Добавить комментарий