Блог СоНоты углядел новость от мета-поиска Нигма. Нигма собирается создать свой индекс Рунета и стать не мета-поиском, а просто поиском. Альфа-тестирование закончится уже к концу года (торопятся успеть рань??е Вебальты).
Нигма ре??ила начать гонку размера индекса в Рунете. На Западе, как мы помним, размер индекса почти в два раза боль??ий для Yahoo абсолютно ничего не изменил.
| Поисковая система | Запрос и количество найденных документов | |||
| кондиционеры | 2 | seo | камертон | |
| Нигма | 17 593 614 | 496 268 914 | 1 641 135 | 261 580 |
| Яндекс | 9 463 590 | 304 163 542 | 603 126 | 182 836 |
?? это после того, как Яндекс почистил базу от дублей, Нигма будет хвастаться миллиардом документов. Каких документов?
Двухстадийный алгоритм морфологического поиска – если на??лось точное вхождение запроса, то вторая стадия (собственно морфология) не включается. Второй Google? Вроде морфология при каждом запросе работает. Каков же тогда порог, при котором считается, что найдено сли??ком мало документов и нужно включать морфологию?

Количество результатов Нигмы — это только из её собственного индекса, или с учётом мета-поиска ?
Только из ее индекса. Там это можно сделать, сняв ненужные галочки.
сейчас если найдено более 400 документов, морфология при поиске не включается. но при аннотировании найденных документов мы морфологию используем всегда. а у гугла морфологии нету, ср. запрос «экслерами» с «экслер».
Виктор, спасибо за цифры. Можно сказать, что морфология у вас всегда работает 🙂 Не получается придумать такие запросы, в ответ на которые в Нигме будет найдено мень??е 400 документов 🙂
ммм.. а вот на запрос «амфибрахий» нигма выдаёт 265 документов) а я??а 1 358
кстати интересно как у них считается релевантность документа с морфологически изменёным словом, относительно документа с точным вхождением….
Есть гипотеза, что Нигма по запросу не число документов в своей базе показывает, а оценку этого числа для всего РуНета, по типу как они считали сколько всего документов в РуНете.
Что-то слабо верится, чтобы поисковик, выдающий боль??е документов чем Яндекс по всем четырём случайным запросам, работал на одной ма??инке 🙂
Ещё запрос подсказали «Гоаие» — нигма ничего не находит 🙂 А яндекс — молодец 🙂