Нигма хочет свой индекс
Блог СоНоты углядел новость от мета-поиска Нигма. Нигма собирается создать свой индекс Рунета и стать не мета-поиском, а просто поиском. Альфа-тестирование закончится уже к концу года (торопятся успеть раньше Вебальты).
Нигма решила начать гонку размера индекса в Рунете. На Западе, как мы помним, размер индекса почти в два раза больший для Yahoo абсолютно ничего не изменил.
| Поисковая система | Запрос и количество найденных документов | |||
| кондиционеры | 2 | seo | камертон | |
| Нигма | 17 593 614 | 496 268 914 | 1 641 135 | 261 580 |
| Яндекс | 9 463 590 | 304 163 542 | 603 126 | 182 836 |
И это после того, как Яндекс почистил базу от дублей, Нигма будет хвастаться миллиардом документов. Каких документов?
Двухстадийный алгоритм морфологического поиска – если нашлось точное вхождение запроса, то вторая стадия (собственно морфология) не включается. Второй Google? Вроде морфология при каждом запросе работает. Каков же тогда порог, при котором считается, что найдено слишком мало документов и нужно включать морфологию?
URL записи: http://blog.seotext.ru/se/281/
URL для trackback: http://blog.seotext.ru/se/281/trackback/



Количество результатов Нигмы - это только из её собственного индекса, или с учётом мета-поиска ?
Только из ее индекса. Там это можно сделать, сняв ненужные галочки.
сейчас если найдено более 400 документов, морфология при поиске не включается. но при аннотировании найденных документов мы морфологию используем всегда. а у гугла морфологии нету, ср. запрос “экслерами” с “экслер”.
Виктор, спасибо за цифры. Можно сказать, что морфология у вас всегда работает
Не получается придумать такие запросы, в ответ на которые в Нигме будет найдено меньше 400 документов 
ммм.. а вот на запрос “амфибрахий” нигма выдаёт 265 документов) а яша 1 358
кстати интересно как у них считается релевантность документа с морфологически изменёным словом, относительно документа с точным вхождением….
Есть гипотеза, что Нигма по запросу не число документов в своей базе показывает, а оценку этого числа для всего РуНета, по типу как они считали сколько всего документов в РуНете.
Что-то слабо верится, чтобы поисковик, выдающий больше документов чем Яндекс по всем четырём случайным запросам, работал на одной машинке
Ещё запрос подсказали “Гоаие” - нигма ничего не находит
А яндекс - молодец 