September 2005


Поисковые системы6 September 2005

Недавно мы уже говорили о прогрессивных разработках в области поиска. На SearchEngines.ru опубликован перевод заметки об интересной технологии поиска Autonomy Search, которая кроме того, что умеет структурировать различные виды медиа (e-mail, аудио, видео, фото), способна распознавать речь и индексировать эти слова для поиска. К сожалению, первоначальный источник материала на сайте Financial Times временно недоступен, цитирую перевод:

Неболь?ая британская группа Autonomy по разработке ПО в последнее время работала над потенциально революционной концепцией, способной составить серьёзную конкуренцию Yahoo и Google. Autonomy подписала согла?ение с одной из крупней?их интернет-компаний в Китае – China Netcom Broadband – с количеством подписчиков, превы?ающим цифру в 110 миллионов. По условиям Согла?ения, созданный британцами сервис позволит потребителям в Китае производить в интернете поиск новостей и видеоклипов у 25 местных и национальных ТВ-компаний.

ПО от Autonomy производит поиск и каталогизацию неструктурированных данных – электронной почты, фото- и видеоматериалов – и до настоящего времени использовалось различными компаниями для сортировки внутрикорпоративной информации. Поисковик Blinkx, работающий на технологии от Autonomy, делает то же самое, хотя и в мень?их мас?табах. Согла?ение, достигнутое в Китае, позволит открыть технологии от Autonomy более ?ирокие возможности и, в преддверии возможного – по мнению некоторых обозревателей – слияния телевидения и интернета, сделает подобную услугу просто незаменимой.

Google и Yahoo полагаются на ручную разметку (tagging) для каталогизации видеоматериалов, чтобы получить возможность производить поиск такого контента. Autonomy же использует ПО для распознавания голоса, которое автоматически каталогизирует произносимые слова. Данная технология составит также серьёзную конкуренцию поисковым ма?инам (включая Google, MSN и Yahoo) в Китае, поскольку обычные поисковики имеют сложности при обработке идеограмматических текстов.

500 поисковиков5 September 2005

Поисковая система TorrentSpy, предназначенная для сети BitTorrent, производит индексирование файлов torrent, которые находит в сети или с помощью пользователей, распространяющих такие файлы. Помимо обычного поиска в TorrentSpy существует рас?иренный поиск, а также каталог доступных файлов torrent. ?з-за свободной возможности скачивания и распространения файлов возникают правовые противоречия, поэтому поисковик приветствует участие пользователей в выявлении незаконных копий в индексе TorrentSpy.

TorrentSpy Пользователь, который осуществляет поиск в TorrentSpy, получает следующее сообщение: «Предупреждение: распространение аудио-, видео- файлов и программного обеспечения, не имеющих официального коммерческого релиза, может рассматриваться как уголовное правонару?ение. TorrentSpy будет признателен, если вы поможете нам удалить такие файлы из на?ей базы.»

Что такое BitTorrent? Wikipedia дает следующий ответ: «Файлообменный протокол BitTorrent используется для передачи боль?их файлов (например, фильмы, образы дисков), которые делятся на неболь?ие части, обычно по четверти мегабайта. Эти части распространяются среди пользователей, а затем могут быть восстановлены в первоначальный файл. Каждый пользователь пирингововй сети скачивает недостающую часть файла с другой ма?ины, с которой установлено наиболее луч?ее соединение, в свою очередь предоставляя другим пользователям возможность скачивать имеющиеся части файла»

Оригинал: TorrentSpy BitTorrent Search Engine – Spotlight #2

Поисковые системы5 September 2005

На SearchEngines.ru оказывается опубликована статья Николая Евдокимова «Поисковая оптимизация: от вне?него к внутреннему», в которой автор описывает цепь изменений в алгоритмах крупных поисковых систем, который в будущем могут привести нас к полному и безоговорочному господству контента (оптимизированного).

Мысль автора понятна, я даже очень хочу в это верить. Но вот несколько фраз в предпоследних двух абзацах очень режут слух:

Характерно, что для этого поисковая ма?ина вовсе не должна обладать искусственным интеллектом. Всё гораздо проще: задача может быть успе?но ре?ена (и уже ре?ается тем же Гуглом, в мень?е степени – Яндексом) при помощи обыкновенного контекстного анализа. Скажем, релевантность текста запросу «Наполеон» может быть вычислена просто на основе анализа слов и словосочетаний, наиболее часто употребляемых в этом контексте. Например, «торт», «полководец», «коньяк», «император». Так, текст, рассказывающий о Наполеоне Буонапарте, будет несравнимо более релевантен, чем повествование о новом ресторане «Наполеон». А разве не этого хочет пользователь, набрав?ий «наполеона» в строке поисковика?

Преимущество метода контекстного анализа текста заключается в том, что углублять его можно до бесконечности – позволяли бы ма?инные ресурсы, да была бы об?ирная база данных. Контекстные базы пополняются день за днем, да и с ресурсами у крупных поисковых систем проблем особых не возникает. А это означает, что уже в самом ближай?ем времени роль вне?них факторов и даже метатэгов может быть низведена практически до нуля. Поисковик получает возможность работать с контентом напрямую, всё более уверенно отличая качественный информативный текст от «мусора». Так что у нас есть все основания полагать, что недалек тот день, когда понятия «оптимизация» и «разработка контентного наполнения» станут синонимами.

Неужели Николай пропустил жаркие споры и дискуссии на форумах SearchEngines.ru и Seochase.com? Мы никогда не узнаем, чего же на самом деле хотел пользователь набрав?ий «наполеон» в строке поиска! ? это даже не потому, что это слово с маленькой буквы набрано. Даже если ?кольник хотел реферат, он мог легко переключиться на торт. Соответственно бросаться фразами что «такой-то текст будет более релевантен, чем этот» (по отно?ению к чему?) – очень опасно. Я не буду, но попро?у коллег высказаться и по поводу второго абзаца из приведенной цитаты: разве могут отказаться поисковики от такого обкатанного вне?него фактора как индекс цитирования (или PR) или от любимого ссылочного ранжирования?

Да, прочитав мысли Евгения Трофименко о способах ловли некоторых дорвеев, вроде немного успокаивае?ься – есть еще порох в пороховницах поисковиков для борьбы. Может быть действительно, Яндекс в последний раз повернулся лицом к контенту, «низвести практически до нуля» – это вряд ли. А вот словосочетание «даже метатэгов» даже меня немного улыбнуло :)

К чему все это я. Грустно, что в последнее время стало много появляться коммерческих статей. Вроде начинае?ь читать – есть мысли, но вдруг – бац!, оказывается это такая лестница к заказам соответствующих услуг. А ведь можно было очень грамотно развить идеи, взглянуть под другим углом, попытаться обратить внимание на альтернативы, подумать о пользователях, прислу?аться к словам опытных профессионалов… ? умень?ить количество ляпов.

500 поисковиков4 September 2005

Примерно год назад Mozdex стал одним из первых поисковиков с открытой системой поиска, использующей различные технологии с открытым кодом. Основу Mozdex составляет проект Nutch, это команда разработчиков поискового программного обеспечения с открытым исходным кодом. Байрон Миллер, владелец Mozdex, для начального наполнения базы поисковой системы использовал данные каталога DMOZ Open Directory Project, отсюда и название – MOZilla inDEX.

Mozdex по?ел даль?е открытого исходного кода своей технологии – он предоставляет возможность владельцам сайтов и программистам интегрировать результаты поиска в свои проекты с помощью технологий OpenSearch и OpenSearch RSS. Помимо открытого исходного кода, Mozdex имеет кластеризацию результатов найденного запроса. Попробуйте осуществить поиск с кластерами (например, «games» или «checks») и вы будете приятно удивлены полезной разбивкой поисковой выдачи в правой части страницы.

Отно?ение к поиску в Mozdex таково: «Можно предположить, что доступ к внутренностям поисковой системы поможет накрутчикам найти эффективный способ получения высоких позиций, но мы считаем, что открытый исходный код предоставляет нам возможность публично находить и обсуждать новые методы и алгоритмы, которые сделают результаты луч?е и репрезентативнее, и в то же время умень?ат количество лазеек для накрутчиков». Байрон Миллер сможет добиться своей цели, имея за собой целое сообщество разработчиков ПО с открытым кодом.

Оригинал: Mozdex Open Source Search Engine – Spotlight #1

500 поисковиков3 September 2005

Search Engine Journal

Отметить свое более чем 2-х летнее существование ре?ил блог Search Engine Journal. Лорен Бейкер (Loren Baker), автор этого журнала, начинает цикл публикаций под названием «В свете софита: 500 поисковых систем».

Лорен Бейкер отмечает, что в новостях и статьях часто упоминают известные поисковики, такие как MSN, Google, и Ask Jeeves, но несправедливо обходят стороной специализированные поисковые системы, которые также заслуживают внимания. Лорен ре?ил провести обзоры пяти сотен поисковых ма?ин, в обзорах будет указываться информация о поисковике, его ни?а на рынке, направления развития. Также автор планирует брать интервью у владельцев этих сайтов, обсуждать упомянутые поисковые системы, а в завер?ении представить список всех 500 поисковых систем.

Я буду следить за столь интересным начинанием и переводить обзоры.

Update: Лорен Бейкер прислал по e-mail разре?ение на перевод и публикацию его обзоров.

SEO2 September 2005

О новом веянии в SEO бизнесе недавно рассказал Андрей ?ванов в 85 выпуске рассылки «Продвижение сайта. Профессиональные советы экспертов»: сдача в аренду раскрученных сайтов, находящихся на первых позициях по определенным запросам.

? вот мы становимся свидетелям зарождения еще одной схемы в поисковом продвижении: предоставление бесплатного хостинга и домена сайтам с интересным проектами с проставлением обязательной ссылки на определенный сайт. Такие предложения не новость, многие хостеры предоставляют место для заинтересовав?их их проектов под различные условия, но появление соответствующих объявлений на SEO форуме (первое, второе, третье) придает другой характер этому явлению. По сути это и схема бесплатного хостинга с обязательной установкой баннеров адаптированная под SEO нужды.

Владелец хостинга (или реселерского аккаунта) получит контент и места для ссылок на свои рабочие сайты. То есть он не сдает в аренду, а берет в аренду площадки для рекламы, причем имеет только накладные расходы, ведь он ничего не платит владельцам проектов. Я не специалист в линк науке, но думаю, что такие вещи могут попасть под пристальное внимание поисковых систем, если ссылки будут находиться на одном и том же IP.

SEO1 September 2005

В Рунете открылся еще один SEO блог – seoblog.biz «?нтернет-Маркетинг и SEO по-RUсски». Автор ?горь известен на форуме как Offshore. Сразу могу сказать – это будет действительно интересный блог с переводами английских статей и оригинальными мыслями.

Вот, к примеру, впервые берется интервью у SEO?ника – вопросы задаются Greenwood’у, известный персонаж и уважаемый специалист по PPC. Надо заметить, что Greenwood успел пробежаться по отдельным личностям с форума SE.ru в своем блоге, и вот теперь настало время рисовать его собственный портрет.

Страница 5 (всего 5)« начало...«12345