Поисковые системы28 August 2005

15-19 августа 2005 года про?ла ежегодная Международная конференция АСМ SIGIR по исследованиям и разработкам в области информационного поиска. Очень интересно изучить довольно вну?ительный (пять дней) список тем докладов, среди которых заметно вну?ительное количество докладчиков из азиатского отделения Microsoft Research. Некоторые доклады Гарри Прайс из Search Engine Watch и Грег Линден, основатель Findory, обнаружили в свободном доступе. На блоге Search-Science были разобраны две темы по материалам Microsoft Research: «Организация персонального поиска на основе автоматического анализа интересов и поведения пользователей» и «Определение местонахождения пользователя в результатах поиска», Грег Линден прокомментировал доклад о персональном поиске.

Среди тем конференций были такие:

  • Анализ страницы на основе кликов (оценка страницы не только на основе текстового содержания)
  • Создание заголовка страницы на основе ее содержания и применение этого метода в поиске (в случае неверно заполненного поля заголовка title страницы, заголовок определяется при анализе тела документа)
  • Улуч?ение результатов поиска с помощью графа схожести (дополнительная сортировка результатов поиска на основе двух параметров: разнородность тем в определенной группе документов и насыщенность информацией по определенной теме конкретного документа)
  • ?спользование иерархической структуры для анализа ссылок (устранение двух проблем линейной оценки ссылок – ограниченность структуры и несправедливая оценка новых документов – учитывая иерархию доменов в адресе страницы)
  • Определение одно-фразных дубликатов в сети (техника определения созданных автоматически спам-страниц на основе ограниченного словаря фраз)
  • ?зучение развития релевантности в ?нтернет поиске
    Организация персонального поиска на основе автоматического анализа интересов и поведения пользователей (алгоритмы, учитывающие историю поведения пользователя для сортировки полученных результатов поиска, включающую поисковые запросы, посещенные страницы, просмотренные и созданные файлы и e-mail)

Вкусные материалы, как же найти столько времени, чтобы это все прочитать?

?нтернет27 August 2005

Не могу не зафиксировать такую удачную цитату от AZZ, которую я на?ел на форуме Состава:

Чистота нета = отсутствие помоечных и бестолковых сайтов = чистый поиск = луч?ий выбор = боль?е продаж = боль?е денег

Эксперименты27 August 2005

Благодаря быстророботу Яндекса эксперимент по поводу влияния тегов <strong>, <b>, <em>, <i> занял всего два дня. ?так, четыре страницы, созданные практически одновременно с интервалом в 1-2 минуты, имели текст в один абзац, среднего объема. Текст на страницах разный, в него было включено уникальное слово, вокруг которого были помещены одинаковые слова для исключения влияния разных весов близстоящих слов.

Уникальное слово было выделено одним их тегов <strong>, <b>, <em>, <i> соответственно на каждой странице. Яндекс проиндексировал документы, и они появились в поиске. Заканчиваю вступление и привожу позиции документов в серпе с каждым из тегов:

  1. strong
  2. b
  3. em
  4. i

Что и требовалось доказать. ?так, использование тегов смыслового выделения <strong> и <em> предпочтительнее, чем тегов только визуального выделения <b> и <i>. Но при этом тег <b> имеет боль?ий вес, чем тег <em>.

На некоторые вопросы по эксперименту есть ответы на форуме.

SEO /Копирайтинг27 August 2005

Обновилась колонка «Энциклопедия контента» в журнале Internet.ru. Не смотря на то, статья «Контент в зеркале оптимизации» выглядит (как ей и положено) рекламной, она все же несет в себе несколько авторских мыслей. Некоторые из которых я хотел бы прокомментировать.

Во-первых, оптимизационная верстка входит в комплекс мероприятий по SEO копирайтингу. Отсюда получаем, что три кита, на которых покоится SEO будут: ссылки (внутренние и вне?ние), обновление (и добавление контента) и SEO копирайтинг. Во-вторых, последний выполняет не одну задачу, а как минимум две (а я склоняюсь даже к трем): не только хоро?ий контент для поисковой ма?ины, но и продающий текст (как главная задача стандартного копирайтинга) и как следствие – хоро?ий и нужный текст для посетителя.

SEO26 August 2005

Похоже, придется провести эксперимент по поводу значения тега заголовка H1. Почему-то последнее время про него стали вспоминать на англоязычных блогах и форумах и сомневаться в его значении для Яндекса. Хотя, результаты такого опыта на «чистой» странице без in/out ссылок можно с боль?ой долей уверенности предсказать сразу. Значит желательно экспериментировать с нормальным живым сайтом. Мне понравился ответ автора Search Engine Roundtable:

Я все равно буду продолжать использовать Н1. Этот тег помогает в построении хоро?о скомпонованного документа, и отказ других от этого тега – не повод для меня создавать страницы с грязной разметкой.

Поисковые системы25 August 2005

Предположения о периодической чистке базы Яндекса оказались наполовину верны. Александр Садовский дал несколько объяснений на актуальные темы. По поводу изменения количества документов в индексе поисковика Александр ответил:

Умень?ение этого числа на 10-20% не связано ни с потерей кластеров, ни с расстрелом дорвеев, а вызвано удалением нечетких дубликатов страниц.

Еще две хоро?ие новости. Теперь выпадений главных страниц сайтов их поиска будет мень?е, так как в Яндексе исправили замеченную о?ибку. А также боль?е не будут отличаться результаты поиска при установке разных значений «число ссылок на странице» – теперь все используется единый ке?. Хотя, может быть кому-то станет труднее следить за апдейтами на Яндексе, так как привыкли сравнивать стандартную выдачу с выдачей по 50.

С подачи Александра на блоге Яндекса опубликовано сообщение Александра Авдонкина (программист отдела разработки поисковых сервисов) об некоторых изменениях в алгоритме ранжирования, которые касаются некоторых видов запросов:

Документы, посвященные именно теме запроса, а не более ?ироким или более узким темам, теперь в результатах поиска показываются вы?е, а по названиям компаний наверху чаще встречаются сайты этих компаний, а не их партнеров или магазинов.

Поисковые системы25 August 2005

Компания Софт?нформ выпустила пресс-релиз (который ценен тем, что по объему более походит на статью) о своей технологии поиска SoftInform Search Technology. Это поиск документов, похожих по своему содержанию на заданный образец, который будет интегрирован в систему управления корпоративными информационными ресурсами компании Hummingbird. В статье указаны проблемы некоторых видов поиска – локального, корпоративного и глобального, и предлагается воспользоваться технологией полнотекстового поиска документов:

Кроме основного назначения технологии поиска похожих – а это быстрый и качественный поиск информации в гигантских массивах (текстах, архивах, базах данных) – можно выделить также и интернет направление. Например, возможна разработка экспертной системы для обработки входящей корреспонденции и новостей, которая станет важным инструментом для аналитиков из различных компаний. Прежде всего это произойдет за счет того, что ни в одной существующей системе нет поиска документов похожих по содержанию на заданный. Сюда же можно отнести ре?ение проблемы спама поисковых ма?ин с помощью дорвеев (скрытых страниц с ключевыми словами, перенаправляющих на основные страницы сайта и использующихся для искусственного повы?ения рейтинга ресурсов в поисковиках) и проблемы e-mail спама (анализ на более высоком и интеллектуальном уровне – что существенно надежней существующих систем). Но самым интересным и перспективным направление развития SoftInform Search Technology в сфере интернет является создание поискового движка, основное отличие которого от существующих аналогов будет в том, что поиск будет осуществляться не только по ключевым словам, но и по похожим веб документам, что добавит в поиск гибкости и сделает его намного более удобным и качественным.

Автор делает вывод «будущее – за технологиями полнотекстового поиска похожих документов». К сожалению, взгляд на проблему с этой стороны может оказаться не совсем верным. Пользователю не важно «как ма?ина ищет», ему будет важно «какой результат ма?ина выдаст», при этом он хочет, чтобы сам запрос был как можно более простым или даже походил на вопрос. А вот о проблеме релевантности результатов поиска автор как раз и не упомянул. Но ведь это самый главный вопрос в разговоре о технологиях поиска.

Безусловно, поиск похожих документов может оказаться полезным в руках продвинутых пользователей, и это мы наблюдаем во всех сегодня?них стандартных поисковых системах в виде дополнительной ссылки «похожие страницы» или «похожие документы». Но ведь этапу поиска похожего документа пред?ествует этап выбора. Кстати, пользователю может не понадобится «поиск похожих», если он будет удовлетворен выдачей поисковой системы. Поэтому задача правильного поиска – это задача не «как искать», а задача «где искать» и «каков будет результат».

Юмор24 August 2005

Разве может нормальный человек такое написать :) :

Ситуация следующая – на?и сайты постоянно банят или пессимизируют, а у конкурентов (при таких же методах раскрутки) все в порядке! Поэтому при?ла в голову мысль – а что если платить за справедливость.

Т.е. мы не хотим покупать места, или валить конкурентов, мы просто хотим справедливости. Ну и еще наверное предупреждений, если мы что-то делаем не так и нужно срочно исправиться. Я знаю, этот форум читают сотрудники Яндекса, так вот, если кто-то хочет заработать ничего не нару?ая (!) – пи?ите – aaaХХХХХ@bk.ru

Еще раз подчеркиваю – мы хотим только равных условий, просто по на?им данным у конкурентов как раз контакты в Яндексе есть – поэтому к его сайтам и не применяют меры, хотя все нару?ения, за которые нас наказывают – у них тоже есть.

Оплата после испытательных действий – очень достойная. Корректность и конфеденциальность гарантируем.

Ну и еще парочку анекдотов, которыми поделился новый блог SEO SPb. Кстати, рекомендую.

Хотите 1 место в поиске?
Отправь запрос и код поисковика на короткий номер 2233:
Яндекс – 01
Рамблер – 02
Гугль – 03
*стоимость sms – от $1000

?звестный поисковик Yahoo ре?ил запустить новый домен Yahoo.ru Подсмотрев идею российского поисковика Яndex и его слогана “Яndex. Найдется все”, PR-работники Yahoo разработали свой слоган для русскоговорящей аудитории – “Yahoo его знает”.

Поисковые системы23 August 2005

Яндекс запускает быстрого робота, Я.Ленту, изменяет результаты поиска (углубляет влияние Я.Афи?и и сдвигает текст влево). Рамблер обновляет сетку вещания своего телеканала. ?нвестиции, полученные благодаря размещению акций, были направлены на развитие RamblerTV. Так кто же станет русским Yahoo для русского Google – Яндекса? Неужели Рамблер смирился с первым местом Яндекса?

Поисковые системы22 August 2005

Вебпланета представила краткий перевод отрывка из книги The Search Джона Баттеле. Мы сейчас беспокоимся о качестве поиска, ищем новые поисковые технологии, а здесь взгляд направлен в далекое (или недалекое – 20 лет) будущее. Вот цитата:

Подумайте об этом — через Google вы можете найти свою собаку, своего ребенка, ко?елек, мобильный телефон, автомобиль. Этот список будет быстро рас?иряться практически до бесконечности. Где угодно может быть чип, и где он есть — там с боль?ой вероятностью будет и поиск. Тогда мы приблизимся к тому, что Баттел называет ?деальным Поиском — когда к Сети будут подключены все живые и неживые объекты, представляющие хотя бы какую-то ценность в физическом мире. Все идет к тому, что человечество добровольно поселится внутри поискового интерфейса.

Страница 45 (всего 60)« начало...«4344454647»...конец »