БЛОГика

Поисковые системы28 August 2005

Несколько тем с SIGIR 2005

15-19 августа 2005 года про�?ла ежегодная Международная конференция АСМ SIGIR по исследованиям и разработкам в области информационного поиска. Очень интересно изучить довольно вну�?ительный (пять дней) список тем докладов, среди которых заметно вну�?ительное количество докладчиков из азиатского отделения Microsoft Research. Некоторые доклады Гарри Прайс из Search Engine Watch и Грег Линден, основатель Findory, обнаружили в свободном доступе. На блоге Search-Science были разобраны две темы по материалам Microsoft Research: «Организация персонального поиска на основе автоматического анализа интересов и поведения пользователей» и «Определение местонахождения пользователя в результатах поиска», Грег Линден прокомментировал доклад о персональном поиске.

Среди тем конференций были такие:

Анализ страницы на основе кликов (оценка страницы не только на основе текстового содержания)
Создание заголовка страницы на основе ее содержания и применение этого метода в поиске (в случае неверно заполненного поля заголовка title страницы, заголовок определяется при анализе тела документа)
Улуч�?ение результатов поиска с помощью графа схожести (дополнительная сортировка результатов поиска на основе двух параметров: разнородность тем в определенной группе документов и насыщенность информацией по определенной теме конкретного документа)
�?спользование иерархической структуры для анализа ссылок (устранение двух проблем линейной оценки ссылок – ограниченность структуры и несправедливая оценка новых документов – учитывая иерархию доменов в адресе страницы)
Определение одно-фразных дубликатов в сети (техника определения созданных автоматически спам-страниц на основе ограниченного словаря фраз)
�?зучение развития релевантности в �?нтернет поиске
Организация персонального поиска на основе автоматического анализа интересов и поведения пользователей (алгоритмы, учитывающие историю поведения пользователя для сортировки полученных результатов поиска, включающую поисковые запросы, посещенные страницы, просмотренные и созданные файлы и e-mail)

Вкусные материалы, как же найти столько времени, чтобы это все прочитать?

�?нтернет27 August 2005

Чистый инет – это деньги

Не могу не зафиксировать такую удачную цитату от AZZ, которую я на�?ел на форуме Состава:

Чистота нета = отсутствие помоечных и бестолковых сайтов = чистый поиск = луч�?ий выбор = боль�?е продаж = боль�?е денег

Эксперименты27 August 2005

�?спользование тегов [strong], [b], [em], [i]

Благодаря быстророботу Яндекса эксперимент по поводу влияния тегов , , , занял всего два дня. �?так, четыре страницы, созданные практически одновременно с интервалом в 1-2 минуты, имели текст в один абзац, среднего объема. Текст на страницах разный, в него было включено уникальное слово, вокруг которого были помещены одинаковые слова для исключения влияния разных весов близстоящих слов.

Уникальное слово было выделено одним их тегов , , , соответственно на каждой странице. Яндекс проиндексировал документы, и они появились в поиске. Заканчиваю вступление и привожу позиции документов в серпе с каждым из тегов:

strong
b
em
i

Что и требовалось доказать. �?так, использование тегов смыслового выделения и предпочтительнее, чем тегов только визуального выделения и . Но при этом тег имеет боль�?ий вес, чем тег .

На некоторые вопросы по эксперименту есть ответы на форуме.

SEO /Копирайтинг27 August 2005

Контент как инструмент SEO копирайтинга в зеркале оптимизации

Обновилась колонка «Энциклопедия контента» в журнале Internet.ru. Не смотря на то, статья «Контент в зеркале оптимизации» выглядит (как ей и положено) рекламной, она все же несет в себе несколько авторских мыслей. Некоторые из которых я хотел бы прокомментировать.

Во-первых, оптимизационная верстка входит в комплекс мероприятий по SEO копирайтингу. Отсюда получаем, что три кита, на которых покоится SEO будут: ссылки (внутренние и вне�?ние), обновление (и добавление контента) и SEO копирайтинг. Во-вторых, последний выполняет не одну задачу, а как минимум две (а я склоняюсь даже к трем): не только хоро�?ий контент для поисковой ма�?ины, но и продающий текст (как главная задача стандартного копирайтинга) и как следствие – хоро�?ий и нужный текст для посетителя.

SEO26 August 2005

Забыть про тег H1?

Похоже, придется провести эксперимент по поводу значения тега заголовка H1. Почему-то последнее время про него стали вспоминать на англоязычных блогах и форумах и сомневаться в его значении для Яндекса. Хотя, результаты такого опыта на «чистой» странице без in/out ссылок можно с боль�?ой долей уверенности предсказать сразу. Значит желательно экспериментировать с нормальным живым сайтом. Мне понравился ответ автора Search Engine Roundtable:

Я все равно буду продолжать использовать Н1. Этот тег помогает в построении хоро�?о скомпонованного документа, и отказ других от этого тега – не повод для меня создавать страницы с грязной разметкой.

Поисковые системы25 August 2005

Несколько комментариев Александра Садовского

Предположения о периодической чистке базы Яндекса оказались наполовину верны. Александр Садовский дал несколько объяснений на актуальные темы. По поводу изменения количества документов в индексе поисковика Александр ответил:

Умень�?ение этого числа на 10-20% не связано ни с потерей кластеров, ни с расстрелом дорвеев, а вызвано удалением нечетких дубликатов страниц.

Еще две хоро�?ие новости. Теперь выпадений главных страниц сайтов их поиска будет мень�?е, так как в Яндексе исправили замеченную о�?ибку. А также боль�?е не будут отличаться результаты поиска при установке разных значений «число ссылок на странице» – теперь все используется единый ке�?. Хотя, может быть кому-то станет труднее следить за апдейтами на Яндексе, так как привыкли сравнивать стандартную выдачу с выдачей по 50.

С подачи Александра на блоге Яндекса опубликовано сообщение Александра Авдонкина (программист отдела разработки поисковых сервисов) об некоторых изменениях в алгоритме ранжирования, которые касаются некоторых видов запросов:

Документы, посвященные именно теме запроса, а не более �?ироким или более узким темам, теперь в результатах поиска показываются вы�?е, а по названиям компаний наверху чаще встречаются сайты этих компаний, а не их партнеров или магазинов.

Поисковые системы25 August 2005

Как нам поможет «поиск похожих»

Компания Софт�?нформ выпустила пресс-релиз (который ценен тем, что по объему более походит на статью) о своей технологии поиска SoftInform Search Technology. Это поиск документов, похожих по своему содержанию на заданный образец, который будет интегрирован в систему управления корпоративными информационными ресурсами компании Hummingbird. В статье указаны проблемы некоторых видов поиска – локального, корпоративного и глобального, и предлагается воспользоваться технологией полнотекстового поиска документов:

Кроме основного назначения технологии поиска похожих – а это быстрый и качественный поиск информации в гигантских массивах (текстах, архивах, базах данных) – можно выделить также и интернет направление. Например, возможна разработка экспертной системы для обработки входящей корреспонденции и новостей, которая станет важным инструментом для аналитиков из различных компаний. Прежде всего это произойдет за счет того, что ни в одной существующей системе нет поиска документов похожих по содержанию на заданный. Сюда же можно отнести ре�?ение проблемы спама поисковых ма�?ин с помощью дорвеев (скрытых страниц с ключевыми словами, перенаправляющих на основные страницы сайта и использующихся для искусственного повы�?ения рейтинга ресурсов в поисковиках) и проблемы e-mail спама (анализ на более высоком и интеллектуальном уровне – что существенно надежней существующих систем). Но самым интересным и перспективным направление развития SoftInform Search Technology в сфере интернет является создание поискового движка, основное отличие которого от существующих аналогов будет в том, что поиск будет осуществляться не только по ключевым словам, но и по похожим веб документам, что добавит в поиск гибкости и сделает его намного более удобным и качественным.

Автор делает вывод «будущее – за технологиями полнотекстового поиска похожих документов». К сожалению, взгляд на проблему с этой стороны может оказаться не совсем верным. Пользователю не важно «как ма�?ина ищет», ему будет важно «какой результат ма�?ина выдаст», при этом он хочет, чтобы сам запрос был как можно более простым или даже походил на вопрос. А вот о проблеме релевантности результатов поиска автор как раз и не упомянул. Но ведь это самый главный вопрос в разговоре о технологиях поиска.

Безусловно, поиск похожих документов может оказаться полезным в руках продвинутых пользователей, и это мы наблюдаем во всех сегодня�?них стандартных поисковых системах в виде дополнительной ссылки «похожие страницы» или «похожие документы». Но ведь этапу поиска похожего документа пред�?ествует этап выбора. Кстати, пользователю может не понадобится «поиск похожих», если он будет удовлетворен выдачей поисковой системы. Поэтому задача правильного поиска – это задача не «как искать», а задача «где искать» и «каков будет результат».

Юмор24 August 2005

Продолжаем смеяться

Разве может нормальный человек такое написать :

Ситуация следующая – на�?и сайты постоянно банят или пессимизируют, а у конкурентов (при таких же методах раскрутки) все в порядке! Поэтому при�?ла в голову мысль – а что если платить за справедливость.

Т.е. мы не хотим покупать места, или валить конкурентов, мы просто хотим справедливости. Ну и еще наверное предупреждений, если мы что-то делаем не так и нужно срочно исправиться. Я знаю, этот форум читают сотрудники Яндекса, так вот, если кто-то хочет заработать ничего не нару�?ая (!) – пи�?ите – aaaХХХХХ@bk.ru

Еще раз подчеркиваю – мы хотим только равных условий, просто по на�?им данным у конкурентов как раз контакты в Яндексе есть – поэтому к его сайтам и не применяют меры, хотя все нару�?ения, за которые нас наказывают – у них тоже есть.

Оплата после испытательных действий – очень достойная. Корректность и конфеденциальность гарантируем.

Ну и еще парочку анекдотов, которыми поделился новый блог SEO SPb. Кстати, рекомендую.

Хотите 1 место в поиске?
Отправь запрос и код поисковика на короткий номер 2233:
Яндекс – 01
Рамблер – 02
Гугль – 03
*стоимость sms – от $1000

�?звестный поисковик Yahoo ре�?ил запустить новый домен Yahoo.ru Подсмотрев идею российского поисковика Яndex и его слогана “Яndex. Найдется все”, PR-работники Yahoo разработали свой слоган для русскоговорящей аудитории – “Yahoo его знает”.

Поисковые системы23 August 2005

Кто догонит Яндекс?

Яндекс запускает быстрого робота, Я.Ленту, изменяет результаты поиска (углубляет влияние Я.Афи�?и и сдвигает текст влево). Рамблер обновляет сетку вещания своего телеканала. �?нвестиции, полученные благодаря размещению акций, были направлены на развитие RamblerTV. Так кто же станет русским Yahoo для русского Google – Яндекса? Неужели Рамблер смирился с первым местом Яндекса?

Поисковые системы22 August 2005

Google has you

Вебпланета представила краткий перевод отрывка из книги The Search Джона Баттеле. Мы сейчас беспокоимся о качестве поиска, ищем новые поисковые технологии, а здесь взгляд направлен в далекое (или недалекое – 20 лет) будущее. Вот цитата:

Подумайте об этом — через Google вы можете найти свою собаку, своего ребенка, ко�?елек, мобильный телефон, автомобиль. Этот список будет быстро рас�?иряться практически до бесконечности. Где угодно может быть чип, и где он есть — там с боль�?ой вероятностью будет и поиск. Тогда мы приблизимся к тому, что Баттел называет �?деальным Поиском — когда к Сети будут подключены все живые и неживые объекты, представляющие хотя бы какую-то ценность в физическом мире. Все идет к тому, что человечество добровольно поселится внутри поискового интерфейса.

Страница 45 (всего 60)« начало...«43 444546 47 »...конец »

Новые комментарии:

Рубрики

Архив

Рассылка:

Поиск

Инфо