Вся американская революция в одном запросе
Подробности работы алгоритма практически не разглашаются, кроме нескольких вполне рекламных заявлений, о пришествии нового поколения поисковых систем, которые смогут искать только самые нужные (релевантные) сайты, и при этом будут искать даже те страницы на которых нет ключевых слов из запроса, но которые тесно связаны с запросом. В качестве примера, CNET News.com приводит запрос «Американская революция» (American Revolution). Новый поисковый алгоритм должен выдать не только страницы, на которых есть эта фраза, но и страницы, относящиеся к теме запроса, в частности, те, что содержат слова «Американская история» (American history), «Джордж Вашингтон» (George Washington) или «Декларация независимости» (the Declaration of Independence). На сегодняшний день нет ни одного поискового алгоритма, который соответствовал бы заявленной задаче, поэтому пока эксперты восприняли информацию об интеллектуально продвинутом поиске скептически.
Экономия на кликах
Но в сентябре 2005, когда появились первые сообщения о новом алгоритме, Ори Алон говорил и о других более конкретных возможностях: «Результаты поискового запроса появляются в "раздвигающейся" форме, в которой размещается вся релевантная текстовая информация с сайта. Вам нет необходимости загружать саму веб-страницу, хотя, конечно, вы имеете такую возможность».
Экономия на кликах – это уже отчетливо обозначившееся направление развития поисковых систем. Именно в этом направлении развивается новая версия поисковика Microsoft – Windows Live Search, которая сегодня находится в стадии бета-тестирования. В этом поисковике картинки можно просматривать, не покидая основную страницу поиска – достаточно навести на них мышку, сами запросы и результаты могут быть сохранены в виде макросов для повторного просмотра или передачи другим пользователям. Windows Live Search не разбивает результаты на страницы, а отображает их в одном окне. Навигация при этом осуществляется при помощи полосы прокрутки. Кроме того, на этой же странице можно провести поиск по любому конкретному ресурсу, отображенному в поисковой выдаче. Все это очень удобно (правда, пока работает через раз или совсем не работает). Если добавить к этому интерфейсу еще и возможность вывести на экран полнотекстовую информацию, извлеченную с сайта – это будет только естественно.
Секрет успеха Google
Технический директор компании Яndex Илья Сегалович, анализируя причины успеха Google, сказал в интервью Компьютерре: «Считается, что успех Google базируется на PageRank, новаторском алгоритме который придумали два студента в гараже. Однако это далеко от истины. Первое: опубликованный вариант PageRank не имеет почти никакого отношения к тому, что на самом деле работает в Google. Новизна его тоже под вопросом. По большому счету, все это уже было опубликовано, но в параллельных областях. И самое главное, PageRank не предоставлял никакого конкурентного преимущества, потому что, тоже самое практически сразу было реализовано во всех остальных поисковых системах. А что сработало на Google? Например, с 1999 по 2003 год - как минимум четыре года - Google был единственной мировой искалкой, которая выдавала сниппеты, что повышает информативность выдачи на 30 процентов. Мы это тоже делали, но в России. Такая, казалось бы, мелочь. Технологически - совсем не сложная задача. У меня в 2000 году это было тестовым заданием при приеме на работу. Тем не менее, четыре года сниппеты выдавал только Google. Почему остальные порталы это не реализовали? Не знаю».
Сниппеты (snippets – англ. лоскутки, обрывки) – фрагменты текста с найденной страницы, как правило, содержащие слова из поискового запроса. И только-то. Возможность, расширить сниппет до полного текста, при этом, не потеряв в скорости поисковой выдачи, и, по крайней мере, сохранив существующую релевантность, которую уже обеспечивает PageRank, эта возможность может стать действительно серьезным конкурентным преимуществом. А в силу того, что все большее число пользователей выходят в Сеть по широкой полосе, и время на загрузку постоянно сокращается, выдача полного текста кажется вполне реалистичной и даже необходимой.
Конкуренты прилагают большие усилия, чтобы потеснить Google с поискового олимпа. Например, Microsoft, планирует в сентябре расширить Windows Live Search специальными возможностями: поиска товаров Windows Live Product Search, поиска научной информации Windows Live Academic Search и поиска картинок Windows Live Image Search. Но и Google не собирается сдавать позиции, и, может быть, алгоритм Ори Алона тоже пойдет в дело.