Технологии будущего: интеллектуальная паутина

Себастиан Рапли,
редактор PC Magazine/RE

    Интернет — обширное хранилище информации, однако в скором времени Web сможет прогнозировать и с безошибочной точностью отбирать сведения, нужные пользователю.

Будем откровенны, сегодня интеллект Web весьма низок. Это неудивительно, если учесть, что изначально Паутина предназначалась для отображения текста (и позднее графики) на любом компьютере. Но вскоре Web-узлы будут располагать значительно более полными сведениями о посетителях. Кроме того, им будет известно гораздо больше об их собственном информационном наполнении («контенте») и данных, хранящихся на других узлах.

Персональная Web

Наиболее заметной тенденцией Web стала индивидуализация ее информационного наполнения. Об этом свидетельствуют такие персональные порталы, как My Excite, My Yahoo! и My ZDNet. Программы в приведенных нами примерах неинтеллектуальны; умными должны быть пользователи: они отбирают информацию, сообщая узлу об интересующих их тематических категориях, акциях, за ценами на которые они хотят следить, городах, о погоде в которых они желают знать. Мало-помалу Web-узлы узнают о предпочтениях пользователей и предоставляют каждому из них специально подобранную информацию.

Сегодня узлы узнают пользователей, присваивая им регистрационные имена и пароли, а также куки-строки, хранящиеся в браузере. Затем Web-узел подбирает информацию, даже если пользователь не сообщает в явной форме, какие сведения он хочет получить. В будущем узлы научатся отслеживать наиболее интересующую пользователя информацию и предлагать ее без вмешательства человека.

Коллаборативная фильтрация — еще одна технология, благодаря которой узлы производят впечатление интеллектуальных. Программы таких компаний, как Firefly Network (недавно приобретенной фирмой Microsoft), NetPerceptions и Andromedia (предлагающей службу индивидуализации LikeMinds), используются на узлах для анализа запросов потребителей и сравнения их с предпочтениями других посетителей. После этого вам могут быть рекомендованы продукты и услуги, пользующиеся успехом у других лиц с похожими вкусами. В настоящее время такие методы индивидуализации информации в той или иной мере применяются на самых различных узлах — начиная с рекомендаций книг на узле Amazon.com и кончая музыкальными рецензиями Launch Media.

В механизме Direct Hit использован немного иной вариант данного подхода к поиску в Web. Когда вы знакомитесь с результатами поиска по ключевому слову, Direct Hit указывает на узел, выбранный большинством пользователей. Сегодня технология определения уровня «популярности» реализована на таких узлах, как HotBot и ZDNet. Если, например, провести поиск по слову Elvis на узле HotBot, то будет получен список из десяти узлов, наиболее часто посещаемых пользователями HotBot, посылавшими тот же запрос.

Еще одна тенденция, благодаря которой Web выглядит более интеллектуальной — распространение агентов (bots, или agents). В частности, мы встречали множество привязанных к Web-узлам агентов, опрашивающих другие узлы с целью найти данный продукт по самой низкой цене. В конечном итоге вы можете обзавестись собственными агентами, которые будут размещаться в вашем компьютере.

Роб Барретт из исследовательского центра Almaden фирмы IBM работает над программным «посредником» (intermediary), названным WBI (Web Browsing Intelligence — интеллектуальный просмотр Web). Подобно агентам, «посредники» работают в фоновом режиме, чтобы, как говорит Барретт, «выполнить специальную настройку и усовершенствовать вашу среду». Например, «посредник» может автоматически извлечь и инсталлировать подключаемый модуль (plug-in), необходимый для просмотра страницы Web.

От HTML к XML

Чтобы обеспечить пользователя нужной информацией, узлам необходимо знать о контенте других узлов. В настоящее время самая подходящая технология для этой цели — XML (eXtensible Markup Language — расширяемый язык разметки). HTML был языком для размещения текста и графики на странице. XML, в отличие от него, — не презентационный язык, а стандартный способ описания данных. Таким образом, XML позволит повысить точность поиска, а бизнесмены смогут более эффективно обмениваться данными. Говоря коротко, Web, построенная на основе HTML, в настоящее время перестраивается на XML.

Как и HTML, XML вырос из языка SGML (Standard Generalized Markup Language, стандартный язык обобщенной разметки). SGML — метаязык, с помощью которого можно создавать другие языки. Благодаря SGML различные группы пользователей (например, авиакомпании) могут создавать теги, элементы и атрибуты, называемые определениями типа документа (Document Type Definition, DTD) и специфические для конкретных приложений. Но если HTML — специальный набор тегов для отображения Web-страниц, то XML представляет собой более простой метаязык, с помощью которого группам пользователей легче составлять стандартные теги для описания контента файлов практически любого типа.

Уже предлагается использовать XML как основу для стандартизованных тегов в столь различных областях, как финансовые транзакции, векторная графика и мультимедиа. Например, спецификация Open Financial Exchange (OFX) содержит стандартный набор тегов, с помощью которого клиенты могут управлять своими финансами и оплачивать счета в оперативном режиме. Предприятия смогут обмениваться записями об оплате счетов, и это значит, что гораздо большее число предприятий сможет вести оперативные расчеты. XML — стандартизованный язык, и почти любые программы могут быть приспособлены для работы с ним. Главное достоинство XML заключается в организации интеллектуального обмена данными в Web между программами любых типов — от баз данных до пакетов электронной коммерции.

По-видимому, в будущем XML найдет разнообразные применения, выходящие за рамки Web. Например, в комплексе Office 2000 фирмы Microsoft язык XML используется в качестве альтернативного файлового формата, поэтому допускается хранение документов Word и Excel в виде файлов, пригодных для просмотра в XML-совместимом браузере. При этом документ можно редактировать в исходной программе.

Более совершенный механизм поиска

Одна из областей, в которой использование XML приведет к немедленным улучшениям, — поиск в Web. Поскольку теги XML описывают информацию в документе, то поиск можно вести по самим описаниям, что увеличивает избирательность поиска. Фирма Aeneid использует теги XML и сложные методы выборки текста для поиска и сопоставления информации на многих узлах.

Большинство современных поисковых машин просто отыскивают текст. Но, по мере того как в Web появляется все больше мультимедиа-материалов, способность отыскивать нужные сведения в безбрежном море информации станет необходимым условием полноценного использования Паутины. Программа VideoLogger фирмы Virage предназначена для кодирования видеоматериалов и доступа к ним. Virage работает с Web-узлами и поставщиками видеоматериалов, чтобы обеспечить пользователям возможность поиска фильмов по таким критериям, как конкретные произносимые слова. Тем временем фирма IBM работает над методом, названным Query By Image Content (QBIC — запрос по контенту изображения), с помощью которого можно составлять базы данных изображений и вести в них поиск не только по ключевым словам, но и по цвету, форме и текстуре.

Предпринимается множество усилий для совершенствования пользовательских интерфейсов. Например, система визуального представления Hyperbolic Tree (гиперболическое дерево) фирмы Inxight выглядит как шар, составленный из гипертекстовых связей, по пространству которых можно перемещаться с помощью мыши. Пользователи гиперболического дерева знают, что ссылка, задействованная последней, помещается чуть ниже центра шара рядом с его экватором, а другие располагаются ближе к северному полюсу.

Пакет Brain фирмы Natrificial упорядочивает информацию о Web в пространственном интерфейсе. По замыслу авторов, Brain, вид и поведение которого похожи на гиперболические деревья, должен служить средой для совместного использования содержимого Интернета, без выделения специального Web-узла для хранения информации. Программа Brain формирует ассоциативные структуры (associative structures) с целью установить соответствие между несколькими файлами, точно так же, как наш собственный мозг устанавливает ассоциативные связи между многими фрагментами информации.

Благодаря объединению всех этих подходов — индивидуализации, агентов, новых поисковых методов и усовершенствованных способов навигации по Web-узлам — мы перейдем от Web, располагающей огромными массивами данных, в которых необходимо вести поиск, к Сети, которая будет доставлять нужную информацию непосредственно на наш ПК.


Источник публикации: http://www.pcmag.ru/ №10, 1999