Главная > Интеллектуальные системы > Базы знаний интеллектуальных систем
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

8.3.2. Инициатива и инструментарий Ontobroker

Аннотация знаний в рамках инициативы

Аннотация знаний сообществом приобретения знаний (Knowledge Annotation Initiative of the Knowledge Acquisition Community) — так расшифровывается аббревиатура Целью работ по этому международному проекту является, в конечном счете, интеллектуальный поиск в среде Интернет и автоматическое накопление новых знаний.

В рамках инициативы выделяются три основных направления исследований:

• онтологический инжиниринг (ontological engineering);

• аннотация Web-страниц;

• запросы к информации на Web-страницах и вывод ответов на базе онтологических знаний.

Онтологический инжиниринг — одно из основных направлений, в рамках которого предполагается, что сообщество должно создать свою собственную и достаточно общую систему онтологий на оснойе использования средств Onto-lingua [Farquhar et al., 1996]. В настоящее время уже разработано воесемь онтологий, которые могут рассматриваться как разделы общей онтологии — онтология организации (organization ontology), проекта (project ontology), личности (person ontology), направления исследований (research-topic ontology), публикаций (publication ontology), событий (event ontology), исследовательских

продуктов (research-product ontology) и исследовательских групп (research-group ontology). При этом разработка примеров онтологий осуществляется и управляется участниками проекта — так называемыми провайдер-агентами («provider agents»), а размещаются эти онтологии на их Web-страницах. Такие страницы аннотируются с использованием нового типа HTML-тегов (ONTO), информация в пределах которых обрабатывается специальной компонентой, работающей на основе онтологий, — системой Ontocrawler. В рамках этой компоненты, в зависимости от «богатства» используемой онтологии, может выводиться новая информация, релевантная запросам, но не присутствующая явно на Web-страницах в сети Интернет.

Сама система Ontocrawler разрабатывается в рамках отдельного проекта инициативы — проекта Ontobroker [Fensel et al., 1998], который, собственно, и интересен с точки зрения обсуждения средств представления и обработки онтологических знаний.

Средства спецификации онтологий в проекте Ontobroker

В Ontobroker имеются три основные подсистемы: интерфейс формулирования запросов (query interface), машина вывода ответов (inference engine) и собственно машина доступа к Интернет-ресурсам — «червяк» (Webcrawler), используемый для накопления требуемых знаний из этой среды.

Для спецификации онтологий разработан специальный язык представления знаний. Подмножество этого языка служит и для формулировки запросов, а язык аннотирования — для «обогащения» Web-документов онтологической информацией. Все эти компоненты и обсуждаются ниже.

Формализм запросов

Формализм запросов ориентирован на фреймовое представление онтологий, в рамках которого, как и обычно, определены понятия экземпляров, классов, атрибутов и значений.

Схема означает, что объект О является экземпляром класса С с атрибутом А, имеющим значение V. Важно, что в каждой позиции такой схемы могут использоваться не только константы, но и переменные или выражения.

Для примера, запрос вида

предполагает поиск всех объектов, являющихся экземплярами класса Researcher. Если предположить, что идентификатором объекта служит URL домашней страницы специалиста, в качестве результата по этому запросу будет выдан список соответствующих Интернет-ссылок.

Понятно, что это простейший запрос. Обычно же в запросе определяется поисковый образ объектов, обладающих определенными свойствами. Так, если необходимо найти всех специалистов по фамилии Иванов и при этом выдать в качестве

результата их имена и электронные адреса, то приведенный выше запрос можно модифицировать следующим образом:

В качестве ответа при этом могут быть получены значения переменных:

Имеются в языке Ontobroker и средства вывода значений свойств. Так, некоторые из атрибутов объекта могут задавать отношения, свойства которых известны машине вывода. Для примера, в запросе вида

атрибут cooperatesWith является отношением, обладающим свойством симметричности. Это означает, что даже если у объекта, описывающего специалиста по фамилии Иванов, свойства cooperatesWith нет, Ontobroker выведет его, если в онтологии представлен объект, описывающий другого специалиста, который имеет такое свойство со значением «Иванов».

В рассматриваемом языке представления онтологических знаний присутствуют и другие правила вывода значений атрибутов, эксплицитно не представленных в Web-документах. При этом понятно, что язык запросрв Ontobroker может использоваться и для формирования репозиториев с информацией, удовлетворяющей заданным ограничениям. И более того, с помощью запросов можно получать и метаинформацию: запрос вида

вернет в качестве результата имена всех атрибутов класса Researcher и связанных с ним классов.

В самой системе Ontobroker поддерживаются два типа интерфейсов при формировании запросов — текстовый (для экспертов) и графический (для пользователей). Первый из них предполагает, что запросы формулируются непосредственно во входном языке описания онтологий. Понятно, что при этом знание синтаксиса языка Ontobroker и знакомство с онтологией, для которой запрос формулируется, должны у эксперта присутствовать.

Проблема знания синтаксиса решается в данном случае, как, впрочем, и в большинстве других инструментальных средств нового поколения, за счет диалогов, управляемых системой (system-driven dialogue). Пользователю выдается

соответствукицая панель, где могут быть определены (путем выбора из меню) компоненты запроса и связки между ними. Такой подход обеспечивает синтаксическую корректность и однозначность интерпретации запроса.

Сложнее преодолеть разрыв в знаниях эксперта и пользователя, особенно новичка, об используемой онтологии. Ведь для правильной формулировки запроса необходимо знать, по крайней мере, какие концепты в онтологии присутствуют и какие атрибуты имеются у концептов. Поэтому все системы представления онтологических знаний предоставляют своим пользователям средства виуализации онтологий и навигации по онтологии.

В Ontobroker для визуализации онтологий используется подход, основанный на идеях гиперболической геометрии (Hyperbolic Geometry) [Lamping et al., 1995]. В случае обсуждаемой системы эти идеи реализуются следующим образом: класс, интересующий пользователя в данный момент, представляется «большим шаром», а классы, с ним непосредственно связанные, — «маленькими шарами» и располагаются по границе круга, «очерчивающего» соответствующий слой. Используя данный интерфейс, и эксперт и пользователь могут легко и эффективно включать в свой запрос нужные концепты и их атрибуты, а система Ontobroker переведет их в текстовое представление автоматически. Реализован интерфейс онтологий Ontobroker как Java-апплет, что обеспечивает работу с Web-броузе-рами на любых платформах, где поддерживается Java-технология.

Формализм представления и машина вывода

Как уже отмечалось выше, онтология определяется через концепты (классы), связанные отношениями, атрибуты и аксиомы. И адекватный язык представления должен обеспечить удобные средства для описания всех перечисленных компонентов. В Ontobroker базисом представления являются так называемые логики фреймов (Frame-Logic) [Kifer et al., 1995].

Базисными конструкциями в данном подходе являются:

• Подклассы (Subclassing) — запись означает, что класс является подклассом .

• Экземпляры — запись означает, что О является экземпляром класса С.

• Декларации атрибутов (Attribute Declaration) — запись означает, что для экземпляра класса определен атрибут А, значением которого должен быть экземпляр .

• Значения атрибутов Attribute Value) — запись означает, что экземпляр О имеет атрибут А со значением V.

• Часть-целое (Part-of) — запись означает, что Является частью .

• Отношения Relations) — предикаты вида могут использоваться, как и в обычных логических формализмах, но с тем расширением, что в качестве аргументов здесь могут выступать не только термы, но и выражения.

Из базисных конструкций строятся более сложные — факты правила «двойные» правила и запросы Запросы уже обсуждались выше. Факты, по сути, являются элементарными выражениями,

Правила, как и обычно, имеют левую и правую части, причем левая часть (здесь она называется «головой») является конъюнкцией элементарных выражений, а правая («тело») сложная формула, термами которой являются элементарные выражения, связанные обычными предикатными символами типа и Отличие между обычными и «двойными» правилами в симметричности последних. Важное достоинство формализма — возможность использования переменных в «голове» правил (с квантором FORALL) или в его «теле» (с кванторами FORALL и Пример фрагмента онтологии в формализме Ontobroker, адаптированный из работы [Fensel et al., 1998], приводится ниже.

Определения атрибутов

По-видимому, в пояснениях здесь нуждаются только правила. Первое из них фиксирует симметричность отношения cooperatesWith. Второе утверждает, что если конкретная личность (экземпляр класса Person) имеет публикацию, то последняя имеет автора, который тоже является экземпляром класса Person, и обратно.

Машина вывода Ontobroker состоит из двух основных компонентов: транслятора с расширенного языка представления в ограниченный и собственно вычислителя выражений ограниченного языка, который является обычным языком логического программирования.

Аннотация Web-страниц онтологической информацией

Поскольку, как уже отмечалось выше, Web-информация чаще всего представлена на языке HTML, в рамках проекта Ontobroker разработано простое его расширение для аннотации Web-страниц. Основная идея этого расширения состоит в следующем: в язык HTML добавлено несколько релевантных для решения поставленных задач тегов, использование которых позволяет Ontobroker интерпретировать аннотированные фрагменты HTML-текста как факты языка представления онтологических знаний. При этом Web-страницы остаются приемлемыми для стандартных броузеров типа Netscape Navigator или MS Explorer:

В язык введены три эпистемологически различных примитива:

• Идентификация объекта, который может быть определен как экземпляр определенного класса, с помощью URL.

• Установка значения атрибута объекта.

• Определение отношений между объектами.

Все примитивы синтаксически расширяют языка HTML. Так, например, если специалист Иванов захочет определить себя как объект обсуждавшейся выше онтологии, он может на своей домашней странице ввести конструкцию вида:

Теперь для объекта Иванов класса Researcher можно ввести атрибут email и его значение с помощью следующей конструкции:

Аналогичным образом вводятся и отношения:

Имеются в языке и средства, которые обеспечивают уменьшение сложности аннотирования: например, возможности именования «длинных» конструкций и последующего использования этих имен.

При таком подходе Ontocrawler — компонент системы Ontobroker - простой -скрипт, который периодически проверяет аннотированные страницы на Web. Для поиска таких страниц он обращается к индексным страницам провайдеров, которые зарегистрированы в рамках инициативы

<< Предыдущий параграф Следующий параграф >>
Оглавление