Построение онтологии предметной области
Рефераты >> Программирование и компьютеры >> Построение онтологии предметной области

3. Архитектура ANSI/SPARC

Можно с уверенностью сказать, что повторное использование знаний в различных контекстах не возможно без наличия механизмов, позволяющих фиксировать различное понимание этих знаний. Идея разработки такого механизма была представлена частично в ANSI/SPARC-архитектуре баз данных.

Эта архитектура включает три уровня:

1. Логический уровень (называемый "концептуальной схемой*"), который является промежуточным уровнем и основой данной архитектуры.

2. Внутреннее представление базы данных описывает способ, по которому концептуальная схема может быть реализована в терминах объектов физического уровня: файлов, индексов, хэш-таблиц и т.д.

3. На верхнем уровне концептуальной модели можно определить множественное "внешнее представление". Оно будет состоять из выборок и комбинаций элементов концептуальной схемы и представлять видение схемы для каждого конкретного пользователя этого приложения. Например, база данных, содержащая административную информацию о сотрудниках организации, должна содержать два различных представления данных: для финансового отдела и для самих научных сотрудников.

Главное ограничение внешнего представления ANSI/SPARC заключается в том, что в логической модели архитектуры ANSI/SPARC должна содержаться вся имеющаяся в базе данных информация, однако новые данные, добавленные в представления верхнего уровня, нельзя перенести на логический (основной) уровень этой архитектуры. Другими словами, нет единого, унифицированного представления для всех представлений контекстов, которое было бы достаточным для любой возможной ситуации, поскольку число различных представлений контекстов практически неограниченно. Не существует также способа понять, применима ли какая-то конкретная часть знаний для другого контекста, и если неприменима, то почему.

1.4 МОДЕЛЬ RDFS И ЕЁ ПРИМЕНЕНИЕ В ИСИР

RDF Schema - это стандарт инициативы W3C для преставления онтологических знаний. RDF Schema специфицирует множество всевозможных допустимых схем данных. RDF модели предметных областей описываются посредством ресурсов, свойств и их значений. Ограничения RDFS в невозможности с его помощью выразить аксиоматические знания, т.е. задать аксиомы и правила вывода, построенные на аксиомах.

RDFS предоставляет хорошие базовые возможности для описания словарей типов предметных областей.

Однако расширение выразительных способностей инструмента RDFS возможно и чрезвычайно полезно. Механизм расширения внутренне присущ RDFS путем "уточнения" или дополнения базовых типов. Поэтому RDFS стал фундаментом для более богатых языков описания концепций предметных областей, называемых языками описания онтологий предметных областей, о которых пойдет речь позже.

2 МЕТОДОЛОГИЯ METHONTOLOGY

METHONTOLOGY, как подход к построению и сопровождению онтологий, разработан Асунсьон Гомез-Перез (А. Gomez-Perez) с коллегами В рамках этой методологии реализуются принципы Грубера, а также разработано программное окружение спецификации онтологии ODE (Ontology Design Environment). Данный подход выделяет следующие процедуры в «жизненном цикле» создания онтологии: управление проектом, собственно разработка и поддержка разработки. Процедуры управления проектом включают планирование, контроль и гарантии качества. Планирование определяет, какие задачи должны быть выполнены, как они организуются, как много времени и какие ресурсы нужны для их выполнения. Контроль гарантирует, что запланированные задачи выполнены и именно так, как это предполагалось. Гарантии качества нужны для того, чтобы быть уверенным в том, что компоненты и продукт в целом находятся на заданном уровне.

Собственно разработка включает спецификацию, концептуализацию, формализацию и реализацию.

Согласно обсуждаемой методологии сначала здесь строится глоссарий терминов, включающий все термины (концепты и их экземпляры, атрибуты, действия и т. п.), важные для предметной области, и их естественно-языковые описания. Когда глоссарий терминов достигает «существенного» объема, строятся деревья классификации концептов. Таким образом, идентифицируются основные таксономии предметной области, а каждая таксономия, согласно рассматриваемой методологии, дает в конечном счете онтологию. В рамках инициативы (КА)2 идентифицировано несколько таксономий. Следующим шагом является построение Диаграмм бинарных отношений, целью создания которых является фиксация отношений между концептами одной или разных онтологий. Заметим, что в дальнейшем эти Диаграммы могут послужить исходным материалом для интеграции разных онтологий.

После построения представлений, фиксированных выше, для каждого дерева классификации концептов строятся:

1. Словарь концептов (Concept Dictionary), содержащий все концепты предметной области, экземпляры таких концептов, атрибуты экземпляров концептов, отношения, источником которых является концепт, а также (опционально) синонимы и акронимы концепта.

2. Таблица бинарных отношений (Table of Binary Relations) для каждого отношения, исходный концепт которого содержится в классификационном дереве. Для каждого отношения фиксируется его имя, имена концепта-источника и целевого концепта, инверсное отношение и т. п. характеристики.

3. Таблица атрибутов экземпляра (Instance Attribute Table) для каждого экземпляра из словаря концептов. Основные характеристики здесь следующие: имя атрибута, тип значения, единица измерения, точность, диапазон изменения, значение «по умолчанию», атрибуты, которые могут быть выведены с использованием данного, формула или правило для вывода атрибута и др.

4. Таблица атрибутов класса (Class Attribute Table) для каждого класса из словаря концептов с аналогичными характеристиками.

5. Таблица логических аксиом (Logical Axioms Table), в которой даются определения концептов через всегда истинные логические выражения. Определение каждой аксиомы включает ее имя, естественно-языковое описание, концепт, к которому аксиома относится, атрибуты, используемые в аксиоме, логическое выражение, формально описывающее аксиому, и др.

6. Таблица констант (Constants Table), где для каждой константы указывается ее имя, естественно-языковое описание, тип значения, само значение, единица измерения, атрибуты, которые могут быть выведены с использованием данной константы, и т. п.

7. Таблица формулы (Formula Table) для каждой формулы, включенной в таблицу атрибутов экземпляра. Каждая таблица этого типа, помимо собственно формулы, должна специфицировать ее имя, атрибут, выводимый с помощью этой формулы, естественно-языковое описание, точность, ограничения, при которых возможно использовать формулу, и др.

8. Деревья классификации атрибутов (Attribute Classification Trees), которые графически показывают соответствующие атрибуты и константы, используемые для вывода значения корневого атрибута и формулы, применяемые для этого. По сути дела, эти деревья используются для проверки того, что все атрибуты, представленные в формуле, имеют описания и ни один из атрибутов не пропущен.


Страница: