Построение онтологии предметной области
Рефераты >> Программирование и компьютеры >> Построение онтологии предметной области

· Элементы и измерения (Units and dimensions)

1.2 ЯЗЫКИ ОПИСАНИЯ ОНТОЛОГИЙ

Ключевым моментом в проектировании онтологий является выбор соответствующего языка спецификации онтологий (Ontology specification language). Цель таких языков - предоставить возможность указывать дополнительную машинно-интерпретируемую семантику ресурсов, сделать машинное представление данных более похожим на положение вещей в реальном мире, существенно повысить выразительные возможности концептуального моделирования слабоструктурованных Web-данных.

Существуют традиционные языки спецификации онтологий (Ontolingua, CycL, языки, основанные на дескриптивных логиках, такие как LOOM, и языки, основанные на фреймах - OKBC, OCML, Flogic). Более поздние языки основанные на Web-стандартах, такие как XOL, SHOE или UPML, RDF(S), DAML, OIL, OWL созданы специально для обмена онтологиями через Web.

В целом, различие между традиционными и Web- языками спецификации онтологий заключается в выразительных возможностях описания предметной области и некоторых возможностях механизма логического вывода для этих языков. Типичные примитивы языков дополнительно включают:

· Конструкции для агрегирования, множественных иерархий классов, правил вывода и аксиом;

· Различные формы модуляризации для записи онтологий и взаимоотношений между ними;

· Возможность мета-описания онтологий. Это полезно при установлении отношений между различными видами онтологий.

Первыми предложениями по описанию онтологий на базе RDFS были DARPA DAML-ONT (DARPA Agent Markup Language) и European Commission OIL (Ontology Inference Layer). Эти стандарты спецификации и обмена онтологиями были разработаны для достижения наилучших результатов в поддержке процесса обмена знаниями и интеграции знаний. DAML обеспечивает примитивы для объявления пересечений, объединений, дополнений классов и т.д. OIL основан на description logics. Другое расширение RDFS - DRDFS. Также как OIL, он дает возможность для выражения классов и определения свойств, однако выразительная мощность языков DRDFS и OIL такова, что ни один из них не может быть рассмотрен как фрагмент другого.

На базе этих предложений DAML и OIL возникло совместное решение - DAML+OIL, которое послужило толчком для создания в рамках инициативы Semantic Web отдельной группы по пересмотру этого решения и стандартизации языка описания Web-онтологий (OWL - Web Ontology Language). Адаптация к Web систем логики и искусственного интеллекта составляет вершину "пирамиды Semantic Web", обеспечивая адекватный семантически поиск информации и машинную интерпретацию семантики.

OIL также можно рассматривать в сравнении с Ontolingua, разработанной в рамках инициативы On-To-Knowledge. По сравнению с Ontolingua, OIL менее выразителен, но все же позволяет делать логические выводы: поддержка вывода обеспечивается системой FaCT - классификатором, который работает на основе description logic.

Однако в целом можно сказать, что ориентированность языков описания онтологий на системы математической логики делает их слишком тяжеловесными для огромного количества приложений, которым достаточно простого языка описания словарей - RDFS. И это правильно, каждая ступень в пирамиде - это ступень, на которой многие приложения могут остановиться, согласно своим собственным требованиям к данным и их использованию.

1.3 СРЕДСТВА СЕМАНТИЧЕСКОГО ОПИСАНИЯ ДАННЫХ

На сегодняшний день уже имеется много средств семантического описания данных, многие из которых считаются достаточно выразительными для задач семантического моделирования данных. В качестве примера можно привести модель описания ресурсов (Resource Definition Framework), диаграммы Сущность-Связь (Entity-Relationship model). Мы опишем, в чем заключаются преимущества онтологий перед другими механизмами описания семантики предметной области, например, RDFS, ER-диаграммами.

1. Ограничения традиционных моделей данных

Для начала примем некоторые договоренности об использовании терминологии. Согласно М.Р. Когаловскому, под термином "модель данных" мы понимаем инструмент моделирования, т.е. является совокупностью понятий для описания данных, для описания структуры данных. "Модель предметной области" представляет собой визуальное представление сущностей предметной области и отношений между ними, т.е. спецификацию модели предметной области, и является результатом моделирования.

Первые модели данных предметной области описывались конструкторами типов таких языков программирования, как Алгол, а также в схемах баз данных. Позднее появились сложные модели данных, историю развития которых описал в своей работе Петер Чен, вместе с тем предложив новую модель данных, называемая моделью "сущность-связь" (Entity-Relationship model), основанную на некоторой важной семантической информации о реальном мире.

2. Модель Entity Relationship

ER-модель явилась основой, из которой могут быть порождены три существующие модели данных: сетевой модели, реляционной модели и модели набора сущностей, представляя данные более строго и естественно и одновременно обеспечивая независимость данных от приложений (ER- модель основывается на теории множеств и реляционной теории). С тех пор было предложено множество расширений ER-схем, чтобы обеспечить более мощные средства выражения семантики данных: механизмы задания иерархии подклассов классов сущностей, некоторых семантических ограничений типа "часть-целое", реификаций как классов сущностей, благодаря которым можно было распознавать общие характеристики сущностей различных классов. Примеры таких моделей - "semantic data modeling", "extended ER modeling", "hyper-semantic data modeling", "OMT approach" и др.

Ограничения ER-модели и её расширений в том, что они, описывая семантику "сущностей", позволяют интерпретировать данные одним единственным способом.

Например, допустим, что модель данных Интегрированной Системы Информационных Ресурсов (ИСИР) РАН будет содержать тип ресурса "Научная организация" вместе с некоторыми атрибутами и соотношениями. Сущностями этого типа будут служить конкретные научные организации. С помощью механизма иерархии классов можно понять, к какому типу относится данный ресурс (к типу "Организация"), однако самому типу "Научная организация" в процессе моделирования данных обычно можно дать только одну интерпретацию. Поэтому, повторно использовать данное понятие "Научная организация" не удастся, т.к. этот термин в разных контекстах (т.е. при различных точках зрения видения предметной области) имеет разное значение. Например, с научной точки зрения нас будут интересовать такие аспекты, как направление научных исследований, список ведущих научных сотрудников и т.д. В административной структуре интересен управленческий состав, организационные вопросы. В плане внешних связей данной организации полезна информация о рейтинге и научном сотрудничестве, филиалах и т.д.


Страница: