logo
представление знаний

Онтологии предметных областей на примере онтологии cidoc crm.

CIDOC CRM (Conceptual Reference Model), представляющей собой формальную онтологию, предназначенную для улучшения интеграции и обмена гетерогенной информацией по культурному наследию. Более конкретно, CRM определяет семантику схем баз данных и структур документов, используемых в культурном наследии и музейной документации,

в терминах формальной онтологии. Модель не определяет терминологию, появляющуюся в конкретных структурах данных, но имеет характерные отношения для ее использования.

Модель может служить, как руководством для разработчиков информационных систем, так и общим языком для экспертов предметной области и специалистов по информационным технологиям. Она предназначена для покрытия контекстной информации исторического, географического и теоретического характера об отдельных экспонатах и музейных коллекциях в целом.

Структурно CRM состоит из иерархии классов и широкого набора свойств (бинарных отношений), связывающих классы между собой. Все концепты (классы и свойства) модели можно разделить на три группы. Первая группа включает классы и отношения, охватывающие наиболее общие понятия окружающего мира: постоянные и временные сущности, отношения участия, зависимости, совпадения во времени. Вторая группа содержит понятия, частично поддерживающие функции управления: приобретение и учет единиц хранения, передача прав собственности на объекты культуры. К третьей группе относятся классы и свойства, используемые для внутренней организации самой онтологии: средства необходимые для подключения внешних источников терминов, например, тезаурусов по отраслям культуры. Иерархия классов модели CRM делится на 2 ветви: Постоянные сущности и Временные сущности. Прочие классы являются вспомогательными.

На самых нижних уровнях иерархии классов появляются понятия характерные для сферы культуры: Хранение, Перемещение (ценностей), Проект или Процедура (в том числе техника производства), Период (в том числе художественный стиль). Иерархия классов может быть гибко расширена, используя встроенный класс Тип. Наибольший интерес представляют свойства. Классы на нижних уровнях иерархии имеют около 10-15 свойств. Причем большая часть свойств наследуется от классов-предков. Названия свойств представляют собой глагольные фразы, выбранные так, что при последовательном связывании двух классов свойством получается осмысленная фраза с субъектом (первый, если считать слева направо, класс), предикатом (свойством) и объектом (второй класс).

Лексические онтологии (семейство Wordnet). Типы отношений.

Операции над онтологиями(выравнивание, отображение, мэппинг) и их поддержка в редакторах онтологий.

Языки описания онтологий. Основы RDF.

RDF

RDF – язык представления информации о ресурсах WWW. В частности, RDF служит для представления метаданных связанных с ресурсами Сети, таких как заголовок, автор, дата последнего изменения страницы. Но RDF используется и для представления информации о ресурсах «второго типа», на которые можно только ссылаться (или идентифицировать в Сети при помощи URI), но к ним невозможно непосредственно получить доступ через Сеть.

Может оказаться что, в некоторых случаях для управления метаданными достаточно использовать XML и XML Schema (либо вообще ограничиться подэлементом HEAD элемента HTML). Но этот подход слабо масштабируется: при увеличении объема метаданных, усложнении их структуры управление метаданными построенными на основе XML Schema становиться трудоемкой задачей, для решения которой и предназначен RDF.