Онтологии предметных областей и прикладные онтологии
5.1. Онтология в области документации в сфере культурного наследия: CIDOC CRM
CIDOC CRM ("Committee on Documentation" "Conceptual Reference Model") представляет собой формальную онтологию, предназначенную для улучшения интеграции и обмена гетерогенной информацией по культурному наследию. Более конкретно, CIDOC CRM определяет семантику схем баз данных и структур документов, используемых в культурном наследии и музейной документации, в терминах формальной онтологии. Модель не определяет терминологию, появляющуюся в конкретных структурах данных, но имеет характерные отношения для ее использования.
Модель может служить как руководством для разработчиков информационных систем, так и общим языком для экспертов предметной области и специалистов по информационным технологиям. Она предназначена для покрытия контекстной информации исторического, географического и теоретического характера об отдельных экспонатах и музейных коллекциях в целом.
Структурно CIDOC CRM состоит из иерархии классов и широкого набора свойств (бинарных отношений), связывающих классы между собой. Все концепты (классы и свойства) модели можно разделить на три группы. Первая группа включает классы и отношения, охватывающие наиболее общие понятия окружающего мира: постоянные и временные сущности, отношения участия, зависимости, совпадения во времени. Вторая группа содержит понятия, частично поддерживающие функции управления: приобретение и учет единиц хранения, передача прав собственности на объекты культуры. К третьей группе относятся классы и свойства, используемые для внутренней организации самой онтологии: средства, необходимые для подключения внешних источников терминов, например, тезаурусов по отраслям культуры.
Иерархия классов модели CIDOC CRM делится на 2 ветви: Постоянные сущности и Временные сущности. Прочие классы являются вспомогательными.
На самых нижних уровнях иерархии классов появляются понятия, характерные для сферы культуры: Хранение, Перемещение (ценностей), " Проект или Процедура " (в том числе техника производства), Период (в том числе художественный стиль). Иерархия классов может быть гибко расширена с применением встроенного класса Тип. Наибольший интерес представляют свойства. Классы на нижних уровнях иерархии имеют около 10-15 свойств, причем большая часть свойств наследуется от классов-предков. Названия свойств представляют собой глагольные фразы, выбранные так, что при последовательном связывании двух классов свойством получается осмысленная фраза с субъектом (первый, если считать слева направо, класс), предикатом (свойством) и объектом (второй класс). Например:
E29_Проект_или_Процедура P68F_обычно_применяет E57_Материал или E33_Лингвистический_Объект P72_имеет_язык E56_Язык
На рис. 5.1-5.4 изображены различные части онтологии CIDOC CRM (снимки экрана сделаны в редакторе Protege).
увеличить изображение
Рис. 5.1. Иерархия классов онтологии CIDOC CRM (в левой части), текстовое описание и свойства класса "Е40.Юридическое_Лицо" (в правой части окна). Здесь можно заметить, что большинство свойств класса "в глубине иерархии" являются унаследованными
увеличить изображение
Рис. 5.2. Иерархия классов онтологии CIDOC CRM. Свойства "на верхних уровнях иерархии" являются прямыми, а не унаследованными
увеличить изображение
Рис. 5.3. Фрагмент иерархии свойств онтологии CIDOC CRM. Свойство "P97B.был_отцом_при" связывает домен "E21.Субъект" и диапазон "Е67.Рождение"
увеличить изображение
Рис. 5.4. Индивиды онтологии CIDOC CRM. В центре экрана изображено диалоговое окно для выбора значения свойства "P89B.содержит" индивида "Россия" класса "E53.Место"