Московский государственный университет имени М.В.Ломоносова
Опубликован: 05.11.2008 | Доступ: свободный | Студентов: 1338 / 258 | Оценка: 4.32 / 4.15 | Длительность: 11:59:00
ISBN: 978-5-9963-0007-5
Специальности: Программист
Лекция 2:

Классификации онтологий

< Лекция 1 || Лекция 2: 123 || Лекция 3 >
Аннотация: В данной лекции рассмотрена классификация онтологий: онтологии верхнего уровня, прикладные онтологии, онтологии предметной области и т.д. Рассмотрены 3 основных принципа классификации онтологий. Также рассмотрены онтологии для обработки текстов на естественном языке (лексические онтологии). Приведены примеры

2.1. Онтологии верхнего уровня, предметных областей, прикладные онтологии

В проектировании онтологий условно можно выделить два направления, до некоторого времени развивавшихся отдельно. Первое связано с представлением онтологии как формальной системы, основанной на математически точных аксиомах. Второе направление развивалось в рамках компьютерной лингвистики и когнитивной науки. Там онтология понималась как система абстрактных понятий, существующих только в сознании человека, которая может быть выражена на естественном языке (или средствами какой-то другой системы символов). При этом обычно не делается предположений о точности или непротиворечивости такой системы.

Таким образом, существует два альтернативных подхода к созданию и исследованию онтологий. Первый (формальный) основан на логике (предикатов первого порядка, дескриптивной, модальной и т.п.). Второй (лингвистический) основан на изучении естественного языка (в частности, семантики) и построении онтологий на больших текстовых массивах, так называемых корпусах.

В настоящее время данные подходы тесно взаимодействуют. Идет поиск связей, позволяющих комбинировать соответствующие методы. Поэтому иногда бывает сложно отделить лексические онтологии с элементами формальных аксиоматик от логических систем с включениями лингвистических знаний.

Независимо от различных подходов можно выделить 3 основных принципа классификации онтологий:

  • по степени формальности;
  • по наполнению, содержимому;
  • по цели создания.

Рассмотрим соответствующие классификации по порядку.

Классификация по степени формальности. "Спектр онтологий"

Обычно люди и компьютерные агенты (программы) имеют некоторое представление о значениях терминов. Программные агенты иногда предоставляют спецификацию входных и выходных данных, которые также могут быть использованы как спецификация программы. Сходным образом онтологии могут быть применены, чтобы предоставить конкретную спецификацию имен терминов и значений терминов. В рамках этого понимания (где онтология является спецификацией концептуальной модели - концептуализации) существует простор для вариаций. Отдельные виды онтологий могут быть представлены как точки на спектре в зависимости от деталей их реализации.

Спектр онтологий. Косая черта разделяет системы, предоставляющие "человеко-понятные" (выше черты) и "машино-понятные" (ниже черты) описания

Рис. 2.1. Спектр онтологий. Косая черта разделяет системы, предоставляющие "человеко-понятные" (выше черты) и "машино-понятные" (ниже черты) описания

На рис. 2.1 изображен так называемый спектр онтологий по степени формальности представления, использованию тех или иных синтаксических конструкций. Каждая точка соответствует наличию некоторых ключевых структур в онтологии, отличающих ее от других точек на спектре. Косая черта условно отделяет онтологии от других ресурсов, имеющих онтологический характер.

Первой точке на спектре соответствует контролируемый словарь, т.е. конечный список терминов (простейшим примером является каталог на основе идентификаторов). Каталоги представляют точную (не многозначную) интерпретацию терминов. Например, каждый раз, ссылаясь на термин "машина", мы будем использовать одно и то же значение (соответствующее некоторому ID в словаре), вне зависимости от того, о чем идет речь в контексте: о "стиральной машине", "автомобиле" или "государственной машине".

Другой спецификацией онтологии может быть глоссарий, представляющий собой список терминов с их значениями. Значения описываются в виде комментариев на естественном языке. Это дает больше информации, поскольку люди могут прочесть такой комментарий и понять смысл термина. Интерпретации терминов могут быть многозначными. Глоссарии непригодны для автоматической обработки программными агентами, но можно, как и ранее, присвоить терминам ID.

Тезаурусы несут дополнительную семантику, определяя связи между терминами. Отношения, свойственные для тезаурусов: синонимия, иерархическое отношение и ассоциация. Ранние иерархии терминов, появившиеся в Сети, определяли термины через операции обобщения и уточнения. Yahoo, например, ввела небольшое число категорий верхнего уровня, таких, как " предметы одежды ". Затем " платье " определялось как вид (женской) одежды. Явная иерархия Yahoo не соответствовала в точности формальным свойствам иерархического отношения ПОДКЛАСС-КЛАСС. В таких иерархиях может встретиться ситуация, в которой экземпляр класса-потомка не является экземпляром класса-предка. Например, общая категория " предметы одежды " имеет подкатегорию " женские " (которая должна была бы более точно называться " женские предметы одежды "), а эта категория, в свою очередь, включает подкатегории " аксессуары " и " платья ". Ясно, что аксессуары, например " броши ", не являются предметами одежды. Здесь не выполняется важное свойство отношения ПОДКЛАСС-КЛАСС - транзитивность.

Далее следует точка формальные таксономии. Эта разновидность онтологий включает точное определение отношения ПОДКЛАСС-КЛАСС (обозначаемого как isA ). В таких системах строго соблюдается транзитивность отношения isA: если A является подклассом класса B, то каждый подкласс класса A также является подклассом класса B. Строгая иерархия классов необходима при использовании наследования для процедуры логического вывода.

Следующая точка спектра - наличие в онтологической системе формального отношения ЭКЗЕМПЛЯР-КЛАСС (обозначаемого как isInstanceOf ). Некоторые классификации включают только имена классов, другие содержат на нижнем уровне экземпляры (индивиды). Для отношения ЭКЗЕМПЛЯР-КЛАСС выполняется так называемая "наследуемость" вдоль отношения isA: если A является подклассом класса B, то каждый экземпляр класса A также является экземпляром класса B. Поэтому в приведенном выше примере " броши " не могут быть помещены в иерархии ниже " предмет одежды ", даже в подкатегорию " женские предметы одежды ", или стать экземпляром этой категории.

Далее среди структурных элементов появляются слоты. Здесь классы (иногда их называют фреймами ) могут иметь информацию о свойствах (слотах). Например, класс " предмет одежды " может иметь свойства " цена ", " сделан из ". Свойства бывают особенно полезными, когда они определены на верхних уровнях иерархии и наследуются подклассами. Так, в потребительской иерархии класс " продукт " может иметь свойство " цена ", которое получат все его подклассы.

Большей выразительностью обладают онтологии, включающие ограничения на область значений свойств. Значения свойств берутся из некоторого предопределенного множества (целые числа, символьные константы) или из подмножества концептов онтологии (множество экземпляров данного класса, множество классов). Можно ввести дополнительные ограничения на то, что может заполнять свойство. Например, для свойства " сделан из " класса " предмет одежды " значения могут быть ограничены экземплярами класса " материал ". Легко увидеть проблемы, которые могут возникнуть в этом случае при использовании нестрогой таксономии. Если " духи " - потомок класса " предмет одежды ", то он унаследует свойство " сделан из " вместе с ограничением на его значения (" материал ").

В целом с необходимостью описывать более сложные факты выразительные средства онтологии (и ее структура) усложняются. Например, может потребоваться заполнить значение какого-либо свойства экземпляра, используя математическое выражение, основанное на значениях других свойств данного экземпляра или значениях свойств других экземпляров. Многие онтологии позволяют объявлять два и более класса дизъюнктивными (непересекающимися). Это означает, что у данных классов не существует общих экземпляров.

Некоторые языки описания онтологий позволяют делать произвольные логические утверждения о концептах - аксиомы.

Языки описания онтологий, такие как CycL и Ontolingua, позволяют фиксировать утверждения на языке логики предикатов первого порядка (FOL).

< Лекция 1 || Лекция 2: 123 || Лекция 3 >