Опубликован: 09.11.2009 | Уровень: для всех | Доступ: свободно
Лекция 1:

Различные виды статистических данных

Лекция 1: 123456789 || Лекция 2 >

1.6. Аксиоматическое введение расстояний

В прикладной статистике используют большое количество метрик и показателей различия (см. примеры в предыдущем пункте). Как обоснованно выбрать то или иное расстояние для использования в конкретной задаче? В 1959 г. американский статистик Джон Кемени предложил использовать аксиоматический подход, согласно которому следует сформулировать естественные для конкретной задачи аксиомы и вывести из них вид метрики. Этот подход получил большую популярность в нашей стране после выхода в 1972 г. переведенной на русский язык книги Дж. Кемени и Дж. Снелла [ [ 1.6 ] ], в которой дана система аксиом для расстояния Кемени между упорядочениями. (Упорядочения, как и иные бинарные отношения, естественно представить в виде квадратных матриц из 0 и 1; тогда расстояние Кемени - это расстояние из примера 7 предыдущего пункта.) Последовала большая серия работ, в которых из тех или иных систем аксиом выводился вид метрики или показателя различия для различных видов данных, прежде всего для объектов нечисловой природы. Многие полученные результаты описаны в обзоре [ [ 1.21 ] ], содержащем 161 ссылку, в том числе 69 на русском языке. Рассмотрим некоторые из наших результатов.

Аксиоматическое введение расстояния между толерантностями. Толерантность - это бинарное отношение, являющееся рефлексивным и симметричным. Его обычно используют для описания отношения сходства между реальными объектами, отношений знакомства или дружбы между людьми. От отношения эквивалентности отличается тем, что свойство транзитивности не предполагается обязательно выполненным. Действительно, Иванов может быть знаком с Петровым, Петров - с Сидоровым, но при этом ничего необычного нет в том, что Иванов и Сидоров не знакомы между собой.

Пусть множество Х, на котором определено отношение толерантности, состоит из конечного числа элементов: X = \{x_1, x_2, ..., x_k\}. Тогда толерантность описывается квадратной матрицей A = ||a(i,j)||, i,j = 1, 2,..., k, такой, что a(i,j) = 1, если x_i и x_j связаны отношением толерантности, и a(i,j) = 0 в противном случае. Матрица A симметрична: a(i,j) = a(j,i), на главной диагонали стоят единицы: a(i,i) = 1. Любая матрица, удовлетворяющая приведенным в предыдущей фразе условиям, является матрицей, соответствующей некоторому отношению толерантности. Матрице А можно сопоставить неориентированный граф с вершинами в точках Х: вершины x_i и x_j соединены ребром тогда и только тогда, когда a(i,j) = 1. Толерантности используются, в частности, при проведении экспертных исследований (см. 11.6).

Будем говорить, что толерантность А_3 лежит между толерантностями А_1 и А_2, если при всех i, j число a_3(i,j) лежит между числами a1(i,j) и a_2(i,j), т.е. выполнены либо неравенства a_1(i,j)\leq a_3(i,j) \leq a_2(i,j), либо неравенства a_1(i,j) \geq a_3(i,j) \geq a2(i,j).

Теорема 1 [ [ 1.15 ] ]. Пусть

(I) d(A_1, A_2) - метрика в пространстве толерантностей, определенных на конечном множестве X = \{x_1, x_2, ..., x_k\} ;

(II) d(A_1, A_3) + d(A_3, A_2) = d(A_1, A_2) тогда и только тогда, когда A_3 лежит между A_1 и A_2 ;

(III) если отношения толерантности A_1 и A_2 отличаются только на одной паре элементов, т.е. a_1(i,j) = a_2(i,j) при (i,j) \ne (i_0,j_0), i<j, i_0 < j_0, и a_1(i_0, j_0) \ne a_2(i_0, j_0), то d(A_1, A_2) = 1.

Тогда

d(A_1,A_2)=\sum_{1\leq i<j\leq k}|a_1(i,j)-a_2(i,j)|=\frac12\sum_{i=1}^k\sum_{j=1}^k|a_1(i,j)-a_2(i,j)|.

Таким образом, расстояние d(A_1, A_2) только постоянным множителем 1/2 отличается от расстояния Кемени, введенного в пространстве всех бинарных отношений как расстояние Хемминга между описывающими отношения матрицами из 0 и 1 (см. пример 7 предыдущего пункта). Теорема 1 дает аксиоматическое введение расстояния в пространстве толерантностей. Оказалось, что оно является сужением расстояния Кемени на это пространство. Сам Дж. Кемени дал аналогичную систему аксиом для сужения на пространство упорядочений. Доказательство теоремы 1 вытекает из рассмотрений, связанных с аксиоматическим введением расстояний между множествами, и приводится ниже.

Мера симметрической разности как расстояние между множествами. Как известно, бинарное отношение можно рассматривать как подмножество декартова квадрата Х_2 того множества Х, на котором оно определено. Поэтому теорему 1 можно рассматривать как аксиоматическое введение расстояния между множествами специального вида. Укажем систему аксиом для расстояния между множествами общего вида, описанного в примере 9 предыдущего пункта.

Определение 1. Множество В находится между множествами А и С, если

(A\bigcap C)\subseteq B\subseteq(A\bigcup C)

С помощью определения 1 в совокупности множеств вводятся геометрические соотношения, использование которых полезно для восприятия рассматриваемых ситуаций.

Расстояние между двумя точками в евклидовом пространстве не изменится, если обе точки сдвинуть на один и тот же вектор. Аналогичное свойство расстояния между множествами сформулируем в виде аксиомы 1. Оно соответствует аксиоме 3 Кемени и Снелла [ [ 1.6 ] , с.22] для расстояний между упорядочениями.

Аксиома 1. Если A\bigcap C=B\bigcap C= \varnothing, то d(A,B)=d(A\cup C,B\cup C).

Определение 2. Непустая система множеств называется кольцом, если для любых двух входящих в нее множеств в эту систему входят их объединение, пересечение и разность. Множество Х называется единицей системы множеств, если оно входит в эту систему, а все остальные множества системы являются подмножествами Х. Кольцо множеств, содержащее единицу, называется алгеброй множеств [ [ 1.9 ] , с.38].

Теорема 2. Пусть W - алгебра множеств, d: W^2 \rightarrow R^1. Тогда аксиома 1 эквивалентна следующему условию: d(A,B) = d(A\setminus B, B\setminus A) для любых A, B \in W.

Доказательство. Поскольку

(A\setminus B)\bigcap(A\bigcap B)= \varnothing, (B\setminus A)\bigcap(A\bigcap B)=\varnothing,

то равенство d(A,B) = d(A\setminus B, B\setminus A) следует из аксиомы 1. Обратное утверждение вытекает из того, что в условиях аксиомы 1

(A\bigcup C)\setminus(B\bigcup C)=A\setminus B,(B\bigcup C)\setminus(A\bigcup C)=B\setminus A.

Теорема 2 доказана.

С целью внести в алгебру множеств W отношение "находиться между", аналогичное используемому при аксиоматическом введении расстояний в пространствах бинарных отношений (см. условие (II) в теореме 1), примем следующую аксиому.

Аксиома 2. Если В лежит между А и С, то d(A,B)+d(B,C)= d(A,C).

Определение 3. Неотрицательная функция \mu, определенная на алгебре множеств W, называется мерой, если для любых двух непересекающихся множеств А и В из W справедливо соотношение

\mu(A\bigcup B)=\mu(A)+\mu(B).

Понятие меры - это обобщение понятий длины линии, площади фигуры, объема тела.

Теорема 3. Пусть W - алгебра множеств, аксиомы 1 и 2 выполнены для функции d: W^2 \rightarrow [0;+\infty]. Функция d симметрична: d(A,B) = d(B,A) для любых А и В из W. Тогда существует, и притом единственная, мера \mu на W такая, что

d(A,B)=\mu(A\Delta B) ( 1)

при всех А и В из W, где А\Delta В - симметрическая разность множеств А и В, т.е. A\Delta B=(A\setminus B)\bigcup(B\setminus A).

Доказательство. Положим

\mu(B)=d(\varnothing,B),B\in W. ( 2)

Покажем, что определенная формулой (2) функция множества \mu является мерой. Неотрицательность \mu следует из неотрицательности d. Остается доказать аддитивность, т.е. что из A\bigcap B=\varnothing следует, что

\mu(A\bigcup B)=\mu(A)+\mu(B), A\in W, B\in W. ( 3)

Поскольку А всегда лежит между \varnothing и A\bigcup B, то по аксиоме 2

\mu(A\bigcup B)=d(\varnothing, A\bigcup B)=d(\varnothing,A)+d(A,A\bigcup B)=\mu(A)+d(A,A\bigcup B). ( 4)

Если А\cap В=\varnothing, то по аксиоме 1 d(\varnothing,B)=d(A,A\bigcup B), откуда с учетом (4) и следует (3).

Докажем соотношение (1). Поскольку А\setminus B и B\setminus A имеют пустое пересечение, то согласно определению 1 пустое множество \varnothing лежит между А\setminus B и B\setminus A. Поэтому по аксиоме 2

d(A\setminus B,B\setminus A)=d(A\setminus B,\varnothing)+d(\varnothing, B\setminus A).

Из симметричности и соотношения (2) следует, что

d(A\setminus B,\varnothing)=d(\varnothing, A\setminus B)=\mu(A\setminus B),

откуда d(A\setminus B, B\setminus A)= \mu(A\setminus B) + \mu(B\setminus A). Из соотношения (3) следует, что \mu(A\setminus B)+\mu(B\setminus A)=\mu(A\Delta B). С другой стороны, по аксиоме 1 d(A\setminus B,B\setminus A)=d((A\setminus B)\bigcup(A\bigcap B),(B\setminus A)\bigcup(A\bigcap B))=d(A,B). Из трех последних равенств вытекает справедливость равенства (1). Остается доказать единственность меры \mu в соотношении (1). Поскольку А\Delta В = В при А = \varnothing, то из (1) следует (2), т.е. однозначность определения меры \mu = \mu(d) по расстоянию d. Теорема 3 доказана.

Теорема 4 (обратная). Пусть \mu - мера, определенная на алгебре множеств W. Тогда функция d(A,B) = \mu(A\Delta B) является псевдометрикой, для нее выполнены аксиомы 1 и 2.

Доказательство. То, что функция d(A,B) из (1) задает псевдометрику, хорошо известно (см., например, [ [ 1.13 ] , с.79]). Доказательство аксиомы 2 содержится в [ [ 1.11 ] , c.181-183]. Аксиома 1 следует из того, что условия A\bigcap C=B\bigcap C=\varnothing обеспечивают справедливость соотношений

(A\bigcup C)\Delta(B\bigcup C)=((A\bigcup C)\setminus(B\bigcup C))\bigcup((B\bigcup C)\setminus(A\bigcup C))=(A\setminus B)\bigcup(B\setminus A)=A\Delta B.

Замечание. Полагая в аксиоме 2 А = В = С, получаем, что d(A,А) + d(A,А) = d(A,А), т.е. d(A,А) = 0. Согласно теоремам 3 и 4, из условий теоремы 3 следует неравенство треугольника. Таким образом, в теореме 3 действительно приведена система аксиом, определяющая семейство псевдометрик в пространстве множеств.

Обсудим независимость (друг от друга) условий теоремы 3. Отбрасывание неотрицательности функции d приводит к тому, что слово "мера" в теоремах 3 и 4 необходимо заменить на "заряд" [ [ 1.9 ] , с.328]. Этот термин обозначает аддитивную функцию множеств, не обладающую свойством неотрицательности. Заряд можно представить как разность двух мер.

Функция d_1(A,B)=\sqrt{\mu(A\Delta B)} является псевдометрикой, для нее выполнена аксиома 1, но не выполнена аксиома 2, следовательно, ее нельзя представить в виде (1).

Приведем пример системы множеств W и метрики в ней, для которых верна аксиома 2, но не верна аксиома 1, а потому эту метрику нельзя представить в виде (1). Пусть W состоит из множеств \varnothing,A,B,A\bigcup B, причем А\cap В = \varnothing, а расстояния таковы:

d(\varnothing,A)=d(\varnothing,B)=1, d(A,A\bigcup B)=d(B,A\bigcup B)=d(A,B)=2, d(\varnothing,A\bigcup B)=3.

Если единица Х алгебры множеств W конечна, т.е. X = \{x_1, x_2,..., x_k\}, то расстояние (1) принимает вид

d(A,B)=\sum_{i=1}^k\mu_i|\chi_A(x_i)-\chi_B(x_i)|, ( 5)

где \chi_С - индикатор (индикаторная функция) множества С, т.е. \chi_С(х) = 1, если х\in С, и \chi_С(х) = 0 в противном случае. Как следует из теоремы 3, неотрицательный коэффициент \mu_i - это мера одноэлементного множества \{x_i\}, а также расстояние этого множества от пустого множества, т.е.

\mu_i=\mu(\{x_i\})=d(\varnothing,\{x_i\}).

Если все коэффициенты \mu_i положительны, то формула (5) определяет метрику, если хотя бы один равен 0, то - псевдометрику, поскольку в таком случае найдутся два различающиеся между собой множества А и В, такие, что d(A,B) = 0.

Расстояние определяется однозначно, если априори известны коэффициенты \mu_i. В частности, равноправность объектов (элементов единицы алгебры множеств Х ) приводит к \mu_i\equiv 1. Требование равноправности содержится в аксиомах 2 и 4 Кемени [ [ 1.6 ] , с.21–22].

Применим полученные результаты к толерантностям и докажем теорему 1. Совокупность всех толерантностей, определенных на конечном множестве Y, естественным образом ассоциируется с совокупностью всех подмножеств множества Х = \{(y_i, y_j), 1\leq i < j\leq k\}. А именно, пара (y_i, y_j) входит в подмножество тогда и только тогда, когда y_i и y_j связаны отношением толерантности. Указанная совокупность подмножеств является алгеброй множеств с единицей Х. Определение 1 понятия "находиться между" для множеств полностью соответствует ранее данному определению понятия "находиться между" для толерантностей.

Теорема 5. Пусть выполнены условия (I) и (II) теоремы 1 и аксиома 1. Тогда существуют числа \mu_{ij} > 0 такие, что

d(A,B)=\sum_{1\leq i<j\leq k}\mu_{ij}|a(i,j)-b(i,j)|. ( 6)

Для доказательства достаточно сослаться на теорему 3. Поскольку в условии (I) требуется, чтобы функция d(A,B) являлась метрикой, то необходимо \mu_ij > 0.

Теорема 6. Пусть выполнены условия теоремы 1 и, кроме того, аксиома 1. Тогда верно заключение теоремы 1.

Доказательство. Рассмотрим толерантность А, для которой a(i,j) = 1 при (i,j) = (i_0,j_0) и a(i,j) = 0 в противном случае. Согласно условию (III) теоремы 1 d(\varnothing,A)=1, а согласно (6) имеем d(\varnothing,A)=\mu_{i_0 j_0}. Следовательно, коэффициент \mu_{i_0 j_0} = 1, что и требовалось доказать.

Для окончательного доказательства теоремы 1 осталось избавиться от требования справедливости аксиомы 1.

Доказательство теоремы 1. Рассмотрим две толерантности А и В такие, что при представлении их в виде множеств A\subseteq B. Это означает, что a(i,j)\leq b(i,j) при всех i,j. Поскольку Х - конечное множество, то существует конечная последовательность толерантностей A_1, A_2, ..., A_m, ..., A_t такая, что А_1 = А, A_t = B, A_1 \subseteq A_2\subseteq ... \subseteq A_m \subseteq ... \subseteq A_t, причем A_m+1 получается из A_m заменой ровно одного значения a_m(i_m, j_m) = 0 на a_{m+1}(i_m, j_m) = 1, для (i, j) \ne (i_m, j_m), при этом a_m(i,j)= a_{m+1}(i,j). Тогда A_m находится между A_{m-1} и A_{m+1}, следовательно, по условию (II)

d(A,B)=d(A_1,A_2)+d(A_2,A_3)+...+d(A_m,A_{m+1})+...+d(A_{t-1},A_t).

По условию (III) d(A_m,A_{m+1}) = 1 при всех m, а потому заключение теоремы 1 верно для любых А и В таких, что A\subseteq B.

Поскольку А\cap В лежит между А и В, то по условию (II)

d(A,B)=d(A\cap B,A)+d(A\cap B,B)

При этом А\cap В\subseteq А и А\cap В\subseteq В. Применяя результат предыдущего абзаца, получаем – заключение теоремы 1 верно всегда.

Замечание 1. Таким образом, условие (III) не только дает нормировку, но и заменяет аксиому 1.

Замечание 2. Условие (I) теоремы 1 не использовалось в доказательстве, но было приведено в первоначальной публикации [ [ 1.14 ] ], чтобы подчеркнуть цель рассуждения. По той же причине оно сохранено в формулировке теоремы 1, хотя в доказательстве удалось без него обойтись. Понадобилась только симметричность функции d.

Лекция 1: 123456789 || Лекция 2 >
Анастасия Маркова
Анастасия Маркова

Здравствуйте!

4 июня я записалась на курс Прикладная статистика. Заплатила за получение сертификата. Изучала лекции, прошла Тест 1.

Сегодня вижу, что я вне курса! Почему так произошло?