Опубликован: 05.08.2011 | Уровень: профессионал | Доступ: платный
Лекция 8:

Теорема Робертса

< Лекция 7 || Лекция 8: 12345 || Лекция 9 >

Первое доказательство

Чтобы показать, что функция — это аффинный максимизатор, на самом деле нужно изучать разности. Это потому, что аффинная максимизация на самом деле эквивалентна системе неравенств

\sum\limits_{i=1}^N k_i\left(\vphantom{1^2}v_i(x) - v_i(y)\right) \ge C_y - C_x,

где f(v) = x\neq y (рекомендуем читателю не лениться и проверить эту эквивалентность). Мы будем изучать структуру этих самых разностей.

Главное множество, которое мы будем изучать, — это

P(x,y) = \left\{\vphantom{1^2}\alpha\in\mathbb R^N\mid \exists \mathbf v: \mathbf v(x) - \mathbf v(y) = \alpha, f(\mathbf v) = x\right\}.

Проще говоря, если f(\mathbf v) = x, то \mathbf v(x) - \mathbf v(y)\in P(x,y).

В течение доказательства мы увидим, какова структура множеств P(x,y), и в конце концов покажем, что P(x,y) — это полупространство. В частности, мы сделаем два важных замечания о структуре P(x,y). Во-первых,

\begin{equation}
\alpha\in P(x,y)\text{ тогда и только тогда, когда }-\alpha\notin P(y,x),
\end{equation} ( 8.1)

причем внутренности P(x,y) и P(y,x) не пересекаются.

А во-вторых, для внутренних точек упомянутых множеств

\begin{equation}
P(x,y) + P(y, z) = P(x,z).
\end{equation} ( 8.2)

Для чего нужны эти свойства? Предположим, что \bf 0\in P(x,y) для всех x,y\in\mathcal O (на самом деле это не обязательно так, и нам позже придется сместить множества P(x,y) ). Тогда по второму условию все P(x,y) равны. Введем новое обозначение – пусть они равны C. По первому условию C\cup -C = \mathbb R^N: если \alpha\notin C, то -\alpha\in C. Также из первого условия следует, что Cвыпуклое множество: если \frac12(\alpha+\beta)\notin C, то -\frac12(\alpha+\beta)\in C, и тогда, используя второе условие, получаем, что \alpha+\beta\in C, а значит, \alpha + \beta - \frac12(\alpha+\beta)\in C. Противоречие.

Таким образом, C и -C покрывают все пространство, выпуклы, и их внутренности не пересекаются. Это в точности означает, что они являются подпространствами.

Теперь, объяснив идею будущего доказательства, перейдем к нему самому. Начнем с простейших свойств P(x,y). Так как f — сюръекция, то P(x,y) непусто для любых x и y. Также,

\begin{equation}
\text{если }\alpha\in P(x,y),\text{ то }\forall\ \delta>\bf 0\in\mathbb
R^N\quad \alpha+\delta\in P(x,y).
\end{equation} ( 8.3)

Чтобы это доказать, рассмотрим v: f(v) = x и \mathbf v(x) - \mathbf v(y) = \alpha. Увеличим \mathbf v(x) на \delta (мы можем это сделать, так как множества типов \mathbf V у нас неограниченные), и получится, что \alpha+\delta тоже будет лежать в P(x,y).

Следующая лемма докажет нам свойство 8.1 для внутренних точек множества P(x,y).

Лемма 8.4. Рассмотрим произвольные векторы \alpha, \epsilon\in P(x,y). Тогда

\begin{array}{rlcl} \text{если }&\alpha-\epsilon\in P(x,y), & \text{ то } &-\alpha\notin P(y,x),\\ \text{а если }&\alpha\notin P(x,y), & \text{ то } &-\alpha\in P(y,x). \end{array}

Доказательство. Сначала докажем первую часть леммы. Предположим противное: пусть, наоборот, -\alpha\in P(y,x). Тогда существует такой вектор типов \mathbf v, что

\mathbf v(y) - \mathbf v(x) = -\alpha,\text{ и }f(\mathbf v) = y.

Но так как \alpha-\epsilon\in P(x,y), то, значит, существует такой вектор типов \mathbf v^\prime, что \mathbf v^\prime(x) - \mathbf v^\prime(y) = \alpha-\epsilon, и f(\mathbf v^\prime) = x. Тогда верно, что

\mathbf v(x)-\mathbf v(y) = \alpha > \mathbf v^\prime(x) - \mathbf v^\prime(y) = \alpha-\epsilon,

а это противоречит лемме 8.3. Вторая часть леммы доказывается абсолютно аналогично — ее мы оставим читателю.

Пока что мы доказали, что внутренние области P(x,y) и P(y,x) не пересекаются, и объединение P(x,y) и -P(y,x) составляет все пространство.

Отметим еще, что из свойства 8.3 следует, что граница у P(x,y) монотонно невозрастающая. Действительно, если граница будет возрастающей, то тогда мы сможем прибавить \alpha к \delta и попасть вне P(x,y).

Осталось только показать, что границы являются гиперплоскостями, и тогда мы докажем все необходимые свойства P(x,y). Также стоит показать, что P(x,y)=P(y,x).

Следующая лемма — это доказательство свойства 8.2. В ней понятие "внутренней точки" приобретает исконный смысл, по определению: если \alpha\in P(x,y) — внутренняя точка, то, значит, для всех достаточно коротких векторов \epsilon^\alpha\in\mathbb R^N верно, что \alpha-\epsilon^\alpha\in P(x,y).

Лемма 8.5. Рассмотрим некоторые векторы \alpha,\beta\in\mathbb R^N и некоторые векторы \epsilon^\alpha, \epsilon^\beta\in\mathbb R^N, такие, что \epsilon^\alpha,\epsilon^\beta>\bf 0. Тогда, если

\alpha-\epsilon^\alpha\in P(x,y)\text{ и }\beta - \epsilon^\beta\in P(y, z),

то

\alpha+\beta-\frac{\epsilon^\alpha + \epsilon^\beta}2\in P(x,z).

Доказательство. Выберем исход w\neq x,y,z (обратите внимание — мы по делу пользуемся тем, что |\mathcal O|>3!) и векторы \delta^w\in P(x,w), \epsilon>\bf 0\in\mathbb R^N. Также выберем такой вектор типов \mathbf v, что

\mathbf v(x)-\mathbf v(y) = \alpha - \frac{\epsilon^\alpha}2,\quad \mathbf v(y)-\mathbf v(z) = \beta - \frac{\epsilon^\beta}2,\quad \mathbf v(x)-\mathbf v(w) = \delta^w+\epsilon.

Значит, они лежат в соответствующих множествах:

\mathbf v(x)-\mathbf v(y)\in P(x,y),\quad \mathbf v(y)-\mathbf v(z)\in P(y,z),\quad \mathbf v(x)-\mathbf v(w)\in P(x,w).

Тогда, по лемме 8.3, f(v)=x, и, следовательно,

\alpha+\beta - \frac{\epsilon^\alpha + \epsilon^\beta}2 = \mathbf v(x) - \mathbf v(z),

а \mathbf v(x) - \mathbf v(z), несомненно, лежит в P(x,z).

Вернемся к доказательству теоремы. Если бы было верно, что 0\in P(x,y), то мы бы уже доказали всю теорему, так как лемма 8.5, примененная к \bf 0, доказывала бы, что внутренности всех P(x,y) равны. Мы бы доказали, что P(x,y) = P(w,w), прибавляя к какому-нибудь \alpha нулевые векторы. Но нулевой вектор в P(x,y) лежать, конечно, не обязан.

Чтобы обойти эту досадную трудность, давайте возьмем каждое множество P(x,y) и сдвинем его на

\gamma(x,y) = \inf\{p\in\mathbb R\mid p\cdot 1\in P(x,y)\},

где \bf 1вектор из всех единиц. Число \gamma(x,y) — это нижняя граница множества тех чисел, для которых гиперплоскость \mid p\cdot \bf 1 начинает пересекаться с P(x,y). То есть рассмотрим множество P(x,y), подопрем его гиперплоскостью и начнем эту гиперплоскость понемногу опускать. Когда она наконец-то коснется P(x,y), ее коэффициент будет равен \gamma(x,y).

< Лекция 7 || Лекция 8: 12345 || Лекция 9 >
Елизавета Мишарина
Елизавета Мишарина
Россия, г. Екатеринбург. Онуфриева 50, кв.136
Дмитрий Роор
Дмитрий Роор
Россия, Барнаул