Опубликован: 05.08.2011 | Уровень: профессионал | Доступ: платный
Лекция 8:

Теорема Робертса

< Лекция 7 || Лекция 8: 12345 || Лекция 9 >
Аннотация: В этом курсе мы все время говорим о том, как бы нам реализовать ту или иную функцию социального выбора, как построить механизм, который добивается нужного результата. В этом — одна из основных задач классического дизайна экономических механизмов (другие задачи, например эффективность получившихся конструкций, — предмет буквально самых последних исследований; их мы коснемся в следующем курсе).

Введение

Для функций ценности самого общего вида мы в лекции "Теоремы Эрроу и Гиббарда-Саттертуэйта" уже говорили о теореме Гиббарда-Саттертуэйта (теорема 6.2). Мы доказывали, что если допустить любые порядки на множестве возможных исходов, то реализовать можно только диктаторские функции социального выбора, выгодные ровно одному участнику.

Результат, конечно, весьма печальный. Но неужели ничего нельзя сделать? В математике обычно, если общий факт никак не доказывается или общая конструкция никак не строится, пытаются рассмотреть ограниченную постановку, которая, однако, продолжает иметь смысл.

Для теоремы Гиббарда-Саттертуэйта аналогичный вопрос разумно было бы задать для квазилинейных предпочтений — для ситуации, когда функция полезности каждого агента представляет собой разность между его внутренней ценностью от наступившего исхода и той ценой, которую он должен в результате этого исхода заплатить. Такие предпочтения — более чем естественное предположение; в самом деле, ну как же еще? Но для этих предпочтений теорема Гиббарда-Саттертуэйта уже не слишком-то применима: такого, как там, произвольного порядка предпочтений на всем множестве исходов уже может не получиться построить. Поэтому и теорема о невозможности — а в этой лекции мы опять будем доказывать теорему о невозможности — здесь уже не такая пессимистичная, как теорема Гиббарда-Саттертуэйта. Я бы даже назвал ее не теоремой о невозможности, а теоремой классификации: да, мы классифицируем все реализуемые функции социального выбора, но их окажется вовсе не так мало, и среди них будут практически все естественные функции.

Теорема Робертса, как нетрудно догадаться, доказана была Кевином Робертсом [71]. Его доказательство было достаточно сложным технически, и за деревьями трудно было рассмотреть лес, то есть основную базовую идею доказательства. Поэтому доказательства, которые мы приводим в этой лекции, отличаются от оригинального доказательства Робертса; мы изложим два (достаточно существенно отличающихся друг от друга) упрощенных доказательства теоремы Робертса, представленных не так давно Лави, Му-алем и Нисаном [40].

Здесь, однако, стоит заметить, что мы докажем теорему Робертса только для случая неограниченного множества типов. В реальной жизни множества типов часто бывают ограничены, и структура этих ограничений бывает довольно прихотливой. Но в общем случае ответа на этот вопрос до сих пор нет, есть только частные результаты [26,40]. Поэтому будем излагать то, что есть.

Определения

Для начала напомним основные определения. У механизма есть набор исходов \mathcal O (в этой лекции мы их будем обозначать через x,y,z,...). Есть N игроков, и у каждого есть свой тип v_i. Этот тип — просто набор ценностей, которые игрок может присвоить каждому исходу. Например, в ситуации аукциона по продаже одного предмета, о которой мы часто говорили, набор исходов \mathcal O — это то, кому достается вещь (фактически множество исходов равно множеству агентов), а тип v_i — это функции полезности агента от возможного исхода, которые равны нулю, если эту вещь отдали кому-то другому, или самой ценности, если вещь дали данному игроку:

v_i(x) = \begin{cases}v_i, & x = i, \\ 0, & \text{в противном случае}.\end{cases}

Мы будем называть множество типов неограниченным, если каждый агент теоретически может присвоить каждому исходу любое вещественное число.

Определение 8.1.Множество типов \mathbf V = V_1\times V_2\times\ldots\times V_N называется неограниченным, если V_i = \mathbb R^{|\mathcal O|} для каждого i.

В дальнейшем в этой лекции мы всегда будем рассматривать только неограниченные множества типов. Разумеется, суть здесь не в плюс-минус бесконечностях, подошел бы и любой открытый интервал — важно, что очередной агент имеет возможность выбрать ставку, которая строго больше всех остальных (да и вообще может находиться где угодно относительно других ставок — между любыми двумя вещественными числами найдется изрядное количество других вещественных чисел).

Следующий объект, который нас интересует, — это функция социального выбора f:\mathbf V\to\mathcal O. Можно без потери общности предположить, что f сюръективна; если это не так, мы просто ограничим \mathcal O на im(f)\subset\mathcal O, не потеряв ни одного реально возможного исхода, то есть не изменив ни стратегий агентов, ни результатов этих стратегий.

Кроме того, механизм берет с игроков платежи p_i:\mathbf V\to\mathbb R. А игроки квазилинейны, то есть они хотят максимизировать себе функцию дохода (utility function)

u_i = v_i\left(\vphantom{1^2}f(\mathbf v)\right) - p_i(\mathbf v).

В этой лекции мы будем вести речь о реализации функций социального выбора в доминантных стратегиях.

Определение 8.2. Функция социального выбора f правдиво реализуема, если существуют функции платежа p_i, для которых правдивость будет доминантной стратегией.

От нас в конструкции механизма зависит только p_i (потому что распределение исходов задается функцией социального выбора), поэтому задача сводится к следующей: нам нужно так подобрать значения p_i, чтобы в конце концов эгоистичные агенты, действуя для максимизации своих u_i (которые у них квазилинейные), максимизировали f.

Формально говоря, для каждого i, каждого \mathbf v_{-i}\in \mathbf V_{-i} и каждого v^\prime\in V_i доходность, которую получит агент, сказав правду, больше доходности, которую получит агент, солгав:

v_i\left(\vphantom{1^2}f(\mathbf v)\right) - p_i(\mathbf v) \ge v_i\left(\vphantom{1^2}f(v^\prime_i,\mathbf v_{-i})\right) - p_i(v^\prime_i, \mathbf v_{-i}).

В лекции "Теорема об эквивалентности доходности" мы уже говорили, что все функции социального выбора, оптимизирующие суммарную полезность, она же общественное благосостояние, правдиво реализуемы VCG-платежами (точнее говоря, функция социального выбора, которая оптимизирует общественное благосостояние – она одна, и она реализуема посредством VCG-механизма). Более того, легко видеть, что точно так же реализуемы и функции социального выбора, оптимизирующие взвешенное общественное благосостояние, то есть функции, которые с разными весами учитывают счастье разных агентов.

Задача этой лекции состоит в том, чтобы доказать обратное утверждение. Мы докажем, что оптимизацией таких вот "взвешенно-эффективных" функций социального выбора, собственно, и исчерпываются все возможности, которые у нас есть с квазилинейными агентами.

Теорема 8.1. (Теорема Робертса) Пусть |\mathcal O|\ge 3, и множество типов \mathbf V — неограниченное. Тогда для каждой правдиво реализуемой функции социального выбора f существуют неотрицательные веса k_1,...,k_N, не все равные нулю, и константы C_x, x\in\mathcal O, для которых для всех \mathbf v\in \mathbf V

f(\mathbf v) \in  argmax_{x\in\mathcal O}\left\{\sum\limits_{i=1}^nk_iv_i(x) + C_x\right\}.

Условия монотонности и их следствия

Оба доказательства теоремы Робертса (да и исходное) основаны на условиях монотонности. Мы сначала докажем, что для правдивой реализуемости f должна удовлетворять этим условиям, а затем, в доказательстве самой теоремы, докажем, что функция, удовлетворяющая таким условиям, имеет требуемый вид. Начнем со свойства слабой монотонности.

Определение 8.3. W-MON — слабая монотонность (weak monotonicity, отсюда и W-MON). f удовлетворяет свойству W-MON, если для всех типов v_i, v^\prime_i\in V_i и для любого вектора остальных типов \mathbf v_{-i} при f(\mathbf v)=x и f(v^\prime_i,\mathbf v_{-i}) = y

v^\prime_i(y) - v_i(y) \ge v^\prime_i(x) - v_i(x).

Иначе говоря, если игрок i может изменить свой тип с v_i на v^\prime_i, при этом изменив исход с x на y, то разность его значений для y должна быть не меньше, чем разность его значений для x. Вот так, ненавязчиво, здесь появляются разности, которые будут ключевыми объектами в дальнейших рассуждениях. %Стоит также заметить, что разности нужно использовать из-за квазилинейности.

Лемма 8.1. Всякая доминантно реализуемая функция социального выбора f удовлетворяет W-MON.

Доказательство. Во-первых, докажем, что p_i не зависит от v_i. Другими словами, если функция правдиво реализуется механизмом, то функция платежа уже не зависит от ставки.

Предположим противное. Что значит, функция платежа зависит от ставки? Это значит, что есть такие \mathbf v_{-i}, x, v_i и v^\prime_i, что исход один и тот же, но платеж при этом разный:

f(v_i, \mathbf v_{-i}) = f(v^\prime_i, \mathbf v_{-i}) = x,\quad p_i(v_i,\mathbf v_{-i}) < p_i(v^\prime_i, \mathbf v_{-i}).

Тогда очевидно, что при векторе типов \mathbf v игроку i выгодно солгать. Следовательно, у правдиво реализуемой функции такого быть не может.

Теперь зафиксируем \mathbf v_{-i}, v_i, v^\prime_i, x, y так, как было в определении W-MON. Из-за правдивой реализуемости должно быть верно, что

v_i(x) - p_i(x, \mathbf v_{-i}) \ge v_i(y) - p_i(y, \mathbf v_{-i}),

иначе при типе v_i игрок i сможет улучшить себе доход, солгав v^\prime_i. Аналогично,

v^\prime_i(y) - p_i(y, \mathbf v_{-i}) \ge v^\prime_i(x) - p_i(x, \mathbf v_{-i}).

Сложив эти два неравенства и сократив p_i получим искомое условие W-MON. Таким образом, W-MON необходимо для правдивой реализуемости.

Второе условие монотонности — свойство PAD (Positive Association of Differences). Это можно перевести как "положительная ассоциация разностей", но большого смысла в этом нет, потому что название не очень "говорящее"; пусть останется просто PAD.

Определение 8.4. Функция социального выбора f удовлетворяет PAD, если для всех v,v^\prime\in V верно следующее: если f(v) = x и

v^\prime_i(x) - v_i(x) > v^\prime_i(y) - v_i(y)

для всех y\in\mathcal O\setminus x и всех i, то f(v^\prime) тоже равно x.

Свойство PAD тоже рассматривает разности, и оно легко следует из W-MON.

Лемма 8.2. Всякая доминантно реализуемая функция социального выбора f удовлетворяет PAD.

Доказательство. Мы уже доказали, что она удовлетворяет W-MON. Теперь зафиксируем типы v и v^\prime из определения PAD. Схему доказательства, которую мы сейчас применим, мы уже неоднократно отрабатывали на предыдущих лекциях. Введем промежуточные векторы типов, будем менять их пошагово и докажем по индукции, что на каждом шаге тип сохраняется. Промежуточные векторы определим так:

\mathbf v^i = (v^\prime_1,\ldots,v^\prime_i,v_{i+1},\ldots,v_N).

Тогда

f(\mathbf v^0) = x,\quad \mathbf v^0 = v,\quad \mathbf v^N = v^\prime.

Предположим теперь противное: пусть f(\mathbf v^{i-1}) = x, а f(\mathbf v^i) = y\neq x. Тогда можно применить W-MON:

v^\prime_i(y) - v_i(y) \ge v^\prime_i(x) - v_i(x),

что противоречит предположению PAD. Значит, f(\mathbf v^i)=x. Утверждение леммы теперь следует индукцией по i.

Мы будем пользоваться PAD и в еще одной форме. Рассмотрим два вектора \alpha,\beta\in\mathbb R^N. Будем обозначать \alpha > \beta, когда имеет место строгое неравенство в каждой компоненте ( \forall i \alpha_i>\beta_i ). Также обозначим через \bf 0 нулевой вектор.

Лемма 8.3. Пусть функция социального выбора f удовлетворяет PAD. Зафиксируем \mathbf v,\mathbf v^\prime\in \mathbf V. Если f(\mathbf v^\prime) = x, и \mathbf v^\prime(y) - \mathbf v(y) > \mathbf v^\prime(x) - \mathbf v(x) для некоторого исхода y\in\mathcal O, то f(\mathbf v)\neq y. \end{lem}

Доказательство. Так как в каждой компоненте имеет место строгое неравенство, то, следовательно, можно построить вектор \delta > \bf 0, равный разности двух векторов из исходного неравенства:

\delta = \mathbf v^\prime(y) - \mathbf v(y) - \mathbf v^\prime(x) + \mathbf v^\prime(x)\in\mathbb R^N.

Кроме того, для каждого i

v_i(x) - v^\prime_i(x) - \frac{\Delta_i}2 = v_i(y) - v^\prime_i(y) + \frac{\Delta_i}2 > v_i(y) - v^\prime_i(y).

Определим теперь новый тип \mathbf v^{\prime\prime}\in\mathbf V:

v^{\prime\prime}_i(z) = \begin{cases} \min\{v_i(z), v^\prime_i(z) + v_i(x) - v^\prime_i(x)\} - \Delta_i, & z\neq x,y,\\ v_i(x) - \frac{\Delta_i}2, & z = x,\\ v_i(y), & z = y. \end{cases}

Это сугубо техническая конструкция, которая нужна для того, чтобы придти к противоречию: при такой конструкции из PAD будет одновременно следовать, что f(\mathbf v^{\prime\prime}) = y и что f(\mathbf v^{\prime\prime}) = x.

С одной стороны получаем, что

v^{\prime\prime}_i(y) - v_i(y) = 0 > v^{\prime\prime}_i(z) - v_i(z),

и из PAD следует, что f(\mathbf v^{\prime\prime}) = y.

С другой стороны, для z\neq x,y

v^{\prime\prime}_i(z) \le v^\prime_i(z) + v_i(x) - v^\prime_i(x) - \Delta_i,

и

v^{\prime\prime}_i(x) - v^\prime_i(x) = v_i(x) - v^\prime_i(x) - \frac{\Delta_i}2 > v^{\prime\prime}_i(z) - v^\prime_i(z).

Анналогично для z=y. Тогда из PAD получается, что f(\mathbf v^{\prime\prime}) = x, откуда приходим к противоречию.

Теперь, когда мы изучили все дополнительные леммы об условиях монотонности, можно наконец-то перейти к доказательствам собственно теоремы Робертса.

< Лекция 7 || Лекция 8: 12345 || Лекция 9 >
Елизавета Мишарина
Елизавета Мишарина
Россия, г. Екатеринбург. Онуфриева 50, кв.136
Дмитрий Роор
Дмитрий Роор
Россия, Барнаул