Опубликован: 05.08.2011 | Доступ: свободный | Студентов: 1543 / 82 | Оценка: 4.50 / 3.50 | Длительность: 18:52:00
ISBN: 978-5-9963-0014-3
Специальности: Математик, Экономист
Лекция 2:

Введение в дизайн механизмов

< Лекция 1 || Лекция 2: 1234 || Лекция 3 >

Дизайн механизмов: определения

В этом параграфе мы кратко напомним основные понятия теории игр из прошлой лекции, но приложим их к ситуации дизайна механизмов. Рассмотрим сначала постановку задачи. Что бы мы ни говорили о дизайне, после того самого дизайна начинается собственно игра. В игре участвуют агенты. У игры есть различные исходы. А у каждого агента в этой игре есть некий набор действий, которые он может предпринимать.

Поставим задачу чуть формальнее. Во-первых, введем тип агента \theta_i\in\Theta_i для i -го агента (об этом ниже). У игры есть набор исходов \mathcal O, и для каждого агента каждый исход означает какую-то прибыль (возможно, отрицательную). Так появляется функция полезности (utility function)

u_i(o,\theta_i)

для типа \theta_i и исхода o. Агент i предпочитает исход o_1 исходу o_2, если u_i(o_1,\theta_i) > u_i(o_2,\theta_i).

Стратегия агента — это план, который полностью описывает его поведение во всех возможных состояниях окружающего мира. Через \Sigma_i мы будем обозначать множество стратегий агента i, через s_i(\theta_i)\in\Sigma_i — какую-нибудь конкретную его стратегию. Стратегии бывают чистые и смешанные; чистые стратегии жестко задают поведение в каждом состоянии окружающего мира, смешанные задают распределения вероятностей на множестве возможных действий агента.

Например, в аукционе возрастающей цены состояние мира для агента полностью описывается парой (p,x), где p — текущая цена, а бит x показывает, является ли агент в текущий момент лидером аукциона. Пусть у агента есть своя (скрытая) оценка лота v, и он готов заплатить любую сумму, которая была бы меньше v (получив при этом для себя выгоду, равную разности между v и заплаченной суммой). Тогда так называемая стратегия лучшего ответа (best response strategy) s_{BR}(v) описывается следующим образом:

b_{BR}(p,x,v)=\begin{cases} p, & \text{если }x=0\text{ и }p>v, \\ \text{сидеть молча,} & \text{в противном случае}.\end{cases}

Здесь b (от слова bid) — это ставка, которую должен сделать агент. Понятно, что функцию полезности можно с конкретных исходов продолжить на целые стратегии. Если N агентов имеют фиксированные стратегии (s_1,...,s_N), то функция полезности

u_i(s_1,...,s_N,\theta_i)

будет просто равна функции полезности u_i(o,\theta_i) на исходе o, который однозначно задается этими стратегиями.

Рассмотрим тот же аукцион, в котором участвуют два агента и оба исповедуют стратегию лучшего ответа. Для агента 2 ценность лота v_2=1, для агента 1 она равна v_1. Тогда функция полезности для первого агента будет равна

u_1(s_{BR,1}(v_1), s_{BR,2}(1)) = \begin{cases}v_1-(1+\epsilon), & \text{если }v_1>1, \\ 0, & \text{в противном случае},\end{cases}

где \epsilon — минимальное увеличение цены в аукционе.

Каждый агент пытается максимизировать свою собственную прибыль. Он решает задачу оптимизации, добиваясь оптимальной стратегии, и в результате система оказывается в каком-нибудь состоянии. Мы будем рассматривать возможные определения равновесного состояния системы, к которому она может прийти после решения каждым агентом своей локальной задачи.

Обозначим через

\mathbf s=(s_1,\ldots,s_N)

профиль всех стратегий участников. Как и прежде, через

\mathbf s_{-i}=(s_1,...,s_{i-1},s_{i+1},...,s_N)

мы будем обозначать стратегии всех участников, кроме i. Введем также аналогичные обозначения \mathbf\theta и \mathbf\theta_{-i} для типов агентов.

Ключевое понятие всей теории игр — равновесие Нэша — мы подробно обсуждали на прошлой лекции. Напомним определение в контексте обозначений теории экономических механизмов.

Определение 2.1. Профиль стратегий \mathbf s находится в равновесии Нэша, если каждый агент при данных стратегиях других агентов выбирает для себя оптимальную стратегию:

\forall s^\prime_i\neq s_i\quad u_i(s_i(\theta_i),\mathbf s_{-i}(\mathbf\theta_{-i}), \theta_i)\ge u_i(s^\prime_i(\theta_i),\mathbf s_{-i}(\mathbf\theta_{-i}), \theta_i).

В дилемме заключенного только профиль (\text{Сознаться},\text{Сознаться}) находится в равновесии Нэша — каждому из преступников всегда выгоднее сознаться, чем промолчать. Бывают игры с несколькими равновесиями Нэша.

Пример 2.1. Приведем пример игры, в которой существуют два равновесия Нэша. Рассмотрим двух игроков, возможные действия каждого из которых — опубликовать один бит. При этом, если биты совпадают, игроки получают по $100, а если не совпадают — платят по $100. Матрица игры выглядит так (доходы игроков совпадают, поэтому мы пишем не пару, а одно значение):

0 1
0 $100 -$100
1 -$100 $100

Очевидно, у этой игры два равновесия Нэша: (0,0) и (1,1). В каждом из этих состояний ни одному из игроков не выгодно отклоняться от выбранной стратегии.

Конец примера 2.1.

Равновесие Нэша — фундаментальное понятие, но оно не всегда применимо. Например, оно много чего предполагает о доступной агентам информации. Нужно, чтобы каждый агент знал структуру игры полностью, знал, что другие знают, знал, что все действуют рационально, и, более того, знал, что все выберут одно и то же равновесие Нэша (а их может быть несколько).

На деле агент может и не быть уверен, что все остальные все знают и непременно выберут равновесие Нэша (вообще, редко кто уверен в абсолютной рациональности всех остальных). Но если у агента есть доминантная стратегия, ему все равно.

Определение 2.2. Стратегия s_i называется доминантной, если она (слабо) максимизирует ожидаемую прибыль агента для всех возможных стратегий других агентов:

\forall s^\prime_i\neq s_i,\ \forall \mathbf s_{-i}\in \mathbf\Sigma_i_{-i}\quad u_i(s_i,\mathbf s_{-i},\theta_i)\ge u_i(s^\prime_i,\mathbf s_{-i}, \theta_i).

Получается, что в случае, когда у агента есть доминантная стратегия, ему можно вообще ни о чем не беспокоиться: он в любом случае окажется не в проигрыше.

Сейчас мы рассмотрим первый пример нетривиального дизайна механизмов — аукцион Викри (Vickrey auction). Это аукцион, проводящийся по схеме закрытых ставок (sealed-bid): участники подают свои заявки в конвертах, потом их вскрывают, и объект продается тому, кто предложил самую высокую цену. Например, так обычно проводят тендеры.

Что выгодно делать участнику со скрытой ценностью v, если ему продадут вещь по той цене, которую он запросит? Это довольно сложная задача: если его скрытая ценность максимальна из всех участников, ему нужно сделать заявку больше, чем у следующего за ним, но желательно только чуть-чуть больше, чтобы максимизировать свою прибыль. Участник, конечно, может решить эту задачу — но ему потребуется масса всяческих предположений, равновесие получится только в ожидании (то есть по Байесу-Нэшу), а не в любом случае (не в доминантных стратегиях), и вообще система будет весьма нестабильной. В результате на самом деле никому не лучше — и продавец не максимизирует доход, и всеобщее благосостояние тоже страдает. Мы потом проанализируем этот случай более подробно.

Давайте слегка видоизменим аукцион. В новом аукционе (который и называется аукционом Викри) по-прежнему продают тому, кто больше предложил... но продают по цене, которую предложил второй сверху участник! Оказывается, что в таком аукционе участникам выгодно просто говорить правду о своей скрытой ценности, причем это "выгодно" — самое сильное из возможных.

Теорема 2.1. В аукционе Викри правдивая стратегия b_i(v_i)=v_i является доминантной.

Доказательство. Ожидаемая полезность стратегии b_i(v_i)=v_i равна

u_i(b_i,b^\prime,v_i)=\begin{cases}v_i-b^\prime, & \text{если }b_i>b^\prime, \\ 0, & \text{в противном случае,}\end{cases}

где b^\prime — это наивысшая ставка среди всех остальных агентов. Какие тут могут быть варианты?

  1. Если b^\prime<v_i, то оптимальна любая ставка b_i\ge b^\prime, ведь вещь все равно продадут по цене b^\prime.
  2. Если b^\prime\ge v_i, то, опять же, оптимальна любая ставка b_i\le v_i (все равно не продадут или продадут с нулевой прибылью).

Ставка b_i=v_i подходит для обоих случаев и поэтому является доминантной стратегией. В любом из двух возможных случаев сделать правдивую ставку не хуже, чем любую другую.

Мы только что буквально на пальцах доказали, что в аукционах Викри каждому участнику выгодно сообщать в качестве ставки свою истинную скрытую стоимость. Это очень важное свойство механизмов — правдивость (truthfulness). Позже (в лекции "Принцип выявления предпочтений" ) мы увидим, что на самом деле можно ограничиться только правдивыми механизмами.

Оказывается, что доминантные стратегии гораздо удобнее для агентов: им уже не надо ничего предполагать о других агентах, они могут смело пользоваться доминантной стратегией. Поэтому в дизайне механизмов гораздо приятнее получить механизм с доминантными стратегиями у каждого агента, чем механизм с "обычным" равновесием Нэша.

Но давайте еще раз вернемся к типам агентов; теперь мы предположим, что агент не знает наверняка, каковы типы других агентов, то есть каковы у них функции полезности. Но при этом он знает выплаты для каждого возможного типа, и у него есть некоторое априорное распределение F(\theta) на типах для каждого из других агентов. И, конечно, он пытается максимизировать математическое ожидание своей прибыли в равновесии с такими же оптимизирующими стратегиями других агентов.

Определение 2.3. Профиль стратегий \mathbf s находится в равновесии по Байесу-Нэшу (Bayesian-Nash equilibrium), если каждый агент при известном ему распределении F(\mathbf\theta) на типах других агентов выбирает для себя оптимальную стратегию: \forall s^\prime_i\neq s_i

\mathbf E_{F(\mathbf\theta)} u_i(s_i(\theta_i),\mathbf s_{-i}(\mathbf\theta_{-i}), \theta_i)\ge \mathbf E_{F(\mathbf\theta)} u_i(s^\prime_i(\theta_i),\mathbf s_{-i}(\mathbf\theta_{-i}), \theta_i).

Проще говоря, стратегия агента оптимальна по распределению типов других агентов. В одном конкретном эксперименте вполне возможно, что он будет выбирать неоптимальное поведение, но в среднем при достаточно долгой игре агенту лучше всего выбирать именно эту стратегию.

Равновесие по Байесу-Нэшу обобщает обычное — оно делает более естественные предположения о знаниях агентов. Для каждого фиксированного типа \bar\theta_i оно тоже должно быть оптимальным: \forall s^\prime_i\neq s_i

\mathbf E_{F(\mathbf\theta)}\left[u_i(s_i(\bar\theta_i),\mathbf s_{-i}(\mathbf\theta_{-i}), \theta_i)\mid\bar\theta_i\right] \ge\mathbf E_{F(\mathbf\theta)}\left[u_i(s^\prime_i(\bar\theta_i),\mathbf s_{-i}(\mathbf\theta_{-i}), \theta_i)\mid\bar\theta_i\right].

Но у него есть другие недостатки равновесия Нэша: например, оно в общем случае не единственно. Поэтому хотя равновесие по Байесу-Нэшу получить лучше, чем обычное равновесие Нэша, доминантные стратегии все равно остаются идеальным вариантом.

В итоге мы ввели и рассмотрели три типа равновесий, которые могут возникнуть в наших механизмах. Получается вот такая картинка:

\text{Равновесие в доминантных стратегиях} \\ \succ \text{Равновесие по Байесу-Нэшу} \\ \succ \text{Равновесие Нэша}.

Перейдем теперь собственно к дизайну.

< Лекция 1 || Лекция 2: 1234 || Лекция 3 >