Санкт-Петербургский государственный университет
Опубликован: 12.07.2013 | Доступ: свободный | Студентов: 246 / 38 | Длительность: 09:36:00
Специальности: Программист
Лекция 5:

Мультиагентное управление

Задача консенсуса на графах

Поясним обозначения, использующиеся далее. Верхний индекс у переменных будем используется в качестве индекса, а не показателя степени. Для матрицы A элемент, находящийся на ее i-й строке и в j-м столбце называется (i,j)-м элементом и обозначается как a^{i,j} . Для вектора или матрицы Mопределим норму Фробениуса \lvert M \rvert=[Tr(M^TM]^{1/2}. Будем использовать 1_k \in P^k, чтобы определить вектор-столбец из k единиц. Для вектор-столбцов Z_1,...,Z_l,[Z_1;...;Z_l] определяет вектор-стоблец, полученный вертикальным соединением lвекторов.

Для описания топологии сети будем использовать понятия теории графов. Ориентированный граф (орграф) G=(N,E) состоит из множества узлов N={1,…,n} и множества ребер E. Ребро определяется упорядоченной парой (i,j) \in N \times N, где i \neq j. Направленный путь (из узла i_1 в узел i_l) состоит из последовательности узлов i_1,…,i_l, l \geqslant 2 таких, что (i_k,i_{k+1}) \in E. Орграф G называется сильно связным , если из любого узла в любой другой узел существует направленный путь. Направленное дерево – это орграф, в котором каждый узел i, кроме корня, имеет ровно одного родителя j, такого, что (j,i) \in E. Будем называть \overline G= (\overline N, \overline E) подграфом G, если \overline N \subset N и \overline E \subset E \cap \overline N \times \overline N. Будем говорить, что орграф содержит остовное дерево , если существует направленное дерево G_{tr}=(N,E_{tr}) как подграф G. Матрицей связности графа G называется матрица размером  \times \n> такая, что A_G=(a^{i,j})_{1 \leqslant i, j \leqslant n}, где a^{i,j}=1, если (i,j) \in E и  a^{i,j}=0 в остальных случаях. Если Gнеориентированный граф, то каждое ребро определяется как неупорядоченная пара (i,j), где i \neq j.

Топология динамической сети, показывающая принимаемые сигналы моделируется с помощью последовательности орграфов {G_t=(N,E_t)}_{t \geqslant0}, где , а каждое E_t \subset E и случайно меняется во времени. Матрица связности A_{G_t}матрица, которая полностью определяет E_t. Если (j,i) \in E_t, то говорим, что узел i получает информацию от узла j, который называется соседом узла i. Обозначим N^i_t=\lbrace j \lvert (j,i) \in E_t \rbrace – множеством соседей узла i. Множество соседей подмножества  N_{\overline N} определяется следующим образом:

N_{\overline N}:= \bigcap\limits_{i \in \overline N}N^i_t=\lbrace j \in  N: i \in\overline N,(i,j) \in E \rbrace ( 1)

Пусть x^i_t \in R определяет состояние узла i в момент времени t \in \lbrace 0,1,2,…\rbrace. Определим информационный поток в сети как G_x=(G_t,X_t), где X_t=[x^1_t,…,x^n_t],t \geqslant 0 набор значений состояний узлов сети, X_t \in P^n, а G_t топология . Состояниями узла могут быть, например, физические характеристики (положение, температура, напряжение и др.). В динамической сети с переменной топологией информационный поток G_x – это дискретное состояние системы, меняющееся во времени. Будем говорить, что узлы i и j согласованы в сети тогда и только тогда, когда x^i_t=x^j_t, и узлы достигли консенсуса тогда и только тогда, когда x^i_t=x^j_tдля любых i,j \in N, i \neq j. Когда все узлы сети согласованы, общее значение узлов называется групповым решением .

Если узлы графа – динамические агенты , описываемые уравнениями:

\dot{x}^i_t=f^i(x^i_t,u^i_t), i \in N, ( 2)

то динамический граф(или динамическая сеть) – это динамическая система с состояниями (G_t,X_t), в которой X_t меняется в соответствии с динамикой сети

\dot{X}_t=F(X_t,U)=[f^1(x^1_t,u^1_t,...,f^n(x^n_t,u^n_t)], где U=[u^1_t,...,u^n_t]

Будем считать, что в момент времени t, если N^i_t \neq \varnothing узел i получает, возможно, устаревшую информацию от своих соседей, моделируемую следующим образом:

y^{ik}_t=x^k_{t-d^{ik}_t}+w^{ik}_t, k \in N^i_t ( 3)

где  w^{ik}_t – помехи, а d^{ik}_t \geqslant – целочисленная случайная задержка. Так как система начинает работу при t=0, неявным требованием к множеству соседей будет:

k \in N^i_t \rightarrow t-d^{ik}_t \geqslant 0 ( 4)

Каждый узел использует информацию о своем собственном состоянии (может быть и зашумленную), а также свои зашумленные измерения для u^i_t. Будем называть обратную связь по наблюдениям состояний

U_t=k_t(X_t),u^i_t=k^i_t(y^{j_1}_t,...,y^{j_{m_i}}_t}) ( 5)

протоколом с топологией  G_t, \lbrace j_1,…,j_{m_i} \rbrace \in \overline N^{i,t} \subseteq \lbrace i \rbrace \cup N^i_t , для любого i из узлов j_1,…,j_{m_i} \in N удовлетворяет свойству:\overline N^i \subseteq \lbrace i \rbrace \cup N^i_t . Если \lvert \overline N_i \rvert < n для любого i \in N, то (5) называется распределенным протоколом .

Пусть \chi : P^n \rightarrow P – некоторая функция nпеременных. Задача \chi-консенсуса в динамическом графе заключается в распределенном вычислении \chi (X_0), применяя входы u^i_t.

Определение 1: Протокол (5) асимптотически решает задачу \chi-консенсуса тогда и только тогда, когда существует асимптотически устойчивое равновесие X^* для \dot {X}_t=F(X_t,k_t(X_t)), удовлетворяющее x^{*,i}=\chi (X_0)для любого i \in N.

Отметим особые случаи, когда \chi (X)=Ave(X)=1/n(\sum \limits^n_{i=1} x^i), \chi (X)=max_i x^i и \chi (X)=min_i \lvert x^i \rvert, называемые консенсус усреднения , -консенсус и -конснсус соответственно 6. Эти случаи широко применяются в распределенных системах принятия решений для мультиагентных систем.

Решение задачи консенсуса усреднения является примером распределенного вычисления линейной функции \chi (X)=Ave(X), используя сеть динамических систем (или интеграторов).

Пусть (\Omega,F,P) – основное вероятностное пространство и будем считать, что часть или все определенные выше переменные, вектора и матрицы – случайные величины.

Обозначим максимальное множество каналов связи E_{max}=\lbrace (k,i) \lvert sup_{t \geqslant 0} ((k,i) \in E_t) > 0 \rbrace.

Для удобства статистического моделирования предположим следующее: w^{ik}_t и d^{ik}_t определены для всех (k,i) \in E_{max}. Если (k,i) не появляется в E_t, тогда (3) физически не работает и w^{ik}_t и d^{ik}_t можно считать нулями. Если (k,i) \notin E_t, положим d^{ik}_t=0. Пусть w^{ik}_t \lvert (k,i) \in E_{max} перечислены в определенном порядке (k,i), тогда получаем вектор помех W_t размерности n_1.

Определение 2: n узлов достигают среднеквадратичного консенсуса , если  E \lvert x^i_t \rvert ^2 < \propto , t \geqslant 0, 1 \leqslant i \leqslant n и существует случайная переменная x^* такая что lim_{t \rightarrow \propto} E \lvert x^i_t – x^* \rvert ^2=0 для 1 \leqslant i \leqslant n .

Далее будет рассмотрен пример мультиагентной системы с описанными выше параметрами.

Николай Корнеев
Николай Корнеев

В самостоятельной работе №1 нет примера lab01 файла labAtom32.rar. Ссылка которая есть в презентации

www.math.spbu.ru/user/gran/Atom32/lab01

не работает?