<<
>>

2.1. Задача стимулирования в веерной ОС

В [58, 60, 62] был подробно исследован класс задач стимулирования в детерминированных ОС с несколькими агентами. Рассматривалась следующая модель: ОС состоит из центра, который управляет п агентами.
Целевая функция центра

Ф(у) = Н(у)-^(т1(у),

iGN

где у = (у1,...,уп) е А' = YIA - вектор действий агентов - это

ieN

разность неотрицательного непрерывного дохода Н(у) и суммарного стимулирования (также неотрицательного), которое центр выплачивает агентам, N = {1,...,п} - множество агентов,

Д = 91+ - множество допустимых действий агента, ieN. Целевая функция /-го агента

Му) = а1{у)-с1{у), ieN,

это разность получаемого им от центра стимулирования <7г (у) и затрат агента сг (у), связанных с реализацией всеми агентами вектора действий у. Функцию затрат с( (у), i е N будем считать неотрицательной неубывающей по каждой компоненте вектора действий функцией.

Как центр, так и все агенты точно знают функции Ф(.), /,(.). поэтому данная модель и называется детерминированной.

Порядок функционирования системы следующий. Центр сообщает агентам зависимость <7г ( у) стимулирования от выбираемого ими вектора действий у. Затем все агенты одновременно и независимо выбирают каждый свою компоненту

уi вектора действий у . Наконец, центр получает доход Н(у*), зависящий от реализовавшегося вектора действий и выплачивает 7-му агенту стимулирование <7г (), ieN.

Задача центра заключается в выборе системы стимулирования (то есть набора функций <7г (.)), приводящей к максимальному значению его целевой функции при условии, что агенты выбором действия максимизируют свою целевую функцию при заданной центром системе стимулирования. Таким образом, при заданной системе стимулирования агенты участвуют в игре, в которой стратегиями являются их действия, а выигрыши опреде-ляются выражением (15).

Ранее [58, 60, 62] при решении данной задачи считалось, что агенты не могут координировать выбор своих действий, обмениваться информацией и заключать между собой соглашения.

В этом случае игру агентов можно рассматривать как некооперативную и использовать в качестве концепции решения данной игры равновесие Нэша (или равновесие в доминантных стратегиях, если оно имеется).

В [62] было показано, что, в зависимости от заданных ограничений на механизм стимулирования, оптимальными являются следующие системы стимулирования:

Если центр может назначать i-му агенту стимулирование, за-висящее от всего вектора действий у, то система стимулирования

(16) = +

[0, у,* у,

где у* е Argmax[#0>) - ^с^у)],

УеА' ieN

реализует действие у как единственное равновесие в доминантных стратегиях и является е-оптимальной для центра.

Если стимулирование /-го агента может зависеть только от его компоненты действия, то система стимулирования

(17) = +

где у* е Argmax[#0>) - ^с^у)],

УеА' ieN

реализует действие у* как единственное равновесие Нэша и является е-оптимальной для центра.

Если центр наблюдает только результат деятельности z = g(y), гДе - однозначное непрерывное

отображение, и доход центра зависит только от результата дея-тельности z, то система стимулирования

где y*(z*) е Arg min ( > е Argmax[#(z) - 2>г00]

y-g(y')=z ieN

реализует результат z* как единственное равновесие Нэша и

является е-оптимальной для центра.

Интерес представляет проверка влияния на данные результаты коалиционного взаимодействия агентов. Далее предполагается, что агенты могут образовывать коалиции, и в ОС имеется линейно-трансферабельный товар (деньги), которым агенты могут обмениваться между собой.

Заметим, что в данной задаче коалиционное взаимодействие агентов нежелательно для центра [26, 28]. Действительно, системы стимулирования (16)-(18) реализуют оптимальное для центра действие с наименьшими затратами.

Любые договоренности между агентами могут только изменить реализуемое ими действие, что уменьшит результат игры для центра. Важным поэтому представляется поиск условий, при которых кооперативное взаимодействие агентов не сказываются на реализуемом системами стимулирования (16)-(18) результате.

Далее будем называть коалиционной структурой 3={(19) =

Фиксация (при заданной системе стимулирования) коалиционной структуры 3={Л'|. ..., Sf-} определяет игру к лиц с целевыми функциями (19) и стратегиями (20).

Кооперация агентов невозможна, если для произвольной

*

коалиционной структуры 3 в любом равновесии Нэша У j ¦ игры

Г выигрыш всех коалиций Л'е 3 не превышает их выигрыша в равновесии Нэша некооперативной игры, то есть справедливо неравенство

\/S с N fs(yr)IGS

Действительно, условие (21) совпадает с определением сильного равновесия Нэша, при наличии которого, как показано выше в разделе 1.2, кооперативная игра является несущественной.

Рассмотрим последовательно модели, соответствующие системам стимулирования (16)-(18).

<< | >>
Источник: Губко М.В.. Управление организационными системами с коалиционным взаимодействием участников. М.: ИПУ РАН (научное издание),2003. - 140 с.. 2003

Еще по теме 2.1. Задача стимулирования в веерной ОС: