Модель принятия решений
Опишем модель принятия решений агентом.
Для того чтобы определить, как задаются предпочтения агентов, введем следующее описание взаимодействия каждого агента с его обстановкой, в которую могут входить другие агенты, управляющие органы и прочие объекты и субъекты.Пусть агент с номером / способен выбирать действия (стратегии, состояния и т.д.) из множества А, допустимых действий данного агента. Действие /-го агента будем обозначать у, е А,. Каждому из п агентов поставим в соответствие целевую функцию fi(y,u), где у = (уи..., уп) е А'= Y\A ~ вектор действий всех
ieN
агентов, N = {1,2,...,и} - множество агентов, а и - управляющее воздействие со стороны центра. Следуя сложившейся терминологии теории игр, будем называть действия yi стратегиями, вектор у - ситуацией игры, а агентов - игроками. Совокупность стратегий уч =(yj)jeN\{i} называется обстановкой игры для /-го игрока .
Коллективное поведение агентов в такой системе описывается игрой - взаимодействием игроков (участников ОС), в котором полезность каждого игрока зависит как от его собственного действия (стратегии), так и от действий других игроков. Если, в силу гипотезы рационального поведения [47, 54, 82], каждый из игроков стремится выбором стратегии максимизировать свою целевую функцию, то в случае нескольких игроков рациональная стратегия каждого из них зависит от стратегий других игроков. Набор таких рациональных стратегий называется решением игры.
Предположения, накладываемые на взаимодействие игроков в ходе игрового конфликта, приводят к использованию в качестве решения игры концепций решения теории некооперативных или кооперативных игр.
Если считается, что игроки в процессе игры не могут общаться друг с другом, заключать соглашения и обмениваться полезностью, то такую игру логично рассматривать, как некооперативную.
Однако такая ситуация зачастую не соответствует реальным возможностям агентов в реальных ОС, в которых наблюдаются все виды взаимодействий, перечисленные в разделе 1.2, что позволяет рассматривать игру агентов уже как кооперативную игру.Исследование кооперативной игры проводится с использованием модели игры в форме характеристической функции. В разделе 1.2 перечислены способы построения характеристической функции игры на основе функций полезности игроков. В боль-шинстве рассматриваемых далее моделей характеристическая функция коалиции S с 7V вычисляется как равновесный по Нэшу выигрыш коалиции S с функцией выигрыша fs{y) = X./,О'-и) и
i<=S
стратегией ys = (v( ),, Л. в ее игре с коалицией N\S (состоящей из всех остальных агентов) со стратегией yms = (у,),, v Л. и функцией выигрыша fN\S(y) = Х.//0'-") • Если равновесий Нэша в этой
i<=N\S
игре двух лиц (коалиций S и N S) несколько, то отдельно оговаривается, на основании какого из них коалиция вычисляет значение своей характеристической функции. Для устранения этой неопределенности используются принцип гарантированного результата (когда коалиция рассчитывает на наихудшее с точки зрения размера ее выигрыша равновесие), принцип оптимистических оценок (когда выбирается наилучшее равновесие), а также другие способы выбора равновесия Нэша (например, выбор среднего по равновесиям значения выигрыша).
В разделе 1.3 проанализированы концепции решения кооперативных игр и обосновано применение концепции С-ядра в качестве основной концепции решения кооперативной игры для исследования коалиционного взаимодействия элементов ОС. Таким образом, если в игре с построенной вышеописанным способом характеристической функцией С-ядро не пусто, то можно с уверенностью говорить о том, что образуется максимальная коалиция N, состоящая из всех игроков.
Коалиция N, стремясь при заданном управлении и выбором своей стратегии (у1,...,уп) максимизировать свою целевую функцию fx (у) = Х./, 0'-») • решает задачу
ieN
Р(и) = Arg max •
ieN
Следовательно, при непустом С-ядре Р(и) - это множество действий, реализуемых системой при заданном управлении и.
Как отмечено выше, существенным недостатком С-ядра является то, что в некоторых играх оно оказывается пустым.
При этом коалиционное взаимодействие игроков может быть более сложными и может не приводить к образованию максимальной коалиции. Тем не менее, можно относительно просто выделить важные для управления ОС случаи, в которых коалиционное взаимодействие не оказывает никакого влияния на исход игры. Так, если кооперативная игра является несущественной, выигрыш любой коалиции равен сумме индивидуальных выигрышей ее участников. Кооперация не приносит выгоды. При этом, как показано в разделе 1.2, зачастую можно считать, что множество Р{и) действий, реализуемых системой при заданном управлении совпадает с некооперативным решением - множеством равно-весий Нэша игры п агентов.Если же в существенной игре С-ядро пусто, для анализа игры требуется привлечение более «слабой» концепции решения - решения в угрозах и контругрозах. Она позволяет предсказать, образование каких коалиций более вероятно - какие коалиции будут устойчивыми. Тем не менее, в данной работе исследуются в основном модели в которых либо С-ядро не пусто, либо игра несущественна.
Игровая неопределенность, как правило, устраняется введением предположений о принципах поведения участников системы, позволяющих однозначно определить выбираемые ими стратегии. То есть устранение игровой неопределенности производится в два этапа - на первом этапе определяется концепция решения (С-ядро или несущественность игры), на втором этапе - принцип выбора игроками конкретных стратегий в случае, если решение состоит нескольких наборов стратегий - гипотеза
благожелательности, принцип гарантированного результата и т.д. [46,51,66, 77].
Описав модель принятия индивидуальных и коллективных решений, перейдем к рассмотрению модели управления.