Управление и его типы
В общем случае, в рамках представления предпочтений агента в терминах функции полезности, модель принятия им решений описывается следующим кортежем: Ч^ = {А, А0, ©, /(•), и'(¦), /}, то есть множествами допустимых действий А, допустимых результатов деятельности А0, возможных значений обстановок (неопре-деленности) ©; функциями: полезности Д ) и «технологии» и'( ¦) между действиями, обстановкой и результатом деятельности; а также информацией I, которой обладает агент на момент принятия решений .
Будем считать, что закон w( ) известен всем участникам ОС и не может быть изменен.
Содержательно это предположение соответствует фиксированной технологии деятельности агента (или фиксированной технологии функционирования управляемого агентом объекта) и не является критическим, так как практически любое изменение связи между действием и результатом может быть отражено зависимостью этой связи от обстановки.Также без ограничения общности можно считать, что множество обстановок © известно всем участникам ОС и фиксировано (для выполнения этого предположения всегда можно выбрать это
множество достаточно широким, ограничивая в каждом конкретном случае возможные значения обстановок имеющейся у агента информацией).
В соответствии с приведенным выше определением, управление - это воздействие на управляемую систему. Так как управляемая система (точнее, управляемый субъект - агент) описывается кортежем Ч^, то внешнее воздействие в общем случае может быть направлено на каждый из элементов этого кортежа.
Выделим три группы переменных (элементов кортежа Ч^, которые могут изменяться) - допустимые множества А и А0, фун-кция полезности^ ) и информация I. Этим трем группам переменных соответствуют три типа управлений (основание классификации - группа переменных, описывающих модель принятия решений, на изменение которых направлено управление) [34]:институциональное управление (изменение допустимых множеств);
мотивационное управление (изменение функции полезности);
информационное управление (изменение информации, которую агент использует при принятии решений).
Обсудим кратко специфику каждого из этих типов управлений .
Институциональное управление, которое обозначим иА е UA, является наиболее жестким и заключается в том, что центр целенаправленно ограничивает множества возможных действий и результатов деятельности агента. Такое ограничение может осуществляться явными или неявными воздействиями - правовыми актами, морально-этическими нормами и т.д.
Мотивационное управление, которое обозначим uv е Uv, является более «мягким», чем институциональное, и заключается в целенаправленном изменении функции полезности агента. Такое изменение может осуществляться введением системы штрафов и/или поощрений за выбор тех или иных действий и/или
достижение определенных результатов деятельности. Примерами моделей мотивационного управления являются рассмотренные в разделе 1.1 задачи планирования и стимулирования [8, 61]. В случае, например, задачи стимулирования, мотивационное управление заключается в непосредственном (входящем в функцию полезности аддитивно) вознаграждении агента за выбор определенных действий.
Наиболее «мягкое» (косвенное), по сравнению с институциональным и мотивационным, и, одновременно, наименее исследованное (с точки зрения формальных моделей) - это информационное управление [44, 55].
Введенные типы управлений характеризуют объекты воздействия (компоненты управляемой системы, на которые направлено управляющее воздействие), поэтому обсудим, что следует понимать под требуемым поведением управляемой системы, и, в первую очередь - «требуемым» с чьей точки зрения.
Исследователь операций, занимающийся построением и анализом модели, как правило, находится на позициях оперирующей (управляющей) стороны, то есть центра [19, 21, 51].
Следовательно, необходимо описать предпочтения центра и рассмотреть модель принятия им решений по выбору управлений.Модель принятия решений центром описывается кортежем % = {UA, Uv, Uj, Ао, w(.), Ф(.), /о}.
«Действиями» центра (выбираемыми им стратегиями) являются управления иА е UA, uv е Uv, щ е (//. Обозначим и = (иА, uv, Uj) е U = = UА х Uvx Uj - вектор управлений.
В большинстве моделей управления ОС считается, что един-ственная роль центра заключается в осуществлении управления, то есть у него отсутствует собственный (не опосредованный действиями агентов) результат деятельности, поэтому результатом деятельности центра обычно считают совокупный результат деятельности агентов.
Так как в условиях отсутствия природной неопределенности предпочтения центра v0( ) определены на множестве А' возмож-
ных действий агентов, то качественно управление заключается в побуждении центром агентов к выбору определенных действий. Обсудим, какие действия следует центру побуждать выбирать агентов.
Рациональный выбор Р(.) агентов (см. предыдущий пункт) зависит от управляющих воздействий и(.) е U, используемых центром, то есть множество рационального выбора агентов есть Р(и)^А.
Итак, центр может предсказать, что, если он использует некоторое управление и е U, то агенты выбирают одно из действий множества Р(ц) . Если это множество содержит более одного элемента, то у центра остается неопределенность относительно выбора агентов, которая может устраняться одним из описанных в [34] методов. Далее в тексте обычно будет использоваться принцип максимального гарантированного результата, в соответствии с которым значение целевой функции центра при использовании управления и е Uравно К(и) = min Ф(у, и).
уеР(и)
Величина К(и), и е U, называется эффективностью управления [11]. Следовательно, задача управления ОС формально может быть сформулирована следующим образом: найти допустимое управление, имеющее максимальную эффективность (такое управление называется оптимальным управлением), то есть К(и) —> max .
ugU
Рассмотренная модель управления является базовой моделью управления ОС, так как она позволяет унифицировано описывать процессы принятия решений участниками ОС.
Действительно, в многоуровневых системах взаимодействие между участниками различных уровней управления может описываться наращиванием рассмотренной структуры по «вертикали». Введение нескольких управляющих органов (центров) или нескольких управляемых субъектов (агентов) соответствует «горизонтальному» расширению этой структуры.Игровая неопределенность в принятии решений отражает взаимодействие субъектов, в результате которого выигрыши (полезности и т.п.) каждого из них в общем случае зависят от действий всех участников системы. Предположение о рациональ-
ном их поведении в зависимости от используемого способа устранения игровой неопределенности приводит к той или иной концепции равновесия игры. Равновесие игры управляемых субъектов зависит от используемых центрами управляющих воздействий, поэтому можно считать, что решение задачи управления ОС заключается в исследовании, во-первых, равновесия игры управляющих органов и, во-вторых, - управляемого равновесия игры агентов. В зависимости от уровней иерархии, которым принадлежат участники рассматриваемого игрового взаимодействия, можно выделять игры между агентами (см. разделы 2.1, 3.1), игры между центрами (см. раздел 2.2) и игры между центрами и агентами (см. раздел 2.3).
Итак, кратко подведем итоги первой главы.
В разделе 1.1 приведена классификация механизмов управления ОС, выделены основные классы механизмов управления - механизмы стимулирования и планирования. Проведенный в разделах 1.2 и 1.3 анализ концепций решения кооперативных игр позволил обосновать использование для построения модели коалиционного взаимодействия участников ОС сбалансированность кооперативной игры в качестве критерия устойчивости макси-мальной коалиции и понятие несущественности кооперативной игры в качестве критерия невыгодности коалиционного взаимодействия. Для исследования существенных игр с пустым С-ядром предложено использовать решение в угрозах и контругрозах. В разделе 1.4 построена модель ОС с коалиционным взаимодействием участников и сформулирована общая задача управления подобными ОС, заключающаяся в выборе центром допустимого управления, максимизирующего его критерий эффективности при условии, что действия агентов определяется решением кооперативной игры (в рамках выбранных концепций решения).