ммпур методичка

Теоретическая часть.

Рассмотрим наиболее простую игру двух лиц с ненулевой суммой. Платежная матрица игры такова:

Возможны различные интерпретации этой игры, но наиболее известна интерпретация, которую мы можем назвать «семейный спор». Муж, игрок 1, и жена, игрок 2, могут выбрать одно их двух вечерних развлечений: матч бокса ( и ) или балет ( и ). Согласно обычному стандарту, мужчина предпочтет бокс, а женщина — балет; однако обоим гораздо важнее идти вместе, чем смотреть предпочитаемое зрелище. Если игрок 1 объявит, что он намерен выбрать и что никакой довод не заставит его изменить свой выбор, и если игрок 2 убежден в том, что игрок 1 будет упорствовать в своем намерении, то ему ничего не остается, как выбрать . Аналогичное рассуждение имеет место, если игрок 2 первым объявит свои намерения. В такой ситуации выгодно раскрыть свою стратегию первым и иметь репутацию непреклонного человека. Если при переговорах до игры муж скажет, что он обязан быть на боксе и покажет купленный им билет, то это может заставить жену подчиниться его воле. Но некоторых женщин с характером такое бесцеремонное диктаторское поведение рассердит настолько, что совершенно изменит полезности, входящие в платежную матрицу, но в некоторых случаях оно может привести к коренному изменению системы предпочтений игрока и, следовательно, платежной матрицы. В таких случаях мы, возможно, могли бы расширить множество стратегий и усложнить игру так, чтобы включить переговоры до игры.

Продолжая рассматривать ту же платежную матрицу, мы замечаем, что и суть уравновешенные пары, так как каждая стратегия в одной из пар является уравновешенной парой. Кроме того, и дают игрокам неодинаковые выигрыши.

Предположим, что игроки не сообщаются до игры, и что они должны производить свои выборы одновременно, то есть что они играют в некооперативный вариант игры. Допустим игрок 1 хочет , а его противник, очевидно, , но если игрок 1 выберет , а игрок 2 выберет , то они оба проиграют. Предположим, что игрок 1 уступит игроку 2 и выберет , тогда все же игрок 1 окажется в довольно хорошем положении, но ведь игрок 2 также может уступить сопернику выбрав , и они опять проиграют. Такой подход игроков не приведет ни к чему хорошему вследствие симметрии ситуации, поэтому, чтобы максимально увеличить свой гарантированный уровень, они выбирают смешанную стратегию , такую, чтобы максимально увеличить наименьшую из двух величин

и ,

связанных с каждым x. После некоторых вычислений игрок 1 находит, что его максиминная стратегия будет .

Игроку, участвующему в этой некооперативной игре, может быть любопытно, как поступил бы он и его противник, если бы игра была в действительности кооперативной, ибо если им ясны их роли в кооперативном варианте, то каждый мог бы поступить так, как будто он находится в сговоре с другим игроком, даже при отсутствии сообщения до игры. Хотя это предложение естественно, но его нельзя использовать в действительности гораздо плодотворнее обратный способ: анализировать кооперативную игру путем построения соответствующей вспомогательной некооперативной игры.

В кооперативной игре игроки будут пытаться прийти к или и «справедливым» решением для них будет бросание монеты, причем герб означает, что совместно выбрана пара , решетка — что совместно выбрана пара . В нашей интерпретации: герб — семейство идет на бокс, решетка — на балет. Полезность при этой совместно установленной смешанной стратегии равна для каждого игрока. Заметим, что в некооперативном варианте доход не возможен — он лежит вне затененной области на рис.1.

рис.1

Прежде чем перейти к другому примеру, рассмотрим кратко, что могло бы произойти, если бы эта игра проводилась неоднократно и платежи производились после каждой партии. Если даже сообщение до игры не разрешено, тем не менее здесь может быть непроизвольное сообщение, а именно игроки сигнализируют друг другу посредством системы своих выборов в предшествующих партиях. Психологически мы могли бы ожидать, что после некоторого препирательства игроки остановились бы на системе чередования и . В этом случае можно сказать, что игроки применяют стратегии и , но их выбора не могут быть независимы — они «коррелируют» свои смешанные стратегии.

Обратимся теперь к другому примеру игры с ненулевой суммой. Он приписывается Таккеру и привлек большое внимание теоретиков игр. Платежная матрица игры G такова:

Известна следующая интерпретация — так называемая «дилемма заключенного». Двух подозреваемых берут под стражу и изолируют друг от друга. Окружной прокурор убежден, что они совершили преступление, но не имеет достаточных доказательств, чтобы предъявить им обвинение на суде. Он говорит каждому из них, что у него имеется две альтернативы: признаться в преступлении, которое по убеждению полиции он совершил, или не признаться. Если оба не признаются, то окружной прокурор предъявит им обвинение в каком-либо незначительном преступлении, таком, например, как мелкая кража или незаконное владение оружием, и они оба получат небольшое наказание; если оба признаются, то будут подлежать судебной ответственности, но он не потребует самого строго преговора; если же один признается, а другой нет, то признавшемуся приговор будет смягчен за выдачу сообщника, в то время как упорствующий получит «на полную катушку».

Если обозначить и — непризнание, а и — признание, то при условии, что донос не вызывает ни у одного из них угрызений совести или страха. Перед каждым каждым заключенным стоит вопрос — признаться или нет. Игра, которую окружной прокурор предлагает заключенным, представляет собой некооперативный вариант.

Рассмотрим игру G сперва с точки зрения игрока 1. Если игрок 2 выберет или , то вторая стратегия игрока 1 предпочтительнее его первой стратегии, так как в первом случае 1 больше 0.9, а во втором случае 0.1 больше 0. Итак строго доминирует над . Точно также строго доминирует над . Поскольку каждый из игроков хочет получить максимум полезности, их «разумные» выборы будут и .

Можно попробовать доказать, что разница между 1 и 0.9 и 0.1 и 0 так мала, что даже «этика» преступника заставит выбрать его первую стратегию, чтобы оба они не попали в нелепую ловушку . Такой довод недопустим, так как по предположению числовые полезности отражают все подобные «этические» соображения. Нет, по-видемому, эту дилемму нельзя обойти. Мы не думаем, что выбор или имеет в себе что-либо неразумное или извращенное, и должны допустить, что если бы мы были в этом положении, то могли бы сделать эти выборы.

Содержание