logo
Шепеленко О

Последовательность действий при решении игры

1. Проверка матрицы игры на наличие седловой точки.

2. При отсутствии седловой точки сведение игры к двойственным задачам.

3. Решение одной из пары двойственных задач.

4. Выписывание решения игры в смешанных стратегиях.

Замечание. Задача не изменится, если ко всем элементам платежной матрицы прибавить число.

Замечание. Сократить размерность матрицы можно исключением одинаковых строк или столбцов, исключением больших столбцов или меньших строк.

Решение матричной игры в смешанных стратегиях рассмотрим на примере.

Пример 2.5.2. Решить матричную игру с платежной матрицей

Решение. Вначале, с помощью принципа максимина (минимакса), определим минимаксную и максиминную стратегии. Для этого в строках платежной матрицы найдем минимальное из чисел, в столбцах – максимальное из чисел.

А\В

B1

B3

B3

A1

–2

2

0

–2

A2

–1

3

–1

–1

A3

4

–3

1

–3

4

3

1

В нашем случае = max {–2, –1, –3} = –1, = min {4, 3, 1} = 1.

Таким образом, в нашем случае цена игры: .

Поскольку диапазон цены игры и платежная матрица содержат отрицательные числа, то ко всем элементам платежной матрицы следует прибавить число, которое приведет к положительному диапазону цены игры. Это число 3.

Платежная матрица будет иметь вид , новая цена игры будет принадлежать промежутку

.

Матричная игра сводится к паре двойственных задач линейного программирования.

Для игрока А

min Lx = x1 + x2 + x3

Для игрока В

max Ly = y1 + y2 + y3

Замечание. Решать симплекс-методом целесообразно задачу для игрока В, поскольку в этой задаче нет необходимости вводить искусственные переменные.

Приведем ЗЛП для игрока В к каноническому виду и перейдем к минимуму:

min (– Ly ) = – y1y2y3

Имеем двойственную ЗЛП, которую будем решать симплекс-методом:

Таблица 2.5.1

Симплексный метод решения ЗЛП

Базис

С

р0

–1

–1

–1

0

0

0

С.О.

р1

р2

р3

р4

р5

р6

р4

0

1

1

5

3

1

0

0

1/1

р5

0

1

2

6

2

0

1

0

1/2

р6

0

1

7

0

4

0

0

1

1/7

z - строка

0

1

1

1

0

0

0

р4

0

6/7

0

5

17/7

1

0

–1/7

(6/7):5=6/35

р5

0

5/7

0

6

6/7

0

1

–2/7

(5/7):6=5/42

р1

–1

1/7

1

0

4/7

0

0

1/7

z – строка

–1/7

0

1

3/7

0

0

–1/7

р4

0

11/42

0

0

12/7

1

–5/6

2/21

(11/42):(12/7) =11/72

р2

–1

5/42

0

1

1/7

0

1/6

–1/21

(5/42):(1/7) =5/6

р1

–1

1/7

1

0

4/7

0

0

1/7

(1/7):(4/7) =1/4

z - строка

–11/42

0

0

2/7

0

–1/6

–1/7

р3

–1

11/72

0

0

1

7/12

–5/12

1/18

р2

–1

7/72

0

1

0

р1

–1

4/72

1

0

0

z – строка

–22/72

0

0

0

–1/6

–1/36

–1/9

Оптимальный план: у1 = 4/72, у2 =7/72, у3 =11/72, max Ly = – min (– Ly ) = 22/72

Найдем v +3 = 1/Ly = 1:(22/72 ) = 36/11, значит цена игры равна v = 3/11.

Найдем вероятности использования чистых стратегий Bj: qj = yj · v

= , = , = ,

тогда оптимальная смешанная стратегия .

Оптимальный план х1 = 1/6, х2 = 1/36, х3 = 1/9. Найдем вероятности использования чистых стратегий Аi: pi = xi · v

= , = , = ,

тогда оптимальная смешанная стратегия .

Таким образом, игроку А рекомендуется из 11 раз стратегию А1 использовать 6 раз (чаще всего), стратегию А2 – 1 раз, стратегию А3 – 4 раза. Игроку В рекомендуется из 22 раз стратегию В1 использовать 4 раза, стратегию В2 – 7 раз, стратегию А3 – 11 раз (чаще всего). Если кто-то из участников будет отклоняться от этих рекомендаций, то он ухудшит свое собственное положение.