Алгоритм принципа максимина (минимакса)
1. В строке платежной матрицы, которая соответствует стратегии Аі, найти минимальное из чисел :
. (2.5.1)
Это минимальный выигрыш игрока А, при использовании стратегии Аі. Очевидно, что игроку А выгодно выбирать такую стратегию Аі, для которой значение гарантированного выигрыша было бы самым большим.
2. Определить число по формуле (2.5.2)
=, (2.5.2)
и называется нижней ценой игры или максимином . Соответствующая стратегия называется максиминной.
| Максимин – это гарантированный выигрыш, который игрок А может себе обеспечить в игре против разумного противника. |
Если игрок А будет придерживаться максиминной стратегии, то ему при любом разумном поведении игрока В гарантирован выигрыш, не меньший, чем .
3. В столбце платежной матрицы, который соответствует стратегии Вj, найти максимальное с чисел :
. (2.5.3)
Это максимальный проигрыш игрока В, при использовании стратегии Вj – самый большой из проигрышей. Очевидно, что игрок В старается превратить выигрыш игрока А в минимальный, то есть он должен выбрать стратегию, которая дает самый маленький проигрыш.
4. Определить число , которое определяется по формуле (2.5.4)
, (2.5.4)
и называется верхней ценой игры или минимаксом . Соответствующая стратегия называется минимаксной.
| Минимакс – это гарантированный проигрыш, который игрок В может себе позволить в игре против разумного противника. |
Если игрок В будет придерживаться наиболее осторожной из всех стратегий – минимаксной – то в любом случае обеспечен проигрыш, не больший, чем .
Принцип минимакса – это принцип осторожности, который рекомендует игрокам соблюдения максиминной и минимаксной стратегий. Он вытекает из предположения об осторожности игроков, то есть с желания разрешить конфликтную ситуацию самым лучшим образом для всех участников.
Замечание. Нижняя цена игры всегда не превосходит верхнюю цену игры.
| Цена игры – это объективно возможный средний выигрыш . |
| Если , то выигрыш А является определенным числом, а такая игра называется определенной игрой в чистых стратегиях или игрой с седловой точкой. Выигрыш называется значением игры, равен элементу . Элемент является одновременно минимальным в строке , максимальным в столбце и называется седловой точкой. Седловой точке отвечают оптимальные стратегии, совокупность которых является решением игры. |
Замечание. Если один с игроков придерживается своей оптимальной стратегии, то для второго игрока отклонения от его оптимальной стратегии не может быть выгодным. Отступление сторон от их оптимальных стратегий ухудшает их собственное положение.
Пример 2.5.1. Решить матричную игру с платежной матрицей .
- Рецензенты:
- Содержание
- 1. Программа курса Введение
- Математические основы программирования
- Общий вид задачи линейного программирования
- Методы решения общей задачи линейного программирования
- Двойственные задачи линейного программирования
- Распределительные методы
- Элементы нелинейного программирования
- Элементы теории игр
- Введение
- Классификация задач математического программирования
- 2. Математическое программирование
- 2.1. Постановка задач линейного программирования
- Алгоритм графического метода решения злп
- 2.3. Симплекс-метод решения задачи линейного программирования
- Алгоритм симплекс-метода решения злп
- Пример 2.3.1. Решить злп (2.2.1), (2.2.5) симплекс-методом.
- Критерий оптимальности опорного плана:
- Переход к следующей симплекс-таблице осуществляют по правилам:
- 2.4. Двойственная задача линейного программирования
- 2.5. Элементы теории матричных игр
- Алгоритм принципа максимина (минимакса)
- Решение. Эта матричная игра имеет размерность (3х4), т.Е. Игрок а имеет три стратегии, а игрок в – четыре. Запишем ее в нормальной форме.
- Последовательность действий при решении игры
- 2.6. Транспортная задача. Метод потенциалов
- Алгоритм метода потенциалов состоит из следующих этапов:
- Критерий оптимальности плана перевозок
- 2.7. Задача о назначениях
- Алгоритм метода Фогеля
- Алгоритм венгерского метода решения задачи о назначениях
- 2.8. Дробно-линейное программирование
- Правила решения задачи дробно-линейного программирования графическим методом
- 2.9. Целочисленное программирование
- 2.10. Параметрическое программирование
- Алгоритм решения задачи параметрического программирования
- 3. Задания для самостоятельной работы