Сведение задач теории игр к задачам линейного программирования.
Рассмотрим игру m×n, определяемую матрицей
А=(aij)=.
Для оптимальной стратегии первого игрока U*=(u1*, u2*, ...um*) и цены игры v выполняется неравенство (j=1...n). Предположим для определенности, что v>0. Это всегда может быть достигнуто благодаря тому, что прибавление ко всем элементам матрицы А одного и того же числа С не приводит к изменению оптимальных стратегий, а только увеличивает цену игры на С.
Разделив обе части последнего неравенства на v, получим
(j=1...n).
Положим ui*/v=yi*, тогда
(j=1...n); (i=1...m).
Используя введенное обозначение, перепишем условие
=1 в виде =1/v.
Так как первый игрок стремится получить максимальный выигрыш, то он должен обеспечить минимум величине 1/v. С учетом этого, определение оптимальной стратегии первого игрока сводится к нахождению минимального значения функции
F*=
при условиях
(j=1...n); (i=1...m).
Аналогичные рассуждения показывают, что определение оптимальной стратегии второго игрока сводится к нахождению максимального значения функции
F=
при условиях
(i=1...m); xi0 (j=1...n).
Здесь xj=zj/v.
Таким образом, чтобы найти решение данной игры, определяемой матрицей А, нужно составить пару двойственных задач и найти их решение.
Прямая задача: найти максимальное значение функции F= при условиях
(i=1...m); xi0 (j=1...n).
Двойственная задача: найти минимальное значение функции F*=при условиях
(j=1...n); yi0 (i=1...m).
Используя решение пары двойственных задач, получаем формулы для
определения стратегий и цены игры:
==v, ==v,
v==; (i=1...m; j=1...n).
Итак, процесс нахождения решения игры с использованием методов линейного программирования включает следующие этапы:
1. Составляют пару двойственных задач линейного программирования, эквивалентных матричной игре.
2. Определяют оптимальные планы пары двойственных задач.
3. Используя соотношение между планами пары двойственных задач и оптимальными стратегиями и ценой игры, находят решение игры.
П р и м е р 1. Найти решение игры, заданной матрицей
4 | 3 | 4 | 2 |
3 | 4 | 6 | 5 |
2 | 5 | 1 | 3 |
Р е ш е н и е. Запишем две системы ограничений, соответствующие задачам отыскания оптимальной стратегии игроков А и В.
Для игрока А:
Для игрока В:
Введем замены: ti=xi/v, uj=yj/v.
Для определения оптимальной стратегии игрока А имеем следующую ЗЛП: найти
min Z=t1+t2+t3
при ограничениях
Двойственная задача для определения оптимальной стратегии игрока В формулируется так: найти max W=u1+u2+u3+u4 при ограничениях
Рассмотрим решение двойственной задачи симплекс-методом.
Предварительно, с помощью неотрицательных переменных u5, u6 и u7 преобразуем неравенства в уравнения.
Первоначальный базис образуют единичные векторы А5, А6 и А7.
|
|
| 0 | 1 | 1 | 1 | 1 | 0 | 0 | 0 |
N | Базис | Сб | A0 | A1 | A2 | A3 | A4 | A5 | A6 | A7 |
1 | A5 | 0 | 1 | 4 | 3 | 4 | 2 | 1 | 0 | 0 |
2 | A6 | 0 | 1 | 3 | 4 | 6 | 5 | 0 | 1 | 0 |
3 | A7 | 0 | 1 | 2 | 5 | 1 | 3 | 0 | 0 | 1 |
| Wj-Cj |
| 0 | -1 | -1 | -1 | -1 | 0 | 0 | 0 |
|
|
| 0 | 1 | 1 | 1 | 1 | 0 | 0 | 0 |
N | Базис | Сб | A0 | A1 | A2 | A3 | A4 | A5 | A6 | A7 |
1 | A1 | 1 | 1/4 | 1 | 3/4 | 1 | 1/2 | 1/4 | 0 | 0 |
2 | A6 | 0 | 1/4 | 0 | 7/4 | 3 | 7/2 | -3/4 | 1 | 0 |
3 | A7 | 0 | 1/2 | 0 | 7/2 | -1 | 2 | -1/2 | 0 | 1 |
| Wj-Cj |
| 1/4 | 0 | -1/4 | 0 | -1/2 | -1/4 | 0 | 0 |
На третьей итерации получаем оптимальный план задачи.
|
|
| 0 | 1 | 1 | 1 | 1 | 0 | 0 | 0 |
N | Базис | Сб | A0 | A1 | A2 | A3 | A4 | A5 | A6 | A7 |
1 | A1 | 1 | 3/14 | 1 | 1/2 | 4/7 | 0 | 5/14 | -1/7 | 0 |
2 | A4 | 1 | 1/14 | 0 | 1/2 | 6/7 | 1 | -3/14 | 2/7 | 0 |
3 | A7 | 0 | 5/14 | 0 | 5/2 | -19/7 | 0 | -1/14 | -4/7 | 1 |
| Wj-Cj |
| 2/7 | 0 | 0 | 3/7 | 0 | 0 | 1/7 | 0 |
Он имеет вид:
U=(3/14; 0; 0; 1/14), max W=1/v=2/7, v=7/2.
Учитывая соотношения между uj и yj, получаем, используя последней итерации, находящиеся в столбцах А5, А6 и А7: t1=1/7+0=1/7, t2=1/7+0=1/7, t3=0+0=0. Таким образом, Т=(1/7; 1/7; 0), следовательно, X=(1/2; 1/2; 0).
- Математические методы системного анализа и теория принятия решений Методическое пособие
- 1. Теория принятия решений 4
- 2. Линейное программирование 9
- 3. Нелинейное программирование 42
- 4. Игровые методы обоснования решений 51
- 5. Задачи распознавания образов 62
- Предисловие
- 1. Теория принятия решений
- 1.1. Задачи, связанные с принятием решений Проблема оптимальности.
- Основные понятия и принципы исследования операций.
- Примеры задач исследования операций.
- 1.2. Математические модели операций Искусство моделирования.
- 1.3. Разновидности задач исследования операций и подходов к их решению Прямые и обратные задачи исследования операций.
- Пример выбора решения при определенности: линейное программирование.
- Проблема выбора решений в условиях неопределенности.
- Выбор решения по многим критериям.
- «Системный подход».
- 2. Линейное программирование
- 2.1. Краткое представление о математическом программировании Предмет математического программирования.
- Краткая классификация методов математического программирования.
- 2.2. Примеры экономических задач линейного программирования Понятие линейного программирования.
- Задача о наилучшем использовании ресурсов.
- Задача о выборе оптимальных технологий.
- Задача о смесях.
- Задача о раскрое материалов.
- Транспортная задача.
- 2.3. Линейные векторные пространства Основные понятия линейного векторного пространства.
- Решение систем линейных уравнений методом Гаусса.
- Реализация метода исключения неизвестных в среде Excel.
- Различные схемы реализации метода Гаусса.
- Опорные решения системы линейных уравнений.
- 2.4. Формы записи задачи линейного программирования Основные виды записи злп.
- Каноническая форма представления задачи линейного программирования.
- Переход к канонической форме.
- 2.5. Геометрическая интерпретация задачи линейного программирования Определение выпуклой области.
- Геометрическая интерпретация.
- 2.6. Свойства решений задачи линейного программирования Свойства основной задачи линейного программирования.
- Графический метод решения задачи линейного программирования.
- 2.7. Симплексный метод Идея симплекс-метода.
- Теоретические обоснования симплекс-метода.
- Переход к нехудшему опорному плану.
- Зацикливание.
- Алгоритм симплекс-метода.
- 2.8. Двойственность в линейном программировании Прямая и двойственная задача.
- Связь между решениями прямой и двойственной задач.
- Геометрическая интерпретация двойственных задач.
- 2.9. Метод искусственного базиса Идея и реализация метода искусственного базиса.
- 3. Нелинейное программирование
- 3.1. Общая задача нелинейного программирования Постановка задачи.
- Примеры задач нелинейного программирования (экономические).
- Геометрическая интерпретация задачи нелинейного программирования.
- 3.2. Выпуклое программирование Постановка задачи выпуклого программирования.
- 3.3. Классические методы оптимизации Метод прямого перебора.
- Классический метод дифференциальных исчислений.
- 3.4. Метод множителей лагранжа
- 3.5. Градиентные методы решения задач нелинейного программирования Общая идея методов.
- Метод Франка-Вулфа.
- Метод штрафных функций.
- 4. Игровые методы обоснования решений
- 4.1. Предмет и задачи теории игр Основные понятия.
- Классификация выборов решений.
- Антагонистические матричные игры.
- Чистые и смешанные стратегии и их свойства.
- 4.2. Методы решения конечных игр Упрощение матричной игры.
- Решение матричной игры размерностью 22.
- Графическое решение матричной игры.
- Сведение задач теории игр к задачам линейного программирования.
- 4.3. Задачи теории статистических решений Игры с природой.
- Критерии принятия решений.
- 5. Задачи распознавания образов
- 5.1. Общая постановка задачи распознавания образов и их классификация Проблема распознавания.
- Обсуждение задачи опознавания.
- Язык распознавания образов.
- Априорные предположения — это записанные специальным образом, накопленные знания специалистов.
- Общая постановка задачи.
- Геометрическая интерпретация задачи распознавания.
- Классификация задач распознавания.
- 5.2. Подготовка и анализ исходных данных Общая схема решения задачи.
- Общая схема постановки и решения задачи Анализ данных с целью выбора постановки и метода решения
- 5.3. Методы опознавания образов Основные этапы процесса опознавания образов.
- Методы создания системы признаков.
- Признаковое пространство.
- Сокращение размерности исходного описания.
- Методы построения решающего правила.
- 5.4. Меры и метрики Понятие о сходстве.
- Меры сходства и метрики.
- Примеры функций мер сходства.
- 5.5. Детерминированно-статистический подход к познаванию образов Основные этапы детерминированно-статистического подхода.
- Получение исходного описания.
- Создание системы признаков.
- Сокращение размерности исходного описания.
- Нахождение решающего правила (метод эталонов).
- Коррекция решающего правила.
- 5.6. Детерминированный метод построения решающего правила (метод эталонов) Идея метода эталонов.
- Минимизация числа эталонов.
- Габаритные эталоны.
- Применение метода эталонов к частично пересекающимся образам.
- Дополнительная минимизация числа признаков.
- Квадратичный дискриминантный анализ.
- Распознавание с отказами.
- 5.8. Алгоритм голотип-1 Назначение
- Постановка задачи
- Метод решения задачи.
- Условия применимости.
- Условия применимости.
- 5.10. Алгоритм направление опробования Назначение
- Постановка задачи.
- Метод решения задачи.
- Условия применимости.
- Транспортная задача Математическая постановка.
- Постановка задачи.
- Теоретическое введение.
- Методы нахождения опорного плана транспортной задачи.
- Определение оптимального плана транспортной задачи.
- Заключение.
- Целочисленное программирование Постановки задач, приводящие к требованию целочисленности.
- Постановка задачи.
- Методы отсечения.
- Алгоритм Гомори.
- Первый алгоритм р. Гомори решения полностью целочисленных задач.
- Приближенные методы.
- Заключение.
- Параметрическое программирование Введение.
- Формулировка задачи.
- Теоретическая часть.
- Общая постановка задачи.
- Решение задачи.
- Геометрическая интерпретация задачи.
- Общая постановка задачи.
- Решение задачи.
- Геометрическая интерпретация задачи
- Постановка задачи.
- Решение.
- Геометрическое решение.
- Решение задачи симплекс-методом.
- Результат.
- Некооперативные игры n лиц с ненулевой суммой Введение.
- Теоретическая часть.
- Постановка и решение задачи.
- Заключение.
- Cписок литературы