Игры с природой
В зависимости от характера зимы потребление мазута на теплоэлектростанции составляет 7, 8 или 9 топл. ед. Отпускная цена мазута осенью – 4000 ден. ед. за 1 топл. ед. Если заготовленного мазута окажется недостаточно, то придется закупить недостающее количество мазута по цене, превышающей отпускную на 50%. Если запас превысит потребность, то дополнительные затраты на содержание и хранение остатка составят 200 ден. ед. за 1 топл. ед.
Представьте ситуацию в виде игры с природой и постройте соответствующую матрицу платежей. Найдите оптимальные стратегии ЛПР в соответствии с критериями Лапласа и Вальда.
1. Сначала нужно построить матрицу платежей. В нашей игре с природой есть два возможных хода (стратегии) для ЛПР:
а) закупить дополнительное количество мазута, если запасы не хватят
б) не закупать дополнительное количество мазута, если запасы превысят потребность
Также есть три возможных хода (стратегии) природы (зимы) в зависимости от ее характера:
1) потребление мазута составляет 7 топл. ед.
2) потребление мазута составляет 8 топл. ед.
3) потребление мазута составляет 9 топл. ед.
Теперь заполним матрицу платежей. Для этого учтем все возможные комбинации ходов ЛПР и природы.
| | Потребление | Потребление | Потребление |
| | мазута | мазута | мазута |
| | = 7 | = 8 | = 9 |
| | топл. ед. | топл. ед. | топл. ед. |
-----|------|-------------|------------|------------|
а) | 4000 | 0 | ? | ? |
б) | ??? | ? | ? | 200 |
2. Теперь придется рассчитать неизвестные значения в матрице платежей. Давайте разберемся с каждым из них.
a) Заполняем первую строку матрицы. У нас уже есть значение для первого столбца - это отпускная цена мазута осенью, равная 4000 ден. ед. Также из условия известно, что при недостаточном запасе мазута будут закупать недостающее количество по цене, превышающей отпускную на 50%. Значит, если потребление мазута равно 7 топл. ед., то стоимость закупки недостающего будет равна 4000 ден. ед. × 1,5 = 6000 ден. ед. Мы можем заполнить соответствующую ячейку матрицы.
a) | 4000 | 6000 | ? | ? |
Осталось найти значения для остальных ячеек. Рассмотрим каждую из них.
1. Если потребление мазута составляет 7 топл. ед., то нам не нужно закупать дополнительное количество мазута, так как запас будет достаточным и дополнительные затраты на содержание и хранение остатка не возникнут. Значит, соответствующая ячейка равна 0.
a) | 4000 | 6000 | ? | ? |
б) | 0 | ? | ? | 200 |
2. Давайте рассчитаем значения для второго и третьего столбцов (потребление мазута составляет 8 и 9 топл. ед.). Если запасы превышают потребность, то дополнительные затраты на содержание и хранение остатка составят 200 ден. ед. за 1 топл. ед. То есть, если запас равен "потреблению + 1" (в этом случае запасы превышают потребность), то дополнительные затраты равны 200 ден. ед. × 1 = 200 ден. ед. Если запас превышает потребление более чем на 1, то дополнительные затраты также будут равны 200 ден. ед. (например, запас 10 топл. ед. и потребление 8 топл. ед.). Мы можем заполнить соответствующие ячейки матрицы.
a) | 4000 | 6000 | ? | ? |
б) | 0 | ? | ? | 200 |
б) | 0 | ? | ? | 200 |
Для второго столбца значения получатся следующими:
а) | 4000 | 6000 | ? | ? |
б) | 0 | 200 | ? | 200 |
б) | 0 | 200 | ? | 200 |
А для третьего столбца:
а) | 4000 | 6000 | 6000 | ? |
б) | 0 | 200 | 200 | 200 |
б) | 0 | 200 | 200 | 200 |
3. Осталось найти значения для оставшихся ячеек (потребление мазута = 9, а превышения запаса мазута нет).
В этом случае все непокрытые потребности аналогичны первому столбцу и стоят столько же, сколько закупка недостающего мазута по цене, превышающей отпускную на 50%. Значит, все значения в последнем столбце равны 6000 ден. ед.
а) | 4000 | 6000 | 6000 | 6000 |
б) | 0 | 200 | 200 | 200 |
б) | 0 | 200 | 200 | 200 |
3. Мы построили матрицу платежей. Теперь можем рассчитать оптимальные стратегии ЛПР в соответствии с критериями Лапласа и Вальда.
a) В критерии Лапласа выбирается стратегия, при которой сумма денежных единиц (платежей) для каждой стратегии природы максимальна. Мы можем рассчитать суммы для каждой стратегии природы и выбрать максимальную.
- Для первой стратегии природы (потребление мазута = 7 топл. ед.) сумма денежных единиц равна 6000 + 200 + 200 = 6400 ден. ед.
- Для второй стратегии природы (потребление мазута = 8 топл. ед.) сумма равна 6000 + 200 + 200 = 6400 ден. ед.
- Для третьей стратегии природы (потребление мазута = 9 топл. ед.) сумма равна 6000 + 200 + 200 = 6400 ден. ед.
Максимальная сумма денежных единиц равна 6400 ден. ед. для всех трех стратегий природы. Все стратегии ЛПР будут оптимальными по критерию Лапласа.
б) В критерии Вальда выбирается стратегия, у которой минимальная сумма денежных единиц (платежей) для каждой стратегии ЛПР максимальна. Мы можем рассчитать минимальные суммы для каждой стратегии ЛПР и выбрать максимальную.
- Для первой стратегии ЛПР (закупить дополнительное количество мазута, если запасы не хватят) минимальная сумма равна 0.
- Для второй стратегии ЛПР (не закупать дополнительное количество мазута, если запасы превысят потребность) минимальная сумма равна 200.
- Для третьей стратегии ЛПР (не закупать дополнительное количество мазута, если запасы превысят потребность) минимальная сумма равна 200.
Максимальная минимальная сумма денежных единиц равна 200. То есть, для всех трех стратегий природы оптимальной по критерию Вальда будет вторая и третья стратегии ЛПР.
Поэтому оптимальные стратегии ЛПР в соответствии с критериями Лапласа и Вальда будут следующими:
- ЛПР выбирает любую стратегию (без разницы, какую) при любом возможном ходе природы (потребление мазута = 7, 8 или 9 топл. ед.) в соответствии с критерием Лапласа.
- ЛПР выбирает стратегию "не закупать дополнительное количество мазута, если запасы превысят потребность" при любом возможном ходе природы (потребление мазута = 7, 8 или 9 топл. ед.) в соответствии с критерием Вальда.
Надеюсь, это подробное объяснение помогло вам понять, как построить матрицу платежей и найти оптимальные стратегии ЛПР в данной игре с природой.