Доброго времени суток. нужна небольшая с на динамическое программирование. по решению учителя оценка за предмет будет выставляться согласно следующим правилам: студент подбрасывает кубик (6-ти гранный) и у него есть 3 попытки. студент может остановиться в любое время (на любой из попыток) если студент решает бросать все 3 раза последний результат будет решающим. оценка за курс выставляется по след. критериям. если на кубике выпадает 1 - студент получает 0 ; 2-60, 3-70, 4-80, 5-90, 6-100. студент заинтересован получить наибольший . требуется 1) определить этап, состояние и переменная решения (stage, state, decision variable) это у меня есть - этап это номер подбрасования кубика (n -1, 2, 3); состояние это на каком этапе мы остановились, чтобы принять решение; переменная это - продолжать или остановиться а вот со второй частью загвоздка - 2) решить с подходящей таблицы динамического программирования и отметить оптимальное решение. то есть я понимаю, что в идеале студент кидает 6-ку с первого раза и уходит, но в реальной жизни, должен быть у него какой-то минмакс же? подстраховочный вариант, где он не прогорит и не получит 0, так? ? а как выразить это полная загвоздка заранее всем

nybik22890qw nybik22890qw    3   16.09.2019 06:00    2

Ответы
nastiaprokopiv nastiaprokopiv  07.10.2020 19:06
Это задачка на теорию вероятности получается таблицу бы я составил такую. В ней было бы 2 строки и 6 столбцов, строки означают номер броска кубика, столбцы выброшенное число, а на пересечении либо 1 если мы продолжаем кидать кубик либо 0. Таким образом заполнив эту таблицу мы расмотрим все варианты задачи. Вероятностьвыбросить одно из значений 1/6. Если мы бросаем первый раз кубик нам надо чтобы у нас выпало и тогда мы согласимся на оценку. Если же выпало 4, но вероятность олучить лучшую оценку равна 4/6 тоесть это выгодный риск и мы на него идем. Во втором броске мы прекращаем бросать если выпало 4.
ПОКАЗАТЬ ОТВЕТЫ
Другие вопросы по теме Экономика