АКАДЕМИЯ НАУК СССР
СИБИРСКОЕ ОТДЕЛЕНИЕ
ЧИТИНСКИЙ ИНСТИТУТ ПРИРОДНЫХ РЕСУРСОВ
В. В. МАЗАЛОВ
ИГРОВЫЕ
МОМЕНТЫ
ОСТАНОВКИ
Ответственный редактор
д-р физ. -мат. наук В. П. Скитович
НОВОСИБИРСК
ИЗДАТЕЛЬСТВО «НАУКА»
СИБИРСКОЕ ОТДЕЛЕНИЕ
1987
УДК 519. 2 — 518. 9
Мазалов В. В. Игровые моменты остановки. —
Новосибирск: Наука, 1987. Монография посвящена исследованию игровых
задач на правило остановки случайных процессов. Приведены аналитические и численные методы
нахождения ситуаций равновесия и значений таких игр для
различных типов наблюдаемых игроками процессов. Особое внимание уделено геометрическим методам
решения. Для специалистов по теории управления,
теоретической кибернетике, исследованию операций и
теории игр. Рецензенты В. Ф. Демьянов, Д. П. Сенук,
Р. Я.
Читашвили
м 1502000000-760 115_87_|| © Издательство «Наука», 1987 г.
042102)—87 w
У читателя может возникнуть вопрос: стоит ли
вообще заниматься научным анализом азартных, и в
частности карточных, игр? Я глубоко убежден, что
ответ на этот вопрос непременно должен быть
утвердительным. Азартные игры заслуживают теоретического
разбора не только потому, что их анализ способствует
более глубокому пониманию комбинаторики и теории
вероятностей. Не следует забывать о том, что
возникающие при этом задачи представляют интерес для
истории науки, поскольку, как известно, именно задачи,
связанные с азартными играми, сыграли важную роль
в становлении теории вероятностей. Наконец, нельзя
не упомянуть и о том, что при разработке многих
важных понятий современной науки и техники
первостепенное значение приобретают опыт и математические
знания, накопленные при анализе азартных игр. А. Ренъи
ПРЕДИСЛОВИЕ
Задачи на правило остановки — наиболее изученный
раздел теории оптимального управления случайными
процессами. Отличительной особенностью такиу задач
является наличие у игроков в каждый момент времени
двух стратегий: прекратить или продолжить
наблюдения за траекторией некоторого случайного процесса. Предполагается, что при этом определены фазовое
пространство процесса наблюдений, вероятностная
структура перехода из одного состояния в другое и структура
платежей и решений. Все рассматриваемые ниже
процессы считаются марковскими, а структура платежей
определяется с помощью заданных на состояниях
функций с (х) платы за продолжение наблюдений и f(x)
выигрыша в случае остановки процесса в состоянии х. Игрок может сравнить выигрыш в случае прекращения
игры с ожидаемым выигрышем в случае ее
продолжения, что, в свою очередь, определяет структуру
решающего правила. Среди фундаментальных работ по этому
вопросу отметим работы А. Вальда [8] и [9], А. Н. Ширяева
[59], Г. Роббинса, Д. Сигмунда, И. Чао [43]. В терминах задач на правило остановки
формулируются такие важные прикладные задачи, как
последовательная проверка статистических гипотез, выбор
наилучшего объекта, обнаружение момента разладки случайного
3
процесса, остановка алгоритма случайного поиска
экстремума функции и др.