Читать онлайн «Игровые моменты остановки»

Автор Владимир Мазалов

АКАДЕМИЯ НАУК СССР СИБИРСКОЕ ОТДЕЛЕНИЕ ЧИТИНСКИЙ ИНСТИТУТ ПРИРОДНЫХ РЕСУРСОВ В. В. МАЗАЛОВ ИГРОВЫЕ МОМЕНТЫ ОСТАНОВКИ Ответственный редактор д-р физ. -мат. наук В. П. Скитович НОВОСИБИРСК ИЗДАТЕЛЬСТВО «НАУКА» СИБИРСКОЕ ОТДЕЛЕНИЕ 1987 УДК 519. 2 — 518. 9 Мазалов В. В. Игровые моменты остановки. — Новосибирск: Наука, 1987. Монография посвящена исследованию игровых задач на правило остановки случайных процессов. Приведены аналитические и численные методы нахождения ситуаций равновесия и значений таких игр для различных типов наблюдаемых игроками процессов. Особое внимание уделено геометрическим методам решения. Для специалистов по теории управления, теоретической кибернетике, исследованию операций и теории игр. Рецензенты В. Ф. Демьянов, Д. П. Сенук, Р. Я.
Читашвили м 1502000000-760 115_87_|| © Издательство «Наука», 1987 г. 042102)—87 w У читателя может возникнуть вопрос: стоит ли вообще заниматься научным анализом азартных, и в частности карточных, игр? Я глубоко убежден, что ответ на этот вопрос непременно должен быть утвердительным. Азартные игры заслуживают теоретического разбора не только потому, что их анализ способствует более глубокому пониманию комбинаторики и теории вероятностей. Не следует забывать о том, что возникающие при этом задачи представляют интерес для истории науки, поскольку, как известно, именно задачи, связанные с азартными играми, сыграли важную роль в становлении теории вероятностей. Наконец, нельзя не упомянуть и о том, что при разработке многих важных понятий современной науки и техники первостепенное значение приобретают опыт и математические знания, накопленные при анализе азартных игр. А. Ренъи ПРЕДИСЛОВИЕ Задачи на правило остановки — наиболее изученный раздел теории оптимального управления случайными процессами. Отличительной особенностью такиу задач является наличие у игроков в каждый момент времени двух стратегий: прекратить или продолжить наблюдения за траекторией некоторого случайного процесса. Предполагается, что при этом определены фазовое пространство процесса наблюдений, вероятностная структура перехода из одного состояния в другое и структура платежей и решений. Все рассматриваемые ниже процессы считаются марковскими, а структура платежей определяется с помощью заданных на состояниях функций с (х) платы за продолжение наблюдений и f(x) выигрыша в случае остановки процесса в состоянии х. Игрок может сравнить выигрыш в случае прекращения игры с ожидаемым выигрышем в случае ее продолжения, что, в свою очередь, определяет структуру решающего правила. Среди фундаментальных работ по этому вопросу отметим работы А. Вальда [8] и [9], А. Н. Ширяева [59], Г. Роббинса, Д. Сигмунда, И. Чао [43]. В терминах задач на правило остановки формулируются такие важные прикладные задачи, как последовательная проверка статистических гипотез, выбор наилучшего объекта, обнаружение момента разладки случайного 3 процесса, остановка алгоритма случайного поиска экстремума функции и др.