Партнеры

Счетчики








Функция риска

Применение методов искусственного интеллекта в переборных алгоритмах

Так как исследуемые игры не требуют от игроков раскрытия выбранных ими стратегий, то приемлемыми можно считать любые смешанные стратегии, предполагаемые для действий серых. В частности те чистые стратегии, которые были выбраны в начале ("катастрофические" для игроков), также подходят. Вопрос лишь в эффективности данного выбора смешанной стратегии серых. Далее мы будем вместо вопроса о выборе смешанных стратегий, предполагаемых для действий серых, рассматривать вопрос о методе вычисления верхней и нижней оценок в позициях с с-ходом ввиду того, что эти вопросы эквивалентны.

Игрок вычисляет оценку позиции с с-ходом как некоторую функцию от оценок позиций, в которые ведут с-ходы из данной. Будем называть эту функцию функцией риска. Итак, задача сводится к поиску функции риска. Функции риска, выбранные разными игроками, могут быть различными, что обуславливает различность верхней и нижней оценок позиций. Если оценки заключительных позиций расставить так, чтобы аналогичным победам разных игроков соответствовали одинаковые по модулю числа, но разные по знаку, то можно сделать следующий вывод о свойствах функций риска. Если игроки выбирают функции риска по одному принципу, то равенство верхней и нижней оценок позиции определяется четностью функции риска. Поэтому среднее арифметическое приводит к равенству оценок, а экстремум не приводит.

С учетом использования функций риска теорема о переносе оценок может быть переформулирована в общем случае, при этом формулы Цермело приобретают следующий вид: оц*(А)=max оц*(В), (Вm(А)), если в позиции А ход белых; оц*(А)=min оц*(В), (Вm(А)), если в позиции А ход черных; оц*(А)=f*1, B2, ..., Вn), (Вim(А), i=1,2,...,n), если в позиции А ход серых; оц*(А)=max оц*(В), (ВM(А)), если в позиции А ход белых; оц*(А)=min оц*(В), (ВM(А)), если в позиции А ход черных; оц*(А)=f*1, B2, ..., Вn), (ВiM(А), i=1,2,...,n), если в позиции А ход серых; где m(А) - множество позиций В, непосредственно следующих за А, f*, f* - функции риска, выбранные белыми и черными соответственно. Принимая во внимание теорию белой игры, описанную в предисловии к "М.М.Ботвинник. Алгоритм игры в шахматы. М.: Наука. 1968" можно рассматривать только последние три формулы, так как именно они существенны для выбора хода белых. Соответственно разговор может вестись только об одной функции риска - f*.

К описанию использования функций риска остается добавить, что сравнение эффективности различных функций риска в настоящее время - дело практики. Некоторые результаты по этому поводу опубликованы в "Б.Ф.Мельников, А.Н.Радионов. О выборе стратегии в недетерминированных антагонистических играх. - Программирование (РАН), 1998, N5, с.98-99".

А.В.Мосеев, underwood.narod.ru, 1999 год