Сообщение №1420938401482947

0 +0−0Pavel Bakhtin04:06:41
11/01/2015
2 +5−3Ещё один из *этих*01:31:46
11/01/2015
Наверно смысл статьи заключался в следующем: традиционный алгоритм игры в покер основан на подсчёте вероятностей, и предполагается что поведение других игроков также учитывает вероятности. Таким образом из поведения других игроков можно однозначно высчитывать вероятность выигррыша по мере игры.

"Умение блефовать" - здесь ИМХО подразумевается что оптимальная стратегия допускает блеф, и, соответственно, другие игроки также блефуют.

Алгоритм по идее должен выбрать стратегию блефа, для этой стратегии найти наилучшую стратегию (путём перебора большого кол-ва вариантов), затем подставить улучшенную стратегию и для неё также найти оптимальное противодействие и т.д.

Самое главное сформулировать задачу так чтобы решение сходилось, т.е. прийти к определённой стратегии блефа, а не на каждой итерации принципиально всё менять.
Интересен сам по себе факт того что у этой задачи есть решение. Т.е. есть объективно сильный игрок, который умеет выигрывать у любого соперника, а не обыгрывать конкретную стратегию.
В покере почти нет чистого блефа, только если у тебя самая слабая возможная рука после ривера. Потому что у соперника всегда может быть рука хуже и ты в реальности не блефуешь ставкой. А программа играет вероятностями победы определенного спектра рук в конкретной ситуации. Только не в лоб, а если вероятность что твоя рука лучше спектра рук соперника выше 50, то чаще ставит/повышает, иногда чекает/коллирует, реже сбрасывает. Ну и так на каждой улице торгов. Ну и еще масса нюансов, но в итоге чистая математика. И это только в лимитном покере 1х1, ибо пока не хватает мощности так просчитать даже лимитный покер на большее число человек.
Самые
^^^Наверх^^^Обратная связь