УПРАВЛЕНИЕ БОЛЬШИМИ СИСТЕМАМИ
на главную написать письмо карта сайта

Стохастическая двухшаговая игра epselon-наилучших ответов размерности 2x2


Название статьи:  Стохастическая двухшаговая игра epselon-наилучших ответов размерности 2x2
Выпуск: 31.7
Год: 2010
Библиография: Райгородская А. В. Стохастическая двухшаговая игра epselon-наилучших ответов размерности 2x2 / Управление большими системами. Специальный выпуск 31.1 "Математическая теория игр и ее приложения". М.: ИПУ РАН, 2010. С.116-140.
Гос. регистрационный номер: 0421000023\0102
Дата опубликования: 31.12.2010
Ключевые слова: повторяющиеся игры, биматричные игры, наилучший ответ
Аннотация: Изучается повторяющаяся 2x2 игра epselon-наилучших ответов, в которой каждый игрок в каждом последующем раунде назначает свою чистую стратегию, основываясь на результате случайного эксперимента; последний генерируется произвольной смешанной стратегией игрока, которая с большой, но, вообще говоря, отличной от 1 вероятностью предписывает этому игроку выбор его наилучшего ответа на чистую стратегию партнера, реализованную в предшествующем раунде. Описанные способы принятния решений (называемые в работе функциями epselon-наилучшего ответа) интерпретируются как поведенческие стратегии игроков. Данные стратегии определяют стохастическую игру, в которой выигрышами игроков выступают их ожидаемые средние выигрыши, получаемые на протяжении всех раундов. Игра анализируется для случая двух раундов: дается классификация равновесий по Нэшу и проводится сравнение равновесных значений со средними выигрышами, получаемыми игроками в ходе детерминированного применения чистых стратегий наилучшего ответа в каждом раунде.

Текст приводится в соответствии с изданием "Математическая теория игр и ее приложения. - 2010. - Т. 2. № 4. - С. 80-101".


Author(s): Raygorodskaya A. V.
Article title: A 2x2 epselon-best response stochastic two-step game
Issue: 31.7
Year: 2010
Keywords: repeated games, bimatrix games, best response
Abstract: A 2x2 epsilon-best response repeated game, in which each player in each subsequent round chooses a pure strategy based on the result of a random test, is analyzed. The random test is generated by the player's arbitrary mixed strategy prescribing the player to choose his/her best response to his/her partner's previously chosen pure strategy with a high probability. The so defined decision making patterns (called epsilon-best response functions) are interpreted as the players' behavioral strategies. These strategies define a stochastic game, in which the expected benefits averaged over all the rounds act as the players' benefits. The game is analyzed in the two-step case. A classification of the Nash equilibrium points is provided, and the equilibrium values are compared with the average benefits gained through the deterministic usage of the players' best response pure strategies.

Original text was published in "Mathematical game theory and applications, 2010. V. 2. No 4. P. 80-101".


в формате PDF

Просмотров: 3802; загрузок: 1125, за месяц: 24.

Назад

ИПУ РАН © 2007. Все права защищены