Автор: Дмитрий Сергеевич Половников
Соавторы:
Михаил Евгеньевич Семенов, кандидат физико-математических наук, доцент, научный руководитель направления "Финансовая математика и финансовые технологии"
Аннотация:
Задача об оптимальном исполнении биржевых заявок является одной из самых важных для всех институциональных инвесторов как зарубежных, так и российского фондового рынка. В данной статье представлен подход для поиска оптимальной торговой стратегии, основанный на глубоком обучении с подкреплением (RL). Для анализа и моделирования среды мы используем исторические потоки входящих заявок на Московской бирже за апрель 2025 года для акций обыкновенных ПАО~"Аэрофлот" (AFLT). Главные нововведения в рассматриваемой модели заключаются в более полном описании текущего рыночного состояния и применении более сложных моделей ценового влияния, приближающих условия торговли в моделируемой среде к реальным. Основные компоненты, используемые в модели: состояние таблицы котировок, пропагатор и зависящая от объема исполнения функция временного влияния, — являются важными факторами принятия решений агента. Для того чтобы сделать систему принятия решений более прозрачной, мы исследуем вопрос важности признаков состояния среды, применяя аппарат теории игр и рассчитывая значения Шепли для каждого признака. Полученные результаты показывают, что RL-решение в рамках представленной модели оказывается лучше тривиальных стратегий в терминах дефицита исполнения, а также -- принятие решения зависит от текущего состояния таблицы котировок.
Ключевые слова:
оптимальное исполнение, московская биржа, обучение с подкреплением, дефицит исполнения, ценовое влияние

