|
|
Интернет конференция по проблемам теории и практики управления
На этом форуме обсуждаются научные публикации, связанные с применением математических моделей в управлении сложными (большими) системами. Для размещения новой публикации воспользуйтесь ссылкой "Подать статью" сверху. С помощью той же ссылки подаются статьи для публикации в Сборнике "Управление большими системами". Все подаваемые в Сборник статьи автоматически публикуются в этой Интернет-конференции, но можно подать статью в Конференции, не подавая ее в Сборник.
Появление статьи в Интернет-конференции не говорит о том, что она опубликована или будет опубликована в Сборнике "Управление большими системами". Статьи в Интернет-конференции публикуются в первоначальной авторской редакции. Изменения, вносимые в статью редколлегией Сборника в процессе ее рассмотрения, не отображаются автоматически в Интернет-конференции. Авторы статей могут внести соответствующие изменения вручную, разместив ответ на сообщение со своей статьей в Интернет-конференции.
Cообщений: 3
Регистрация: 25.02.2026
|
Название: Построение управления на основе Q-обучения с независимым шагом дискретизации Автор: Даниил Девяткин Аннотация: В статье исследуется стратегия управления нелинейными системами на основе независимого Q-обучения. Особенностью работы является то, что предложенный метод реализует принцип управления нелинейной системой на основе измеренных данных, полученных от её линейной аппроксимации, формируя закон управления без априорного знания точной математической модели объекта. Еще одной особенностью предложенного подхода является разделение частот дискретизации: шаг обновления управления намеренно увеличен относительно шага интегрирования динамики для проверки устойчивости алгоритма в критических режимах. Результаты сравниваются с производительностью модельно предиктивного управления (MPC). Сравнивается эффективность алгоритмов стабилизации нелинейной системы, а также их устойчивость к большим шагам дискретизации. Кроме того, был проведен анализ значимости результатов на примере системы двухколёсного робота балансира, подтверждающий преимущество подхода, основанного на обучении с подкреплением. Ключевые слова: обучаемое управление, управления на основе данных, Q-обучение, нелинейные системы
|
|
|
|
Cообщений: 3
Регистрация: 25.02.2026
|
Название: Построение управления на основе Q-обучения с независимым шагом дискретизации Автор: Даниил Девяткин Аннотация: В статье исследуется стратегия управления нелинейными системами на основе независимого Q-обучения. Особенностью работы является то, что предложенный метод реализует принцип управления нелинейной системой на основе измеренных данных, полученных от её линейной аппроксимации, формируя закон управления без априорного знания точной математической модели объекта. Еще одной особенностью предложенного подхода является разделение частот дискретизации: шаг обновления управления намеренно увеличен относительно шага интегрирования динамики для проверки устойчивости алгоритма в критических режимах. Результаты сравниваются с производительностью модельно предиктивного управления (MPC). Сравнивается эффективность алгоритмов стабилизации нелинейной системы, а также их устойчивость к большим шагам дискретизации. Кроме того, был проведен анализ значимости результатов на примере системы двухколёсного робота балансира, подтверждающий преимущество подхода, основанного на обучении с подкреплением. Ключевые слова: обучаемое управление, управления на основе данных, Q-обучение, нелинейные системы
|
|
|
|
Cообщений: 3
Регистрация: 25.02.2026
|
Название: Построение управления на основе Q-обучения с независимым шагом дискретизации Автор: Даниил Девяткин Аннотация: В статье исследуется стратегия управления нелинейными системами на основе независимого Q-обучения. Особенностью работы является то, что предложенный метод реализует принцип управления нелинейной системой на основе измеренных данных, полученных от её линейной аппроксимации, формируя закон управления без априорного знания точной математической модели объекта. Еще одной особенностью предложенного подхода является разделение частот дискретизации: шаг обновления управления намеренно увеличен относительно шага интегрирования динамики для проверки устойчивости алгоритма в критических режимах. Результаты сравниваются с производительностью модельно предиктивного управления (MPC). Сравнивается эффективность алгоритмов стабилизации нелинейной системы, а также их устойчивость к большим шагам дискретизации. Кроме того, был проведен анализ значимости результатов на примере системы двухколёсного робота балансира, подтверждающий преимущество подхода, основанного на обучении с подкреплением. Ключевые слова: обучаемое управление, управления на основе данных, Q-обучение, нелинейные системы
|
|
|
|
|