Формирование оптимального маршрута больших групп интеллектуальных агентов

Автор(ы): Максимов Д.Ю.

Выпуск: 78

Рубрика: Системный анализ

Год: 2019

Библиография: Максимов Д.Ю. Формирование оптимального маршрута больших групп интеллектуальных агентов // Управление большими системами. Выпуск 78. М.: ИПУ РАН, 2019. С.46-70. URL: https://doi.org/10.25728/ubs.2019.78.3

Дата опубликования: 31.03.2019

Ключевые слова: интеллектуальные агенты, выбор маршрута, решетка целей, игровая семантика

Аннотация: В подходе Artificial General Intelligence (Universal AI) интеллект рассматривается как информационный процессор, потребляющий и выдающий информацию, которой и определяется поведение системы. В рамках этого подхода M. Hutter получил способ выбора оптимальной траектории агента в абстрактной среде. Однако этот способ требовал численных оценок вознаграждения при том или ином движении, способ получения которых оставался открытым. Также этот метод не подходит для оценок движения группы агентов. В настоящей работе оценки вознаграждений предоставляются самой средой и предложен способ выбора траектории, который применим для группы агентов. Параллельное выполнение группой интеллектуальных агентов ряда задач, представляется тензорным произведением соответствующих процессов в категории игр Конвея, которая сопоставлена среде и движениям агентов. Оптимальный маршрут группы определяется как игра с наибольшим суммарным выигрышем в этой категории. Выигрыш представлен степенью определенности (видимости) цели агента, т.е. некоторым множеством, а не числом. Доказано, что такое определение выигрыша может быть использовано в категорной конструкции для игр Конвея. В этой категории тензорное произведение является операцией линейной логики. Также линейная логика применяется для выбора целей, которые система может достичь, из всего множества видимых целей. Для этого все множество целей представляется в виде решетки, на которой задана структура линейной логики. Решетка целей в этом случае становится множеством истинностных значений логики. Целям, которые достигаются параллельно, также соответствует тензорное произведение (как и параллельным процессам в среде), но только теперь это произведение элементов решетки целей. Цели выбираются по наибольшей степени истинности того элемента решетки, который соответствует их параллельному достижению. В результате получена формула для оценки наиболее выигрышного маршрута в абстрактной среде для группы агентов.

Author(s): Maximov D.

Article title: An optimal itinerary generation of large intellectual agent groups

Issue: 78

Year: 2019

Keywords: intelligent agents; itinerary choice; goal lattice; game semantics

Abstract: Intelligence is represented in the Artificial General Intelligence (or Universal AI) approach as an information processor which consumes and gives out information. This information completely determines the system behavior. M. Hutter has obtained an optimal agent trajectory selecting in an abstract environment within this approach. However, the method demands number assessments of the reward in such a movement, and the way to obtain these assessments was not defined. The method does not also fit to estimate an agent group movement. In this paper, reward assessments are represented by the environment. The way to choose a trajectory for an agent group is also suggested. A group of intelligent agents which fulfill a set of tasks in parallel is represented by the tensor multiplication of corresponding processes in the Conway game category. The category corresponds to the environment and agents' moves. An optimal itinerary of the group is defined as a play with maximal total reward in the category. The reward is represented as a degree of certainty (visibility) of an agent goal, i.e., by some set, not a number. It is proved that such a reward determination may be used in the categorical construction of Conway games. The tensor product in the category is the operation of linear logic. Such logic is also used in selecting goals which the system can achieve of all visible ones. In the purpose, the whole goal set is represented as a lattice with the linear logic structure. The goal lattice is the truth value set of the logic in this case. The tensor product of the lattice elements corresponds to goals which are achieved in parallel. The system goals are chosen by the highest truth value of the lattice element which corresponds to they parallel achieving processes. Such a construction results in the formula of the optimal itinerary estimation in an abstract environment for an agent group.