УПРАВЛЕНИЕ БОЛЬШИМИ СИСТЕМАМИ
на главную написать письмо карта сайта

Исследование применимости метрики Громова – Вассерштейна для прямого сравнения классов изображений


Название статьи:  Исследование применимости метрики Громова – Вассерштейна для прямого сравнения классов изображений
Выпуск: 121
Год: 2026
Библиография: Волгина А.Д., Макаренко А.В. Исследование применимости метрики Громова – Вассерштейна для прямого сравнения классов изображений // Управление большими системами. - 2026. - Вып. 121. - С.105-126.
Дата опубликования: 31.05.2026
Ключевые слова: оптимальный транспорт, расстояние Громова – Вассерштейна, сравнение изображений
Аннотация: Подавляющее большинство задач машинного зрения на данный момент решаются глубокими нейронными сетями, однако в контексте сравнения изображений нейросети имеют ряд критических недостатков. Перспективной альтернативой являются прямые функциональные метрики, так как они не требуют обучения, вычислительно компактны и интерпретируемы. Рассматривается вопрос применимости одной из подобных метрик, а именно метрики Громова – Вассерштейна для прямого «попиксельного» сравнения классов изображений. Был проведён обзор литературы с целью изучения использования данной метрики в задачах компьютерного зрения. Кроме того, был проведён численный эксперимент по прямому сравнению классов изображений на наборах данных MNIST и CIFAR-10, а также с изображениями простейших геометрических фигур (набор ФИГУРА-4). Сравнивалось распределение значений метрики объединённого Громова – Вассерштейна между объектами одного класса и разных, что оценивалось критерием Манна – Уитни. Также был проведён аналогичный эксперимент с метрикой объединённого несбалансированного Громова – Вассерштейна на наборе данных CIFAR-10 с целью снятия ограничения на равенство суммарной интенсивности пикселей изображений. Результаты показали, что в общем случае метрики Громова – Вассерштейна и объединённого Громова – Вассерштейна ограниченно применимы для решения задачи прямого («попиксельного») сравнения классов изображений в случае «простых» изображений, и неприменимы в случае «сложных» изображений.


Author(s): Volgina A., Makarenko A.
Article title: A study on using the Gromov – Wasserstein metric for direct image class comparison
Issue: 121
Year: 2026
Keywords: optimal transport, Gromov – Wasserstein distance, image comparison
Abstract: The overwhelming majority of machine vision tasks are currently solved using deep neural networks; however, in the context of image comparison, neural networks have a number of critical shortcomings. A promising alternative is direct functional metrics, as they require no training, are computationally compact, and interpretable. This paper examines the applicability of one such metric, namely the Gromov – Wasserstein metric, for direct "pixel-by-pixel" comparison of image classes. A literature review was conducted to study the use of this metric in computer vision tasks. Furthermore, a numerical experiment was performed on direct comparison of image classes using the MNIST and CIFAR-10 datasets, as well as images of simple geometric shapes (the ФИГУРА-4 dataset). The distribution of the Fused Gromov – Wasserstein metric values between objects of the same class and of different classes was compared, evaluated using the Mann – Whitney criterion. A similar experiment was also conducted with the Fused Unbalanced Gromov – Wasserstein metric on the CIFAR-10 dataset to lift the restriction on the equality of total pixel intensity in images. The results show that, in general, the Gromov – Wasserstein and fused Gromov – Wasserstein metrics have limited applicability for solving the task of direct ("pixel-by-pixel") comparison of image classes in the case of "simple" images, and are not applicable in the case of "complex" images.


в формате PDF

Просмотров: 24; загрузок: , за месяц: .

Назад

ИПУ РАН © 2007. Все права защищены