Автор: Максим Владимирович Щербаков
Соавторы:
Чечеткин И.А., Щербаков М.В., Садовникова Н.П., Парыгин Д.С., Голубев А.В.
Аннотация:
В статье рассматривается проблема обработки геораспределенных данных большого объема с целью автоматической группировки данных в соответствии с географической близостью (кластеризация).
Рассмотрены различные алгоритмы кластеризации и проанализорованы возможности их применения к данным рассматриваемого типа.
Предложен подход к кластеризации геораспределенных данных, основанный на базовом алгоритме k-средних и вычислении реального расстояния между точками с учетом городского рельефа.
Рассмотрены различные способы реализации, в том числе и распараллеливание выполнения.
Представлены различные тестовые примеры, объясняющие суть предлагаемого подхода.
Ключевые слова:
геораспределенные данные, построение маршрутов, кластеризация