Автор: Светлана Михайловна Озюменко
Соавторы:
Озюменко Светлана Михайловна, Рахмани Джахед Джалильевич, Мокров Данила Сергеевич, Гилев Филипп Викторович
Аннотация:
В данной статье рассматриваются методы машинного обучения для составления сценария разработки системы по предсказанию рейсов на основе погодных условий. Такая система будет крайне актуальна в наше время из-за значительных убытков авиакомпаний и недовольства пассажиров в связи с переносами воздушных рейсов. Для рассматриваемой модели погодные условия будут служить отличным сырьем для обработки, так как они являются главным виновником за-держек рейсов. Целью исследования в статье являлся сравнительный анализ алго-ритмов машинного обучения для построения модели прогнозирования отклонений рейсов на основе погодных условий. За исходные данные в работе принимались данные о рейсах (время вылета, аэропорты, длительность полета) и погодные пара-метры, такие как температура, влажность, скорость ветра. Также было проведено сравнение алгоритмов: логистической регрессии, случайного леса и градиентного бустинга. По полученным результатам наилучшим решением стал градиентный бустинг, благодаря способности учитывать сложные нелинейные зависимости в данных. Предобработка данных включала очистку от пропусков, обработку выбро-сов, создание новых признаков (сезон, время суток, экстремальные погодные усло-вия), а также кодирование и нормализацию. При построении модели было взято две группы факторов: погодные условия (влажность, давление, температура) и операционные факторы (время отправления, день недели, сезон). Для оптимизации модели были рассмотрены методы подбора гиперпараметров, среди которых наиболее результативной оказалась байесовская оптимизация. Были изучены оценки качества модели для задач классификации: Accuracy, Recall, F1-score, ROC-AUC, что позволит проверить точность прогнозов модели. Результаты, полученные в рамках исследования, показывают значительный потенциал системы в минимизации экономических убытков авиакомпаний и улучшении лояльности пассажиров, а перспективой развития является интеграция системы в интерфейсы авиакомпаний.
Ключевые слова:
прогнозирование задержек рейсов, машинное обучение, погодные условия, градиентный бустинг, обработка данных, оптимизация гиперпараметров, кросс-валидация, регуляризация, точность модели.

