Студент Университета МИСИС Вячеслав Пачков в качестве выпускной квалификационной работы создал приложение для смартфона, прогнозирующее задержки авиарейсов. Результаты показывают, что обученная на больших данных модель, делала прогнозы, которые отличались от истинных значений задержек на 12 минут, что говорит о высокой точности и широких перспективах для развития данной темы.
Задержки вылетов являются серьезной проблемой как для авиакомпаний, так и для пассажиров, поскольку они приводят к значительным потерям времени и денег. Основные факторы, которые способствуют задержкам авиакомпаний, включают погодные условия, загруженность, тип и возраст воздушного движения, а также проблемы с техническим обслуживанием самолетов.
Современные нейросети могут помочь людям подстраховаться в случае переноса или отмены рейса и спланировать свои дальнейшие действия. Для прогнозирования задержек подходят различные алгоритмы машинного обучения, такие как модель многослойного перцептрона, байесовское моделирование, дерево решений, кластерная классификация или случайный лес. С их помощью можно оценить как вероятность, так и серьезность задержек рейсов, что может оказаться неоценимым при разработке более эффективных стратегий планирования и обслуживания авиакомпаний.
«Методы машинного обучения отлично справляются с задачами в сфере авиаперевозок. Определение наиболее важных и информативных признаков является ключевым этапом в разработке эффективной модели прогнозирования задержек авиарейсов. Мне кажется, если авиакомпании или аэропорты вложатся в это направление для повышения точности и надежности предсказаний — это продемонстрирует заботу о клиентах, повысит положительную репутацию ответственного перевозчика и, конечно, позволит выбрать наиболее эффективную стратегию управления рисками», — сказал Вячеслав Пачков.
В основе разработки лежит искусственная нейронная сеть, способная обрабатывать сложные входные данные и проводить нелинейную классификацию или регрессию, она называется модель многослойного перцептрона (Multilayer Perceptron, MLP). MLP может моделировать более сложные функции и зависимости между входными и выходными данными. Входной слой принимает вектор признаков, скрытые слои обрабатывают данные, а выходной слой генерирует предсказания. Нейроны между слоями соединены весами, которые определяют степень влияния каждого нейрона на другие нейроны. Процесс обучения продолжается до достижения определенного критерия остановки, например, до минимального значения функции потерь или стабилизации ошибки на проверочном наборе данных.
В модели используется 9 входных признаков: время между прилетом и вылетом из аэропорта отправления; ожидаемое время прилета в аэропорт назначения; дальность полета; аэропорт вылета; аэропорт прилета; вид воздушного судна; температура; вероятность осадков; время года. В общей сложности было собрано около миллиона записей, представляющих собой информацию о полётах за последний год из API-интерфейсов служб отслеживания рейсов FlightAware и FlightStats из России, Канады, Великобритании, Франции, Германии, Австралии, Японии и США, обеспечив значительный объем данных и географическое разнообразие. Источниками для сбора метеорологических данных послужили WeatherAPI, OpenWeatherMap и Weather Underground.
Этот датасет был использован в качестве основы для обучения и последующего тестирования модели машинного обучения. После замера производительности на тестовом наборе данных, сконвертированная модель была интегрированная в iOS приложение для демонстрации работы на реальных данных. Приложение использует разработанную модель для выполнения предсказаний на мобильном устройстве.
При дальнейшем обучении в НИТУ МИСИС Вячеслав Пачков планирует доработать приложение, повысив точность модели и оптимизировав слои нейронной сети для ускорения работы на слабых мобильных устройствах.