В статье представлен анализ основных алгоритмов машинного обучения (ML), которые используются в промышленности. Выявлены несколько проблем внедрения в промышленность продуктов на основе искусственного интеллекта (AI) и представлены пути их решения.
Введение
XXI век – век четвертой промышленной революции, когда человечество уже не представляет свою жизнь без интернета. Все сферы жизнедеятельности сейчас стремительно трансформируются, увеличивается конкуренция среди стран по цифровизации экономики, мощнейшая конкуренция среди мировых инновационных компаний и все больше стартапов, которые пытаются внести новую технологию на цифровой рынок.
Цифровизация затронула все отрасли рынка, сначала огромную популярность новый тренд вызвал у ритейла, решались задачи прогнозирования и оптимизировалась логистика. В промышленности интерес к цифровизации был всегда, но готовность инвестировать в нее появилась лишь в 2013 году, популярной тенденцией это можно было назвать в 2016 году, а сейчас наступила фаза быстрого роста [1].
Цифровизация промышленности – термин, довольно распространенный и очень актуальный. Внедрение новых технологий таких как, мониторинг оборудования и персонала в реальном времени, автоматизация процесса принятия решений на основе искусственного интеллекта должны помочь решить такие задачи, как повышение эффективности производства, а именно сокращение расходов на сырье, предсказания качества или событий в производственном процессе, сокращение простоя оборудования, оптимизировать параметры производства и многие другие задачи.
Цифровая среда создала направление развития цифровых технологий, среди них технологий больших данных (big data), когнитивные технологии, нейротехнологии, искусственный интеллект, интернет вещей и машинное обучение, все это активно внедряется в промышленность [2].
Алгоритмы машинного обучения
Машинное обучение (machine learning — ML) – это подтип искусственного интеллекта, технология, которая автоматизирует решения профессиональных задач. Отличительной чертой ML является самостоятельное обучение с минимальным участием человека. Machine learning работает на основе системы алгоритмов. Эту систему можно разделить на алгоритмы на основе деревьев решений и алгоритмы на основе нейронных сетей.
Нейронная сеть представляет из себя систему взаимодействующих между собой искусственных нейронов, по типу работы эта сеть схожа с работой человеческого мозга. С рождения люди видят, как те или иные вещи реализованы в природе, у них строятся закономерности, ассоциации, вырабатывается опыт. Все нейроны мозга соединены и, когда электрических сигнал переходит от одной клетки в другую, происходит запоминание опыта. Миллиарды таких клеток образуют память. По такому принципу и работают нейронные сети. Нейронные сети состоят из входного и выходного слоя, бывает, что слоев может быть больше, такие модели называются персептронами. На входе к модели поступает несколько сигналов, которые соединяются с нейронами при помощи синапсов (w – синаптический вес) далее они соединяются со следующим слоем нейронов и на выход идет тот нейрон, который больше всего схож по весу с входным нейроном [3]. Особенность этой сети, в отличие от других, в самообучении, т. е. с минимальным вмешательством человека. Сеть может обучаться «с учителем» и «без учителя». С «учителем» на входном слое поступают уже готовые классы, на которые нужно разбить данные, а самоорганизующиеся нейронные сети сами выявляют признаки кластеризации и также могут выявить аномалии в данных.
В основном нейронные сети используются для кластеризации больших данных, выявления новых признаков, прогнозирования данных и для сжатия больших данных.
Теперь рассмотрим вторую группу алгоритмов — деревья решений. Их работа более проста по сравнению с нейронной сетью. Деревья решений являются средством принятия решений, которое используют в машинном обучении. Структура деревьев решений состоит из «листьев» и «веток». Атрибуты показаны на «ветках» дерева решений, от которых зависима целевая функция, в «листьях» записана сама целевая функция, а в остальных слоях атрибуты, по которым различаются случаи [4-5]. Целью данного алгоритма является создать модель, которая будет предсказывать значения целевой переменной на основе нескольких переменных на входе.
Основной проблемой деревьев решений является ее переобучение, то состояние модели, когда алгоритм хорошо работает с обучающей выборкой, но плохо анализирует новые данные. Для предотвращения этой ошибки используется ансамбли деревьев решений или леса, т. е. объединение несколько деревьев решений. Для каждой модели используется свой подходящий метод (бэггинг, бустинг, метод случайного леса) [5].
Градиентный бустинг
Более подробно остановимся на градиентном бустинге, т. к. на этом методе больше всего работают модели машинного обучения в промышленности. Градиентный бустинг — это техника машинного обучения для задач классификации и регрессии, которая строит модель предсказания в форме ансамбля слабых предсказывающих моделей, обычно деревьев решений. Цель любого алгоритма обучения с учителем — определить функцию потерь и минимизировать её. «Бустинг» переводится как «наращивание» в контексте «увеличение, усложнение». Дерево принятия решений и даже искусственные нейронные сети — это достаточно примитивные методы и слабые алгоритмы. В том плане, что в них содержится недостаточно много данных. Они хорошо подходят для решения простых задач, связанных с однородными данными. Но если постоянно дополнять эти слабые алгоритмы новыми данными, то произойдет так называемый «бустинг» — то есть, «наращивание дополнительных условий». Градиентный бустинг необходим машинному обучению как средство для решения задач повышенной сложности [6, 8].
Если вернуться к историческому значению градиентного бустинга для ранжирования, то можно увидеть, что с момента своего создания (более десяти лет назад) он стал основным алгоритмом, при тесном взаимодействии с которым строилось само ранжирование, и, как следствие, поисковая выдача. Градиентный бустинг может использоваться как в «онлайн» алгоритмах, так и в «оффлайн».
- Основная идея «оффлайн» алгоритмов заключается в том, что алгоритм применяется для жестко заданного набора блоков (требований), т. е. при добавлении и/или удалении хотя бы одного блока (требований) алгоритм необходимо применять заново. Так же этот алгоритм выдает и анализирует данные не 24/7, как «онлайн» модели, а выдает один раз в установленный период времени (например, один раз в неделю).
- «Онлайн» алгоритмы — это алгоритмы, которые могут последовательно обрабатывать входные данные в режиме реального времени и решать проблему «на ходу».
Комбинирование машинного обучения с классической химией и физикой
В промышленности есть несколько препятствий для использования машинного обучения. Во-первых, это весомость ошибки. Если начать управлять какой-то моделью неправильно, то в лучшем случае она начнет работать неэффективно, но в любом случае это большие суммы денег. В противном случае произойдут необратимые процессы и понадобится дорогостоящий ремонт. Поэтому для того, чтобы внедрить ту или иную модель машинного обучения потребуется много времени. Будут вноситься коррективы, наблюдая, что происходит по показателям, если все идет удачно, то двигаться в том же направлении, но маленькими шажками [1].
Также комбинирование машинного обучения с физикой и химией важно для цифровизации промышленности. Возьмем такое направление, как контроль выброса опасных отходов. Используя имеющиеся параметры, содержащиеся в памяти компьютера, он сам сможет прогнозировать количество выбросов в зависимости от мощности производства на каждом определенном временном промежутке. Однако, в данном случае необходимо, чтобы физические и химические модели, используемые в такого рода системах, обладали всей полнотой данных, поскольку система, данные которой являются неполными, может неправильно их интерпретировать, и в таком случае возможна, например, ситуация, когда имеет место интенсификация производства (например, «скачок» объема выпускаемой продукции), что, естественно должно будет привести к повышению количества выбросов, причем как по физическим (давление, плотность и т.д.), так и по химическим параметрам (концентрация тех или иных веществ) и к необходимости задействования дополнительных фильтров и т.д. Однако, компьютер, программа которого обладает недостаточными данными, может выстроить зависимость в зависимости от каких-либо неучтенных факторов, что в перспективе может привести к катастрофе [1, 7].
Вывод
Цифровизация промышленности – это настоящее и будущее промышленности. Ведь простои, отказы, перегруз мощностей влекут за собой серьезные финансовые потери. Решения на основе технологий искусственного интеллекта (AI) делают эти процессы более понятными и прозрачными, а значит, более управляемыми. Встраиваемые в оборудование датчики своевременно и оперативно собирают, передают информацию о его работе в информационную систему. Собираемая информация позволяет прогнозировать возможные отказы и аварии, а также помогать разрабатывать оптимальные режимы работы оборудования, тем самым увеличивая производительность и в целом улучшать работу предприятия.
СПИСОК ЛИТЕРАТУРЫ
- Блог компании Smile-Expo. Интервью с архитектор ML и директор по внедрению в компании «Цифра» — Романом Чеботаревым. Зачем заводам машинное обучение. – 15.11.2018. https://habr.com/ru/company/smileexpo/blog/. Дата обращения: 22.12.2018.
- Плосская О. Машинное обучение в промышленности — формула успеха. – 27.08.2018. https://www.osp.ru/os/2018/03/13054409/. Дата обращения: 25.12.2018.
- Per Harald Borgen. Изучаем нейронные сети за четыре шага. – 07.08.2016. https://tproger.ru/translations/learning-neural-networks/. Дата обращения: 24.12.2018.
- Open Data Science. Крупнейшее русскоязычное Data Science сообщество. Открытый курс машинного обучения. Тема 3. Классификация, деревья решений и метод ближайших соседей. – 13.03.2017. https://habr.com/ru/company/ods/blog/322534/. Дата обращения: 25.12.2018.
- Шитиков В. К., Мастицкий С. Э. Классификация, регрессия и другие алгоритмы Data Mining с использованием R. — 07.04.2017. — https://ranalytics.github.io/data-mining/index.html. Дата обращения: 23.12.2018.
- Литвинов С. Градиентый бустинг — просто о сложном. – 27.11.2018. — https://neurohive.io/ru/osnovy-data-science/gradientyj-busting/. Дата обращения: 22.12.2018.
- Галадей А. В MIT создали ИИ, который исследует законы физики в вымышленных вселенных. – 05.11.2018. — https://tproger.ru/news/mit-ai-physics/. Дата обращения: 22.12.2018.
- Open Data Science. Крупнейшее русскоязычное Data Science сообщество. Открытый курс машинного обучения. Тема 10. Градиентный бустинг. – 18.05.2017. https://habr.com/ru/company/ods/blog/327250/. Дата обращения: 22.12.2018.
ИНФОРМАЦИЯ ОБ АВТОРЕ
Соломина Виктория Александровна – главный специалист – эксперт Министерства промышленности и торговли РФ.
Адрес: Россия, Москва, Китайгородский пр-д, 7. Тел.: +7(916)168-66-28.
E-mail:viktoriya_solomina@mail.ru.
Место учебы : Финансовый университет при Правительстве РФ, финансово-экономический факультет, степень – магистр.