Сравнение методов AutoML и ML с учителем для решения задач распознавания изображений

350 руб

Журнал «Нейрокомпьютеры: разработка, применение» №5 за 2022 г.

Статья в номере:

Тип статьи: научная статья

DOI: https://doi.org/10.18127/j19998554-202205-02

УДК: 004.85

Ключевые слова: Автоматическое машинное обучение Custom Vision VGG распознавание образов компьютерное зрение рентгенов-ские снимки

Авторы:

Н.А. Андриянов1, Ю.Б. Камалова2, Г.В. Моисеев3

1-3 Финансовый университет при Правительстве Российской Федерации (Москва, Россия)

Аннотация:

Постановка проблемы. На сегодняшний день существует множество облачных решений для задач машинного и даже глубокого обучения. Однако не всегда ясно, насколько корректна та или иная модель, реализуемая на базе таких решений. Необходимо проверить работу облачного сервиса на разных изображениях, чтобы понимать, насколько хорошо такая система распознает образы.

Цель. Исследовать эффективность работы облачного сервиса Microsoft Custom Vision и сравнить результаты исследования с данными, полученными с помощью стандартных библиотек глубокого обучения Python.

Результаты. Проведен сравнительный анализ использования сервисов для автоматического машинного обучения с разработкой базовых моделей сверточных нейронных сетей в среде Python в задаче распознавания образов. Показано, что стандартные методы трансферного обучения без подбора параметров уступают решениям, доступным в облаке, таким как Microsoft Custom Vision. Выполнено сравнение различных моделей нейронных сетей на примере изображений зерен пыльцы и рентгеновских снимках багажа. Установлено, что добиться максимальной точности на тестовой выборке позволяют алгоритмы AutoML, а метрики precision и recall при этом достигают значений на 2-3% выше, чем при классическом обучении. Выявлена особенно сильная разница при обучении на несбалансированных датасетах, где выигрыш по средней точности и полноте может быть до 10-15%.

Практическая значимость. Проведенное исследование показало, что облачные системы обеспечивают высокие результаты на данных микроскопических и рентгеновских изображений. Кроме того, они не требуют от пользователя знаний языка программирования и позволяют разрабатывать интеллектуальные решения для классификации изображений большему числу пользователей.

Страницы: 19-27

Для цитирования

Андриянов Н.А., Камалова Ю.Б., Моисеев Г.В. Сравнение методов AutoML и ML с учителем для решения задач распознавания изображений // Нейрокомпьютеры: разработка, применение. 2022. T. 24. № 5. С. 19-27. DOI: https://doi.org/ 10.18127/j19998554-202205-02

Список источников

Andriyanov N., Dementiev V., Tashlinskiy A., Danilov A. Machine Learning Technologies for Bakery Management Decisions // 24th International Conference on Digital Signal Processing and its Applications. Moscow. 30 March 2022 - 1 April 2022. id: 180062. Р. 1-6. DOI: 10.1109/DSPA53304.2022.9790767.
Коротеев М.В. Обзор некоторых современных тенденций в технологии машинного обучения // E-Management. 2018. № 1. С. 26–35.
Tornede A., Gehring L., Tornede T., et al. Algorithm selection on a meta level // Mach. Learn. 2022. № 3. Р. 1-12.
DOI: 10.1007/s10994-022-06161-4.
Das P., Perrone V., Ivkin N., Bansal T., Karnin Z., Shen H., Shcherbatyi I., Elor Y., Wu W., Zolic A., Lienart T., Tang A., Ahmed A., Faddoul J.B., Jenatton R., Winkelmolen F., Gautier P., Dirac L., Perunicic A., Miladinovic M., Zappella G., Archambeau C., Seeger M., Dutt B., Rouesnel L. Amazon SageMaker Autopilot: a white box AutoML solution at scale [Электронный ресурс]. Rezhim dostupa: https://arxiv.org/abs/2012.08483, дата обращения 05.09.2022.
Demidovskij A., Tugaryov A., Kashchikhin A., Suvorov A., Tarkan Y., Fedorov M., Gorbachev Y. OpenVINO Deep Learning Workbench: Towards Analytical Platform for Neural Networks Inference Optimization // Journal of Physics Conference Series. 2021. V. 1828. № 1. Р. 012012. DOI: 10.1088/1742-6596/1828/1/012012.
Andriyanov N.A. Analysis of the Acceleration of Neural Networks Inference on Intel Processors Based on OpenVINO Toolkit // 2020 Systems of Signal Synchronization, Generating and Processing in Telecommunications. SYNCHROINFO 2020. Svetlogorsk. 1-3 July 2020. id: 91660672020. Р. 1-5. DOI: 10.1109/SYNCHROINFO49631.2020.9166067.
Azab E., Nafea M., Shihata L.A., Mashaly M. Machine-Learning-Assisted Simulation Approach for Incorporating Predictive Maintenance in Dynamic Flow-Shop Scheduling // Appl. Sci. 2021. № 11. Р. 11725. DOI: 10.3390/app112411725.
Salvaris M., Dean D., Tok W.H. Cognitive Services and Custom Vision: Building and Deploying Artificial Intelligence Solutions on the Microsoft AI Platform // Deep Learning with Azure. 2020. Р. 1-189. DOI: 10.1007/978-1-4842-3679-6_5.
Камалова Ю.Б., Андриянов Н.А. Распознавание микроскопических изображений пыльцевых зерен с помощью сверточной нейронной сети VGG-16 // Вестник Южно-Уральского государственного университета. Сер. Компьютерные технологии, управление, радиоэлектроника. 2022. Т. 22. № 3. C. 39-46.
Гладких А.А., Андриянов Н.А., Волков Ал.К., Волков Ан.К. Разработка алгоритмов распознавания опасных объектов на рентгеновских снимках систем безопасности // Материалы 23-й Всеросс. молодежной науч. конф. «Актуальные проблемы физической и функциональной электроники». 2020. С. 70-71.
Krizhevsky A., Sutskever I., Hinton G. ImageNet Classification with Deep Convolutional Neural Networks // NeurIPS. 2012. Р. 1-9. [Электронный ресурс]. – Rezhim dostupa: https://papers.nips.cc/paper/2012/file/c399862d3b9d6b76c8436e924a68c45b-Paper.pdf, дата обращения 06.09.2022.
Simonyan K., Zisserman A. Very Deep Convolutional Networks for Large-Scale Image Recognition [Электронный ресурс]. – Rezhim dostupa: https://arxiv.org/abs/1409.1556, дата обращения 06.09.2022.
Szegedy C., Liu W., Jia Y., Sermanet P., Reed S., Anguelov D., Erhan D., Vanhoucke V., Rabinovich A. Going Deeper with Convolutions [Электронный ресурс]. – Rezhim dostupa: https://arxiv.org/abs/1409.4842, дата обращения 06.09.2022.
Chollet F. Xception: Deep Learning with Depthwise Separable Convolutions [Электронный ресурс]. – Rezhim dostupa: https://arxiv.org/abs/1610.02357, дата обращения 06.09.2022.
He K., Zhang X., Ren S., Sun J. Deep Residual Learning for Image Recognition [Электронный ресурс]. – Rezhim dostupa: https://arxiv.org/abs/1512.03385, дата обращения 07.09.2022.
Buslaev A., Iglovikov V., Khvedchenya E., Parinov A., Druzhinin M., Kalinin A. Albumentations: Fast and Flexible Image Augmentations // Information. 2020. V. 11. № 125. DOI: 10.3390/info11020125.
Крашенинников В.Р., Субботин А.Ю. Дважды стохастические модели цилиндрических изображений // Радиотехника. 2018. Т. 82. № 6. С. 5-8.

Дата поступления: 18.08.2022

Одобрена после рецензирования: 01.09.2022

Принята к публикации: 22.09.2022