Применение генеративных моделей изображений для аугментирования данных обучения детектора лиц

350 руб

Журнал «Нейрокомпьютеры: разработка, применение» №5 за 2023 г.

Статья в номере:

Тип статьи: научная статья

DOI: https://doi.org/10.18127/j19998554-202305-02

УДК: 004.9

Ключевые слова: Обнаружение лиц распознавание лиц генеративные модели GAN аугментация представление изображений метод Виолы-Джонса детектор YuNet MTCNN

Авторы:

Н.А. Андриянов1, Я.В. Куличенко2

1,2 Финансовый университет при Правительстве РФ (Москва, Россия)

Аннотация:

Постановка проблемы. В настоящее время растет интерес к различным решениям задачи обнаружения и распознавания лиц. С одной стороны, исследователи стремятся сделать алгоритмы все более точными, с другой, – более быстрыми. Вместе с тем уровень развития генеративных моделей в последнее время достиг того, что компьютеры способны генерировать изображения, которые практически невозможно отличить от реальных. Однако при обучении идентификаторов лиц возникают сложности в правовой сфере.

Цель. Оценить возможность применения генеративно-состязательных нейронных сетей для аугментирования данных и повышения качества обнаружения и распознавания лиц.

Результаты. Продемонстрированы возможности применения алгоритмов обработки биометрической информации на основе синтетических данных. Представлены варианты имитируемых изображений лиц человека. Предложено применение генера-тивно-состязательных сетей для повышения качества обнаружения и распознавания лиц. Проведено сравнение трех комплексных алгоритмов: модели многозадачной сверточной нейронной сети MTCNN, метода Виолы-Джонса и оптимизированной сверточной нейронной сети YuNet. Последняя показала лучшие результаты по точности.

Практическая значимость. Разработанные подходы к генерации изображений лиц позволят совершенствовать и модифицировать решения в области систем идентификации лиц, обнаружения лиц, выделения ключевых точек. Все это имеет не только потенциальную научную новизну, но и высокую практическую значимость для систем контроля и управления доступом.

Страницы: 7-15

Для цитирования

Андриянов Н.А., Куличенко Я.В. Применение генеративных моделей изображений для аугментирования данных обучения детектора лиц // Нейрокомпьютеры: разработка, применение. 2023. T. 25. № 5. С. 7-15. DOI: https://doi.org/10.18127/j19998554-202305-02

Список источников

Andriyanov N.A., Dementev V.E., Vasiliev K.K., Tashlinskiy A.G. Investigation of Methods for Increasing the Efficiency of Convolutional Neural Networks in Identifying Tennis Players // Pattern Recognition and Image Analysis. 2021. V. 31. № 3. P. 496–505. DOI 10.1134/S1054661821030032.
Sanchez-Moreno A.S., Olivares-Mercado J., Hernandez-Suarez A., Toscano-Medina K., Sanchez-Perez G., Benitez-Garcia G. Efficient Face Recognition System for Operating in Unconstrained Environments // Journal of imaging. 2021. V. 7. № 9. P. 161. DOI 10.3390/jimaging7090161.
Kortli Y., Jridi M., Al Falou A., Atri M. Face Recognition Systems: A Survey // Sensors. 2020. V. 20. № 2. P. 342. DOI 10.3390/s20020342.
Абдулаев А.Б., Власов А.И., Фатхутдинов Т.М. Автоматизированная нейросетевая система анализа эмоционального состояния человека-оператора // Нейрокомпьютеры: разработка, применение. 2023. T. 25. № 2. С. 41–57. DOI: 10.18127/ j19998554-202302-04
Андриянов Н.А. Дважды стохастические авторегрессионные модели изображений: дис. … канд. техн. наук. Ульяновский государственный университет. Ульяновск. 2017. 183 c.
Васильев К.К., Дементьев В.Е., Андриянов Н.А. Анализ эффективности оценивания изменяющихся параметров дважды стохастической модели // Радиотехника. 2015. № 6. С. 12–15.
Buslaev A., Iglovikov V.I., Khvedchenya E., Parinov A., Druzhinin M., Kalinin A.A. Albumentations: Fast and Flexible Image Augmentations // Information. 2020. V. 11. P. 125. DOI 10.3390/info11020125.
Andriyanov N.A., Andriyanov D.A. The using of data augmentation in machine learning in image processing tasks in the face of data scarcity // Journal of Physics: Conference Series. 2020. V. 1661. P. 012018. DOI 10.1088/1742-6596/1661/1/012018.
Toma R.N., Piltan F., Kim J.-M. A Deep Autoencoder-Based Convolution Neural Network Framework for Bearing Fault Classification in Induction Motors // Sensors 2021. V. 21. № 24. P. 8453. DOI 10.3390/s21248453.
Kingma D.P., Welling M. An Introduction to Variational Autoencoders // ArXiv. 2019. DOI 10.1561/2200000056.
Goodfellow I., Pouget-Abadie J., Mirza M., Xu B., Warde-Farley D., Ozair S., Courville A., Bengio Y. Generative Adversarial Networks // ArXiv. DOI 10.48550/arXiv.1406.2661
Ахмад А., Андриянов Н.А., Соловьев В.И., Соломатин Д.А. Применение глубокого обучения для аугментации и генерации подводного набора данных с промышленными объектами // Вестник Южно-Уральского государственного университета. Серия: Компьютерные технологии, управление, радиоэлектроника. 2023. Т. 23. № 2. С. 5–16.
Labelled Faces in the Wild (LFW) Dataset. [Электронный ресурс] – Режим доступа: https://www.kaggle.com/data-sets/jessicali9530/lfw-dataset, дата обращения 15.06.2023.
Xiang J., Zhu G. Joint Face Detection and Facial Expression Recognition with MTCNN // 4th International Conference on Information Science and Control Engineering. Changsha, China. 2017. P. 424–427. DOI 10.1109/ICISCE.2017.95.
Wu W., Peng H., Yu S. YuNet: A Tiny Millisecond-level Face Detector // Machine Intelligence Research. 2023. DOI 10.1007/ s11633-023-1423-y.

Дата поступления: 18.05.2023

Одобрена после рецензирования: 05.06.2023

Принята к публикации: 01.08.2023