
А. А. Южаков – д.т.н., профессор, зав. кафедрой автоматики и телемеханики,Пермский национальный исследовательский политехнический университет
E-mail: uz@at.pstu.ru
А. Н. Кокоулин – к.т.н., доцент, кафедра автоматики и телемеханики, Пермский национальный исследовательский политехнический университет
E-mail: a.n.kokoulin@at.pstu.ru
А. И. Тур – аспирант, ассистент, кафедра автоматики и телемеханики, Пермский национальный исследовательский политехнический университет
Постановка проблемы. Методы распознавания лиц играют важную роль в различных приложениях реального времени, таких как системы видеонаблюдения и идентификации лиц, интеллектуальные камеры и роботы. Вопрос исследования универсального метода распознавания для самых разных лиц, условий освещения, эмоций и поз человека остается актуальным. Главный недостаток традиционного подхода, использующего централизованную схему системы распознавания, заключается в высокой нагрузке на сеть передачи данных и вычислительной нагрузке на центральный сервер обработки: чем больше камер видеонаблюдения обслуживает центральный блок, тем больше на него нагрузка. Но большую часть времени видеопоток не содержит изображений лиц, и вычислительные ресурсы тратятся впустую.
Цель. Разработать и исследовать эффективную распределенную систему распознавания лиц на основе каскада сверточных нейронных сетей.
Результаты. Отмечено, что основным принципом предлагаемой системы распознавания является распределенная иерархическая сеть обработки, использующая парадигму исследования «от грубого к детальному», в которой каждый исходный видеопоток обрабатывается на месте энергоэффективным контроллером (SoC, Edge-компьютер), который обнаруживает наличие фрагментов лиц в видеокадре и выполняет обрезку границы области интереса (ROI), после чего результирующий поток, включая ROI, передается на главный сервер, если обнаружено лицо. Представлены результаты исследования иерархической архитектуры каскада сверточных нейронных сетей в распределенной системе распознавания лиц.
Практическая значимость. По оценкам авторов, потребление трафика снизится на 80–90%. Кроме того, предложенная концепция каскадной схемы CNN системы распознавания лиц может сделать распознавание и идентификацию более точными благодаря мягкому принятию решений.
- Kokoulin А.N., Tur A.I., Yuzhakov A.A. Convolutional neural networks application in plastic waste recognition and sorting // Proceedings of the 2018 IEEE Conference of Russian Young Researchers in Electrical and Electronic Engineering. 2018. P. 1094–1098. DOI: 10.1109/EIConRus.2018.8317281.
- Viola P., Jones M.J., Snow D. Detecting pedestrians using patterns of motion and appearance // The 9th ICCV. Nice, France. 2003. V. 1. P. 734–741.
- Tang J., Deng C., Huang G.B., Zhao B. Compressed-domain ship detection on spaceborne optical image using deep neural network and extreme learning machine // IEEE Transactions on Geoscience and Remote Sensing. 2015. V. 53. P. 1174–1185.
- Su C.Y., Yang J.F. Histogram of gradient phases: A new local descriptor for face recognition // IET Computer Vision. 2014. V. 8. № 6. P. 556–567.
- Ke Y., Sukthankar R. PCA-SIFT: A more distinctive representation for local image descriptors // IEEE Computer Society Conference on Computer Vision and Pattern Recognition. Washington, DC, USA. 2004. P. 66–75.
- Dalal N., Triggs B. Histograms of oriented gradients for human detection // IEEE Computer Society Conference on Computer Vision and Pattern Recognition. San Diego, CA, USA. 2005. V. 1. P. 886–893.
- Lowe D.G. Distinctive image features from scale-invariant keypoints // International Journal of Computer Vision. 2004. V. 60. № 2. P. 91–110.
- Zhang X., Gonnot Th., Saniie J. Real-time face detection and recognition in complex background // Journal of Signal and Information Processing. 2017. V. 8. № 2. P. 99–112.
- Kokoulin A.N. Distributed storage approach in content delivery networks // Proceedings of 13th International Scientific-Technical Conference on Actual Problems of Electronic Instrument Engineering. 2016. P. 479–484. DOI: 10.1109/APEIE.2016.7806398.
- Kulikov A.A., Demkin D.V., Melkov A.E. The analysis of the maximum face compression impact on face recognition result // Science Prospects. 2014. № 3 (54). P. 104–108.
- Kokoulin A.N., Yuzhakov A.A., Kiryanov D.A. Scalable distributed storage for big scientific data // Proceedings of the 2018 IEEE Conference of Russian Young Researchers in Electrical and Electronic Engineering. 2018. P. 1099–1103.
- Kokoulin A. Methods for large image distributed processing and storage // IEEE EuroCon 2013. 2013. P. 1606–1610. DOI: 10.1109/EUROCON.2013.6625191.
- Fleuret F., Gemand D. Coarse-to-fine face detection // International Journal of Computer Vision. 2001. V. 41. № 1–2. P. 85–107.