О.И. Гаранин – аспирант, Национальный исследовательский университет «МЭИ» (Москва)
E-mail: hedgehog91@mail.ru
Выполнен анализ многомасштабной модели детектирования визуальных объектов в сверточной нейронной сети, обеспечивающей компромисс между точностью и скоростью их детектирования. Предложен способ настройки многомасштабной модели детектирования визуальных объектов в сверточной нейронной сети, который отличается от существующего выбором размеров «якорных» прямоугольников для конкретной обучающей базы с использованием метода кластеризации k-средних и вычислением эмпирического рецептивного поля. Экспериментально доказано, что предложенный способ позволяет повысить точность детектирования визуальных объектов в сверточной нейронной сети.
- Krizhevsky A., Sutskever I., Hinton G. Imagenet classification with deep convolutional neural networks // Proceedings of the Neural Information Processing Systems conference. NIPS. 2012. P. 1–9.
- Sánchez, J., Perronnin, F. High-dimensional signature compression for large-scale image classification // Computer Vision and Pattern Recognition. CVPR.2011. P. 1665–1672.
- Ren S., He K., Girshick R., Sun J. Faster R-CNN: Towards real-time object detection with region proposal networks // Proceedings of the Neural Information Processing Systems conference. NIPS. 2015.
- Redmon J., Divvala S., Girshick R., Farhadi A. You only look once: Unified, real-time object detection // Computer Vision and Pattern Recognition. CVPR. 2016.
- Liu W., Anguelov D., Erhan D., Szegedy C., Reed S. E. SSD: single shot multibox detector // CoRR. 2015.
- Simonyan K., Zisserman A. Very deep convolutional networks for large-scale image recognition // Proceedings of the Neural Information Processing Systems conference. NIPS. 2015.
- Гаранин О.И. Способ выделения эмпирического рецептивного поля сверточной нейронной сети // Нейрокомпьютеры разработка и применение. 2017. № 3.
- Russakovsky O., Deng J., Su H., Krause J., Satheesh S., Ma S., Huang Z., Karpathy A., Khosla A., Bernstein M., Berg A.C., Fei-Fei L. Imagenet large scale visual recognition challenge // IJCV. 2015.
- Everingham M., Van Gool L., Williams C., Winn J., Zisserman A. The pascal visual object classes (voc) challenge // International journal of computer vision.2010. № 88(2). P. 303–338.
- Everingham M., Eslami S. M. A., Van Gool L., Williams C., Winn J., Zisserman A. The Pascal visual object classes challenge: A retrospective // IJCV. 2015. P. 98–136.