В.А. Павлов1, А.А. Белов2
1,2 Санкт-Петербургский политехнический университет Петра Великого (Санкт-Петербург, Россия)
1 pavlov_va@spbstu.ru; 2 belov@spbstu.ru
Постановка проблемы. В настоящее время нейросетевые методы - основной инструмент в задачах обнаружения объектов на изображениях, эффективность и точность которого зависит от наличия большого объема аннотированных данных, необходимых для обучения моделей. Это требование создает значительные трудности в тех областях, где получение таких данных ограничено или труднодоступно. Для оптических изображений существует множество аннотированных наборов данных, что позволяет обучать и совершенствовать нейронные сети для решения различных задач компьютерного зрения. В области радиолокационных изображений (РЛИ) существующих наборов аннотированных данных гораздо меньше, что существенно ограничивает возможности обучения и применения нейросетевых моделей. Несмотря на то, что оптические и радиолокационные изображения имеют принципиально разную физическую природу, при достаточно высоких пространственных разрешениях (порядка 1 м и выше) изображения объектов на оптических и радиолокационных снимках начинают проявлять структурное сходство в размерах, форме контура, взаимном расположении и ориентации углов. Такое структурное сходство позволяет использовать оптические изображения в обучении нейронных сетей, предназначенных для работы с радиолокационными данными.
Цель. Провести исследование возможности применения нейронных сетей, обученных на оптических изображениях, для обнаружения малоразмерных объектов на РЛИ, а также оценить эффективность нейросетевых фильтров, используемых для подавления спекл-шума, в сравнении с традиционными фильтрами.
Результаты. Исследована задача автоматического обнаружения малоразмерных объектов на РЛИ высокого разрешения с помощью нейронной сети, обученной с использованием оптических изображений аналогичных объектов, переведенных в оттенки серого. Показано, что при использовании такого подхода может быть достигнуто хорошее качество обнаружения (число ложных обнаружений - примерно 18%), несмотря на существенные различия в физических принципах формирования радиолокационных и оптических изображений. Установлено, что фильтры шумоподавления на основе нейронных сетей обеспечивают бо́льший выигрыш по сравнению с традиционными фильтрами. Показано, что нейросетевой детектор, обученный только на оптических изображениях, можно использовать для автоматизации аннотирования РЛИ и подготовки обучающих наборов данных. Аналогично можно сделать и вывод о том, что оптические изображения также могут использоваться для дополнения (аугментации) наборов РЛИ во время обучения.
Практическая значимость. Представленные результаты показали, что использование оптических изображений для обучения нейронных сетей может значительно расширить возможности автоматизированного обнаружения объектов на РЛИ, что открывает новые перспективы использования методов компьютерного зрения в условиях ограниченного объема аннотированных данных и подтверждает актуальность разработки эффективных методов предварительной обработки изображений для улучшения качества обнаружения.
Павлов В.А., Белов А.А. Использование оптических изображений в обучении нейронных сетей, обрабатывающих радио-локационные изображения // Радиотехника. 2025. Т. 89. № 3. С. 98−108. DOI: https://doi.org/10.18127/j00338486-202503-09
- https://www.iceye.com/.
- Виноградова Н.С., Доросинский Л.Г. Распознавание радиолокационных изображений, формируемых радиолокационными системами с синтезированной апертурой // Ural Radio Engineering Journal. 2021. Т. 5. № 3. C. 258–271.
- Pavlov V.A., Belov A.A., Tuzova A.A. Implementation of synthetic aperture radar processing algorithms on the Jetson TX1 platform // 2019 IEEE International Conference on Electrical Engineering and Photonics (EExPolytech). St. Petersburg. Russia. 2019. Р. 90-93.
- Pavlov V.A., Belov A.A., Tuzova A.A. Investigation of the influence of speckle noise on the accuracy of object detection by convolutional neural networks // 2021 International Conference on Electrical Engineering and Photonics (EExPolytech). St. Petersburg, Russian Federation. 2021. Р. 47–50.
- Pavlov V.A., Belov A.A., Volvenko S.V., Rashich A.V. Application of convolutional neural networks trained on optical images for object detection in radar images // Computer Optics. 2024. V. 48. № 2. P. 253–259.
- Zhang L., Yin H. Research on ship detection method of optical remote sensing image based on deep learning // 2022 International Conference on Sensing, Measurement Data Analytics in the era of Artificial Intelligence (ICSMD). 2022. P. 1–6.
- Xie G., Li J., Xiao F., Li T. Optical remote sensing image ship detection method for improving EfficientDet // 2021 IEEE 3rd International Conference on Frontiers Technology of Information and Computer (ICFTIC). 2021. P. 340–343.
- Qin C., Wang X., Li G., He Y. An improved attention-guided network for arbitrary-oriented ship detection in optical remote sensing images // IEEE Geoscience and Remote Sensing Letters. 2022. V. 19. P. 1–5.
- Zhuang Y., Liu Y., Zhang T., Chen H. Contour modeling arbitrary-oriented ship detection from very high-resolution optical remote sensing imagery // IEEE Geoscience and Remote Sensing Letters. 2023. V. 20. P. 1–5.
- Jianxin G., Zhen W., Shanwen Z. Multi-scale ship detection in SAR images based on multiple attention cascade convolutional neural networks // 2020 International Conference on Virtual Reality and Intelligent Systems (ICVRIS). 2020. P. 438–441.
- Hou Z., Cui Z., Cao Z., Liu N. An integrated method of ship detection and recognition in sar images based on deep learning // 2020 IEEE International Geoscience and Remote Sensing Symposium. 2020. P. 1225–1228.
- Zhao X., Zhang B., Tian Z., Xu C., Wu F., Sun C. An anchor-free method for arbitrary-oriented ship detection in SAR images // 2021 SAR in Big Data Era (BIGSARDATA). 2021. P. 1–4.
- Fu X., Wang Z. Fast ship detection method for SAR images in the inshore region // 2021 IEEE International Geoscience and Remote Sensing Symposium IGARSS. 2021. P. 3569–3572.
- Wang X., Zhou H., Chen Z., Bai J., Ren J., Shi J. Few-shot SAR ship image detection using two-stage cross-domain transfer learning // IGARSS 2022 - 2022 IEEE International Geoscience and Remote Sensing Symposium. 2022. P. 2195–2198,
- Wang C., Bochkovskiy A., Liao H. YOLOv7: Trainable bag-of-freebies sets new state-of-the-art for real-time object detectors // 2023 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR). 2023. P. 7464–7475.
- Liu L., Ouyang W., Wang X., et al. Deep Learning for Generic Object Detection: A Survey // Int. J. Comput. Vis. 2020. № 128.
P. 261–318. - Wei S., Zeng X., Qu Q., Wang M., Su H., Shi J. HRSID: A high-resolution SAR images dataset for ship detection and instance segmentation // IEEE Access. 2020. V. 8. P. 120234–120254.
- Wang Z., Bovik A.C., Sheikh H.R., Simoncelli E.P. Image quality assessment: from error visibility to structural similarity // IEEE Transactions on Image Processing. 2004. V. 13. № 4. P. 600-612.
- Xue W., Zhang L., Mou X., Bovik A.C. Gradient Magnitude Similarity Deviation: A Highly Efficient Perceptual Image Quality Index // IEEE Transactions on Image Processing. 2014. V. 23. № 2. P. 684-695.
- Pavlov V.А., Belov A.А., Nguen V.T., Jovanovski N., Ovsyannikova A.S. Comparison of neural networks for suppression of multiplicative noise in images // Computer Optics. 2024. V. 48. №. 3. P. 425‒431.
- Gonzalez R.C., Woods R.E. Digital image processing. upper saddle river // New Jersey: Pearson Education, Inc. 2008.
- Lee J.S. Digital image enhancement and noise filtering by using local statistics // IEEE Transactions on Pattern Analysis and Machine Intelligence. 1980. V. PAMI-2. № 2. P. 165–168.
- Frost V.S., Stiles J.A., Shanmugan K.S., Holtzman J.C. A model for radar images and its application to adaptive digital filtering of multiplicative noise // IEEE Transactions on Pattern Analysis and Machine Intelligence. 1982. V. 4. № 2. P. 157–166.
- Perona P., Malik J. Scale-space and edge detection using anisotropic diffusion // IEEE Transactions on Pattern Analysis and Machine Intelligence. 1990. V. 12. № 7. P. 629–639.

