О. И. Шелухин – д.т.н., профессор, зав. кафедрой «Информационная безопасность», Московский технический университет связи и информатики
E-mail: sheluhin@mail.ru
С. Д. Ерохин – к.т.н., доцент, ректор Московского технического университета связи и информатики
В. В. Барков – ассистент, кафедра «Информационная безопасность», Московский технический университет связи и информатики
Для автоматизации процесса исследования алгоритмов классификации трафика мобильных приложений разработан программный комплекс, позволяющий в автоматическом режиме собирать с мобильных устройств пакеты сетевого трафика и сохранять их в базу данных; группировать пакеты сетевого трафика в потоки; по запросу пользователя формировать наборы данных с заданными характеристиками (количество потоков конкретного приложения; наличие фонового трафика; формирование набора данных на основе уже созданного набора с добавлением новых потоков, исключая повторения). Описаны проектирование и программная реализация базы данных трафика мобильных приложений, являющейся составной частью экспертно-аналитической системы «Система анализа трафика». Рассмотрены этапы проектирования базы данных, включая концептуальный, логический и физический. Приведено описание таблиц, их связей.
Спроектирована, реализована и наполнена база данных. В ходе инфологического и даталогического проектирования выделено 21 сущность, 6 из которых (apps, flows, flowsinset, flowsets, packets, backgroundflows) используются для непосредственного хранения данных трафика. В ходе физического проектирования выбран сервер баз данных MySQL 5.7 и создана 21 таблица.
Для доступа к базе данных с применением технологии Java Enterprise Edition создано корпоративное приложение, предоставляющее доступ с помощью REST API. Для сбора трафика с мобильных устройств под управлением операционной системы Android разработано приложение, которое с помощью прикладного программного интерфейса для создания виртуальных частных сетей, собирает пакеты сетевого трафика, идентифицирует приложение-источник и отправляет их по протоколу HTTP серверному программному обеспечению.
С использованием клиентского и серверного программного обеспечения созданная база данных была наполнена трафиком 18 основных приложений. В ходе сбора данных получено 71667 потоков и 6989991 пакетов.
- Шелухин О.И., Ерохин С.Д., Ванюшина А.В. Классификация IP-трафика методами машинного обучения / Под ред. О.И. Шелухина. М.: Горячая линия – Телеком. 2018.
- Шелухин О.И., Барков В.В. Разработка инфраструктуры для классификации сетевого трафика мобильных приложений с применением алгоритмов машинного обучения // Труды междунар. НТК «Телекоммуникационные и вычислительные системы – 2017». М.: Горячая линия – Телеком. 2017. С. 180.
- Шелухин О.И., Барков В.В. Методы сбора сетевого трафика с мобильных устройств под управлением операционной системы android с целью классификации по типам приложений // Сб. трудов XII Междунар. науч.-технич. конф. «Технологии информационного общества». Москва, МТУСИ, 14–15 марта 2018 г. В 2-х томах. Т. 2. М.: ИД «Медиа Паблишер». 2018.
- Ерохин С.Д., Ванюшина А.В. Влияние фонового трафика на эффективность классификации приложений методами машинного обучения // T-Comm: Телекоммуникации и транспорт. 2017. Т. 11. № 12. С. 31–36.
- Щербакова Н.Г. Анализ IP-трафика методами Data Mining // Проблемы информатики. 2012. № 4. С. 30–46.
- Jamuna A., Vinodh Ewards S.E. Efficient flow based network traffic classification using machine learning // International Journal of Engineering Research and Applications (IJERA). 2013. V. 3. № 2. P. 1324–1328.
- Park B.C., Win Y.J., Kim M.S., Hong J.W. Towards automated application signature generation for traffic identification // NOMS: Network operations and management symposium. Salvador, Bahia, Brazil, 7–11 April 2008. P. 160–167.
- Soysal M., Schmidt E. Machine learning algorithms for accurate flow-based network traffic classification: Evaluation and comparison // Performance Evaluation. 2010. V. 67. № 6. P. 451–467.
- Nguyen T., Armitage G. A survey of techniques for Internet traffic classification using machine learning // IEEE Communications Surveys and Tutorials. 2008. V. 11. № 3. P. 37–52.
- Коматинэни С., Маклин Д., Хэшими С. Google Android: программирование для мобильных устройств Pro Android 2. Изд. 1-е. СПб.: Питер. 2011.
- Советов Б.Я., Цехановский В.В., Чертовский В.Д. Базы данных: теория и практика. М.: Высшая школа. 2005.
- Карпова И.П. Базы данных. Курс лекций и материалы для практических занятий. Учеб. пособие. СПб.: Питер. 2013.