В.В. Петров1
1 Казанский федеральный университет (г. Казань, Россия)
1 valeryvpetrov.itis@gmail.com
Постановка задачи. В коллекциях мобильных приложений встречаются функционально близкие и производные экземпляры Android-приложений (версии, модифицированные копии, приложения с внедрённым кодом). Требуется метод, который по APK целевого приложения автоматически находит в коллекции наиболее схожие приложения и вычисляет численную меру сходства, устойчивую к обфускации кода.
Цель. Разработать подход и прототип системы численной оценки сходства Android-приложений на основе статического анализа APK с масштабируемым предварительным отбором кандидатов.
Результаты. Предложен двухэтапный конвейер формирования рекомендаций: 1) предварительный отбор кандидатов по компактным хэш‑отпечаткам (MinHash/SimHash) и индексам приближённого поиска; 2) уточняющее сравнение по признакам на уровне функций и структурным признакам приложения с нормализацией итоговой оценки. Описаны признаки сравнения и меры сходства.
Практическая значимость. Данный подход можно применять для контроля качества (поиск дубликатов и версий), анализа безопасности (выявление внедрения стороннего кода), а также для построения инструментов семантического поиска и рекомендаций по репозиториям приложений.
Петров В.В. Двухэтапная система рекомендаций и численной оценки сходства Android-приложений по статическим признакам // Системы высокой доступности. 2026. Т. 22. № 1. С. 61−64. DOI: https://doi.org/10.18127/j20729472-202601-12
- Петров В.В. Система автоматизации численной оценки сходства Android-приложений // Электронные библиотеки. 2024. DOI: https://doi.org/10.26907/1562-5419-2024-27-3-336-365
- Li L. et al. Understanding Android App Piggybacking: A Systematic Study of Malicious Code Grafting. IEEE TIFS. 2017. DOI: https://doi.org/10.1109/TIFS.2017.2656460
- Piggybacking dataset repository (SerVal, Univ. of Luxembourg). GitHub. URL: https://github.com/serval-snt-uni-lu/Piggybacking
- RePack: repository of repackaged Android app pairs (SerVal, Univ. of Luxembourg). GitHub. URL: https://github.com/serval-snt-uni-lu/RePack
- Allix K. et al. AndroZoo: Collecting Millions of Android Apps for the Research Community. ACM MSR. 2016. DOI: https://doi.org/10.1145/2901739.2903508
- Broder A.Z. On the Resemblance and Containment of Documents. Compression and Complexity of Sequences. 1997. URL: https://www.cs.princeton.edu/courses/archive/spring13/cos598C/broder97resemblance.pdf
- Charikar M.S. Similarity Estimation Techniques from Rounding Algorithms. STOC. 2002. DOI: https://doi.org/10.1145/ 509907.509965
- Manku G.S. et al. Detecting Near-Duplicates for Web Crawling. WWW 2007. DOI: https://doi.org/10.1145/1242572.1242592
- Zhang Y. et al. Detecting Third-Party Libraries in Android Applications with High Precision and Recall. IEEE SANER. 2018. DOI: https://doi.org/10.1109/SANER.2018.8330204
- Huang J. et al. Scalably Detecting Third-Party Android Libraries With Two-Stage Bloom Filtering. IEEE Transactions on Software Engineering. 2023. DOI: https://doi.org/10.1109/TSE.2022.3215628
- The Drebin Dataset. URL: https://drebin.mlsec.org/
- Elizarov A.M. et al. Digital Ecosystem OntoMath as an Approach to Building the Space of Mathematical Knowledge. Russian Digital Libraries Journal. 2023. DOI: https://doi.org/10.26907/1562-5419-2023-26-2-154-202

