Разработка подхода к классификации дефолта заемщика на основе метода обучения отдельных классификаторов для разных кластеров данных

500 руб

Журнал «Нелинейный мир» №2 за 2026 г.

Статья в номере:

Тип статьи: научная статья

DOI: https://doi.org/10.18127/j20700970-202602-07

УДК: 004.89

Ключевые слова: Метод прогнозирования дефолта заемщика обучение отдельных классификаторов для кластеров данных kMeans

Авторы:

А.Ф. Константинов1, Л.П. Дьяконова2

1,2 Российский экономический университет имени Г.В. Плеханова (Москва, Россия)
1 konstantinovaf@gmail.com, 2 Dyakonova.LP@rea.ru

Аннотация:

Постановка проблемы. При выдаче кредитов розничным заемщикам банки на основании данных из заявки на выдачу кредита, внешних скорингов и истории взаимодействия с заемщиков и др. прогнозируют вероятность дефолта заемщика. С учетом подхода на основе внутренних рейтингов (ПВР) банки обязаны резервировать денежные средства, исходя из прогнозной вероятности дефолтности портфеля кредитов для поддержания своей устойчивости. В данной статье предложен гибридный метод прогнозирования дефолта заемщика, при котором происходит обучение отдельных классификаторов для кластеров данных, полученных с помощью метода кластеризации kMeans. Этот метод является частью исследований в рамках разработки интегрального метода прогнозирования дефолта заемщиков, включающих в себя дополнительно методы корректировки дисбаланса классов, методы выделения аномалий в отдельную модель, методы баггинга и методы дополнительной оптимизации при обучении.

Цель. Провести анализ работы метода кластеризации с последующей классификацией дефолта заемщиков, предложить способ включения в интегральный метод прогнозирования дефолта заемщика метода кластеризации с последующей классификацией дефолта заемщиков.

Результаты. Предложен метод кластеризации, обеспечивший значительный рост показателей качества (рост средней точности на 0,139, рост f1-score на 0,221, рост точности на 0,392) относительно базовой модели без разделения данных для обучения на кластеры.

Практическая значимость. Результаты исследования можно использовать для снижения доли дефолтов заемщиков, уменьшения объема зарезервированных средств банками и ускорения разработки качественных моделей машинного обучения. Также результаты исследования рекомендуется включать в программы обучения студентов, связанные с искусственным интеллектом и машинным обучением, с уклоном на финансовые данные.

Страницы: 58-68

Для цитирования

Константинов А.Ф., Дьяконова Л.П. Разработка подхода к классификации дефолта заемщика на основе метода обучения отдельных классификаторов для разных кластеров данных // Нелинейный мир. 2026. Т. 24. № 2. С. 58–68. DOI: https://doi.org/10.18127/j20700970-202602-07

Список источников

Information and analytical material “Financial Stability Review for Q4 2024 – Q1 2025” of the Bank of Russia. [Online]. Available: https://cbr.ru/collection/collection/file/55878/4q_2024_1q_2025.pdf access data 18.01.2026.
Litova E. How banks use artificial intelligence in business services. [Online] Available: https://www.vedomosti.ru/kapital/trends/articles/2024/04/14/1031785-kak-banki-ispolzuyut-iskusstvennii-intellekt-v-obsluzhivanii-biznesa access data 18.01.2026.
Smirnov E. Scoring in Seconds: How Neural Networks Changed Loan Issuance. [Online] Available: https://trends.rbc.ru/trends/industry/cmrm/644942449a7947981d14f327 access data 18.01.2026.
Gazprombank processes loan applications using artificial intelligence. [Online] Available: https://www.nvi-solutions.ru/all-projects/gazprombank/ (дата обращения: 28.09.2025).
Silva E. C. E., Lopes C., Correia A., Faria S. A logistic regression model for consumer default risk // Journal of Applied Statistics. 2020. V. 47(13-15). P. 1–17.
Lin J. Research on loan default prediction based on logistic regression, randomforest, xgboost and adaboost // SHS Web of Conferences. 2024. V. 181. P. 02008.
Rao H., Wei C. Credit Default Probability Prediction Model Based on XGBoost Algorithm // Academic Journal of Computing & Information Science 2616-5775. V. 7. Is. 10. P. 60–66.
Tsai C.-F. Combining cluster analysis with classifier ensembles to predict financial distress // Information Fusion. 2014.
V. 16. P. 46–58.
Kohonen T. The self-organizing map // Тhe IEEE. 1990. V. 78. Is. 9. P. 1464–1480.
Yuan K., Chi G., Zhou Y., Yin H. A novel two-stage hybrid default prediction model with k-means clustering and support vector domain description // Research in International Business and Finance. 2022. V. 59. P. 101536.
Gavrilov V.S. Development of a bundled software and machine learning models to automate analysis of news streams in the financial industry // Nonlinear World journal 2025. V. 23.3. P. 6–14.
Ribeiro M. T., Singh S., Guestrin C. Why Should I Trust You?: Explaining the Predictions of Any Classifier. Available: https://arxiv.org/abs/1602.04938 (дата обращения 28.09.2025).
Dyakonova L., Konstantinov A. Approaches to risk analysis in the financial sector based on machine learning and artificial intelligence methods / MPRA Paper. [Online] Available: https://mpra.ub.uni-muenchen.de/122941/ (дата обращения: 28.09.2025).
Константинов А.Ф., Дьяконова Л.П. Сравнительный анализ методов снижения дисбаланса классов при построении моделей машинного обучения в финансовом секторе // Изв. Кабардино-Балкарского научного центра РАН. 2025. Т. 27. № 1. С. 143–151.
Jin X., Han J. K-Means Clustering. Encyclopedia of Machine Learning. Springer. Boston. 2011. P. 563–564.
Ke G., Meng Q., Finley T., Wang T., Chen W., Ma W., Ye Q., Liu T.-Y. LightGBM: A Highly Efficient Gradient Boosting Decision Tree. Advances in Neural Information Processing Systems. 2017. P. 3146–3154.

Дата поступления: 04.02.2026

Одобрена после рецензирования: 26.02.2026

Принята к публикации: 03.04.2026