Д.С. Рипка1, Е.А. Семенова2
1,2 Санкт-Петербургский государственный электротехнический университет «ЛЭТИ» им. В.И. Ульянова (Ленина) (Санкт-Петербург, Россия)
1 dar.stkr@gmail.com, 2easemenova@etu.ru
Постановка проблемы. Прогнозирование эффективности вспомогательных репродуктивных технологий (ВРТ) осложнено ограниченностью клинических выборок, высокой размерностью пространства диагностических признаков и низкой интерпретируемостью моделей машинного обучения, что затрудняет их внедрение в клиническую практику. Существующие статистические и данные ориентированные подходы не позволяют в полной мере формализовать и использовать экспертные знания врачей-репродуктологов, накопленные за десятилетия практической работы.
Цель. Разработать методологию гибридного взвешивания диагностически значимых показателей на основе количественного экспертного консенсуса с построением интерпретируемого дерева решений для прогнозирования эффективности ВРТ.
Результаты. Проведено научное обоснование гибридного подхода к взвешиванию диагностически значимых показателей. На основании опроса экспертов и двухэтапной фильтрации выбросов (IQR + модифицированный Z-метод) получены нормализованные веса для 43 диагностических показателей. Отмечено, что показатели с высоким экспертным консенсусом (коэффициент вариации <10%), такие как врачебные ошибки и уровень овуляции, получили максимальные веса (0,97–0,98). Построена аддитивная прогностическая модель дерева решений с логистической калибровкой, позволяющая преобразовывать диагностические данные в калиброванную вероятность успешного исхода ВРТ. Установлено, что модель обеспечивает монотонное увеличение точности прогноза от 55% (при отсутствии данных) до 100% (при полном наборе признаков).
Практическая значимость. Предложенная методология применима в системах поддержки принятия врачебных решений, даже при малых клинических выборках, так как веса признаков определяются априорно экспертами и не требуют обучения на больших массивах данных. Интерпретируемая структура дерева решений позволяет врачу отслеживать вклад каждого диагностического показателя в итоговый прогноз, что повышает доверие к рекомендациям системы и способствует персонализированному ведению пациентов в программах ВРТ.
Рипка Д.С., Семенова Е.А. Гибридная экспертная модель прогнозирования исходов ВРТ на основе взвешенного дерева решений и логистической калибровки // Биомедицинская радиоэлектроника. 2026. T. 29. № 3. С. 119−124. DOI: https:// doi.org/ 10.18127/j156 04136-202603-21
- Bruckamp L., Lazzari E. Shifting the reproductive window: The contribution of ART and egg donation to fertility rates in the UK. Popul Stud (Camb). 2025. Oct 27. P. 1–13. DOI: 10.1080/00324728.2025.2561595.
- Shanti S. Gupta. Percentage Points and Modes of Order Statistics from the Normal Distribution. The Annals of Mathematical Statistics. Sep., 1961. V. 32. № 3. P. 888–893.
- Christophe Leys et al. Detecting outliers: Do not use standard deviation around the mean, use absolute deviation around the median. Journal of Experimental Social Psychology. 2013. V. 49, Is. 4. P. 764–766. https://doi.org/10.1016/j.jesp.2013.03.013.
- Kerrigan D., Hullman J., Bertini E. A Survey of Domain Knowledge Elicitation in Applied Machine Learning. Multimodal Technologies and Interaction. 2021. V. 5(12). P. 73. https://doi.org/10.3390/mti5120073.
- Sarker I.H., Kayes A.S.M. Watters P. Effectiveness analysis of machine learning classification models for predicting personalized context-aware smartphone usage. J. Big Data. 2019. V. 6. P. 57. https://doi.org/10.1186/s40537-019-0219-y.
- Topol E.J. High-performance medicine: the convergence of human and artificial intelligence. Nat Med 25. 2019. P. 44–56. https://doi.org/10.1038/s41591-018-0300-7.
- Semenova E., Ripka D. Formation of a Complex of Diagnostically Significant Indicators for Predicting the Outcomes of Assisted Reproductive Technologies and Pregnancy Pathologies. STDH. 2025. P. 294–296. 10.1109/STDH66836.2025.11227529.

