ОРИГИНАЛЬНОЕ ИССЛЕДОВАНИЕ

Прогнозирование исходов программ экстракорпорального оплодотворения с использованием модели машинного обучения «Случайный лес»

Г. М. Владимирский1, М. А. Журавлева1, А. Э. Дашиева2, И. Е. Корнеева2, Т. А. Назаренко2
Информация об авторах

1 Национальный исследовательский университет «Высшая школа экономики», Москва, Россия

2 Национальный медицинский исследовательский центр акушерства, гинекологии и перинатологии имени В. И. Кулакова, Москва, Россия

Для корреспонденции: Аюна Эрдэмовна Дашиева
ул. Академика Опарина, д. 4Б, г. Москва, 117198, Россия, ur.liam@aveihsad.rd

Информация о статье

Вклад авторов: Г. М. Владимирский — обучение прогностических моделей, анализ литературы, выбор методов исследования; М. А. Журавлева — предобработка и анализ данных, анализ литературы, написание рукописи; А. Э. Дашиева — обработка исходного материала, анализ результатов; И. Е. Корнеева, Т. А. Назаренко — разработка анкеты для базы данных, редактирование рукописи.

Статья получена: 24.11.2023 Статья принята к печати: 19.12.2023 Опубликовано online: 31.12.2023
|
Рис. 1. Географический охват исследования
Рис. 2. График среднего ROC-AUC на кросс-валидации при элиминации признаков. На графике отмечена точка с максимальным ROC-AUC, а также среднеквадратичное отклонение ROC-AUC в кросс-валидации
Рис. 3. Важность Джини для 33 лучших признаков, полученная при обучении «Случайного леса» на 220 признаках
Рис. 4. Диаграмма, отражающая значения SHAP для 20 самых важных, в соответствии с методом SHAP, признаков. Положительный класс означает успех ЭКО, а отрицательный — неудачу процедуры
Таблица. Результаты пятикратной кросс-валидации модели «Случайного леса» для отдельных диагнозов бесплодия при подборе гиперпараметров методом GridSearch