Статья размещена в открытом доступе и распространяется на условиях лицензии Creative Commons Attribution (CC BY).
ОРИГИНАЛЬНОЕ ИССЛЕДОВАНИЕ
Прогнозирование исходов программ экстракорпорального оплодотворения с использованием модели машинного обучения «Случайный лес»
1 Национальный исследовательский университет «Высшая школа экономики», Москва, Россия
2 Национальный медицинский исследовательский центр акушерства, гинекологии и перинатологии имени В. И. Кулакова, Москва, Россия
Для корреспонденции: Аюна Эрдэмовна Дашиева
ул. Академика Опарина, д. 4Б, г. Москва, 117198, Россия, ur.liam@aveihsad.rd
Вклад авторов: Г. М. Владимирский — обучение прогностических моделей, анализ литературы, выбор методов исследования; М. А. Журавлева — предобработка и анализ данных, анализ литературы, написание рукописи; А. Э. Дашиева — обработка исходного материала, анализ результатов; И. Е. Корнеева, Т. А. Назаренко — разработка анкеты для базы данных, редактирование рукописи.
Программы экстракорпорального оплодотворения (ЭКО) с переносом эмбрионов в настоящее время являются основными методами лечения всех форм бесплодия, однако успешные случаи, заканчивающиеся наступлением беременности, по-прежнему составляют лишь треть из числа всех проведенных циклов. Для оценки результатов лечения бесплодия методом ЭКО необходимо учитывать множество показателей и изучать взаимосвязь между ними. За последние десятилетия был разработан ряд моделей прогнозирования ЭКО для оценки индивидуальных результатов лечения, но лишь немногие из них оказались клинически значимыми, из-за их плохой прогностической способности. Целью исследования было создать нелинейные модели прогнозирования исходов ЭКО и выявить наиболее значимые факторы, влияющие на результат лечения. На основе базы данных, содержащей информацию по более чем 700 показателям 7004 женщин в возрасте от 18 лет до 45 лет, прошедших лечение в программе ЭКО на территории Российской Федерации с 2010 по 2020 г., была обучена модель «Случайного леса», прогнозирующая беременность в цикле ЭКО с ROC-AUC = 0,69. Описаны 20 самых успешных предикторов полученной модели с интерпретацией их вклада в прогнозирование. Из них индекс массы тела (ИМТ), число полученных и оплодотворившихся ооцитов описаны в научной литературе как предикторы исхода программ ЭКО, в то время как другие признаки, например анамнестические данные, количество и исходы предыдущих программ ЭКО, а также сывороточная концентрация АМГ, редко фигурируют в зарубежных прогностических моделях.
Ключевые слова: прогностическая модель, ЭКО, бесплодие, «Случайный лес»