ОРИГИНАЛЬНОЕ ИССЛЕДОВАНИЕ
Микробиота эякулята: кластерный анализ результатов, полученных при исследовании методом ПЦР-РВ
1 Уральский государственный медицинский университет, Екатеринбург, Россия
2 Медицинский центр «Гармония», Екатеринбург, Россия
3 Уральский федеральный университет имени первого Президента России Б. Н. Ельцина, Екатеринбург, Россия
4 Институт математики и механики имени Н. Н. Красовского Уральского отделения Российской академии наук, Екатеринбург, Россия
5 Ивановская государственная медицинская академия, Иваново, Россия
Для корреспонденции: Екатерина Сергеевна Ворошилина
ул. Фурманова, д. 30, г. Екатеринбург, 620142; moc.liamg@anilihsorov
Соблюдение этических стандартов: исследование одобрено этическим комитетом Уральского государственного медицинского университета (протокол № 7 от 20 сентября 2019 г.). Все участники исследования подписали добровольное информированное согласие на проведение исследования.
Благодарности: авторы благодарят директора медицинского центра «Гармония» (г. Екатеринбург) В. Н. Хаютина за возможность выполнения исследования на базе центра.
Вклад авторов: Е. С. Ворошилина — организация исследования, анализ данных, написание статьи; Д. Л. Зорников — анализ данных, написание статьи; А. В. Иванов — статистическая обработка, анализ данных, написание статьи; Д. Г. Почерников — клиническая характеристика пациентов, сбор клинических данных, анализ данных, написание статьи; Е. А. Паначева — анализ литературы, проведение ПЦР, анализ данных, написание статьи.
В сравнении с микробиотой других биотопов тела человека, микробиота урогенитального тракта (УГТ) мужчин, в том числе семенной жидкости, до сих пор остается недостаточно изученной [1]. Долгое время эякулят у здоровых мужчин считали стерильной жидкостью, а обнаружение микроорганизмов (МО) ассоциировали с наличием патологии. Тем не менее недавние исследования демонстрируют наличие микробиоты в эякуляте, в том числе у пациентов без воспалительной патологии УГТ и с нормальными показателями спермограммы [1–7]. Было показано, что микробиота эякулята может быть представлена полимикробными сообществами из представителей разных родов и даже филумов бактерий [1, 2, 5, 7]. Некоторые авторы делают сдержанные выводы об ассоциации отдельных групп МО с нормой и патологией [1, 2, 5]. Часть исследователей считают, что именно наличие определенных ассоциаций МО, а не отдельных их видов, связано с развитием воспалительной патологии УГТ [4].
Данные результаты были получены благодаря внедрению молекулярно-генетических методов исследования, так как многие обнаруживаемые в эякуляте МО являются трудно- или некультивируемыми (в том числе облигатно анаэробные бактерии, редко выявляемые при рутинном культуральном исследовании) [4, 7, 8]. Однако клиническая значимость выявления данных групп МО в эякуляте окончательно не установлена.
В подавляющем большинстве работ по изучению микробиоты эякулята использовали метод NGS (целевой участок бактериального генома — ген 16S рРНК) [1–5, 7].
При высокой информативности этот подход обладает рядом недостатков: сложной пробоподготовкой, трудностью контроля взятия материала, длительной продолжительностью анализа, сложностью интерпретации результатов, высокой стоимостью приборной базы и реагентов для исследования. Данные недостатки делают практически невозможным применение NGS в рутинной врачебной практике. Для этой цели гораздо более удобен метод количественной ПЦР (ПЦР в реальном времени, или ПЦР-РВ). В нескольких предыдущих исследованиях была показана возможность использования коммерческого набора реагентов для проведения ПЦР-РВ на 24 группы МО для оценки микробиоты эякулята [9–11], в том числе его большая информативность в сравнении с культуральным исследованием [10]. При очевидных преимуществах ПЦР-РВ исследования эякулята перед другими микробиологическими методами главным сдерживающим фактором для его внедрения в рутинную практику является сложность практической интерпретации полученных результатов.
При культуральном исследовании клинически значимым порогом выявления условно-патогенной флоры является количество 103 КОЕ в 1 мл [12]. Высокая чувствительность молекулярных методов и способность выявлять некультивируемые и нежизнеспособные формы МО затрудняют использование аналогичных пороговых значений при интерпретации результатов, полученных методом ПЦР- РВ. Необходимо установить, насколько типично присутствие некультивируемых МО в надпороговых значениях в эякуляте в норме и при патологии. При выявлении нескольких групп МО требуется определить устойчивые типы бактериальных сообществ, ассоциированные с нарушениями фертильности у мужчин.
Для ответа на эти вопросы необходимо проведение комплексного анализа результатов молекулярно- биологических и клинических исследований эякулята пациентов с нарушением фертильности и здоровых мужчин. Целью исследования было провести кластерный анализ микробиоты эякулята, выявленной методом ПЦР-РВ.
МАТЕРИАЛЫ И МЕТОДЫ
Группы обследованных пациентов
В период с января 2019 г. по март 2020 г. были исследованы образцы эякулята 634 мужчин (средний возраст — 34 ± 6,7 года). Пациенты обратились в указанный период в Медицинский центр «Гармония» (г. Екатеринбург, n = 429) и в урологическую клинику Ивановской государственной медицинской академии (г. Иваново, n = 205) по поводу бесплодия или для прегравидарной подготовки.
Критерии включения пациентов в исследование: мужчины репродуктивного возраста; наличие бесплодия или проведение прегравидарной подготовки; все обследуемые пациенты в течение последних четырех недель не получали вещества, способные повлиять на микробиом эякулята, такие как гормональные, антибактериальные препараты, а также вещества с содержанием алкоголя более 30 мл в пересчете на чистый этанол.
Критерии исключения из исследования: наличие гипогонадотропного и гипергонадотропного гипогонадизма, сахарного диабета 1-го и 2-го типов, гипо- и гипертиреоза; наличие инфекций, передающихся половым путем (Chlamydia trachomatis, Neisseria gonorrhoeae, Mycoplasma genitalium, Trichomonas vaginalis); клинические проявления простатита, такие как боль и дизурия; наличие аномалий кариотипа, мутаций в гене CFTR, микроделеций в AZF-локусе Y-хромосомы.
Техника получения эякулята
Подготовка к сбору эякулята: половое воздержание в течение 2–5 дней. Сбор эякулята пациенты осуществляли после мочеиспускания путем мастурбации в стерильный контейнер, избегая касания стенок и крышки контейнера руками.
Выделение ДНК
Для выделения ДНК использовали набор ПРОБА-НК-ПЛЮС («ДНК-Технология»; Россия). Образцы эякулята подвергали предварительной обработке по следующей методике: 1,0 мл эякулята помещали в пробирку Эппендорф с 1,0 мл транспортной среды («Транспортная среда с муколитиком», «ИнтерЛабСервис»; Россия), встряхивали на вортексе до полного перемешивания. Пробирку центрифугировали при 13 000 об./мин в течение 10 мин на центрифуге Mini- Spin (Eppendorf; Германия). После удаления надосадочной жидкости 50 мкл осадка использовали для последующего выделения ДНК.
Оценка микробиоты эякулята
Исследование проводили с использованием набора реагентов «Андрофлор» («ДНК-Технология»; Россия) в детектирующем амплификаторе «ДТпрайм» согласно инструкции производителя. После реакции амплификации по показателю индикаторного цикла с помощью специального программного обеспечения («ДНК-Технология»; Россия) проводили автоматический расчет количества общей бактериальной массы (ОБМ), лактобацилл и каждого из условно-патогенных микроорганизмов (УПМ) в представленном образце (выражали в геномэквивалентах на 1 мл (ГЭ/мл)). Спектр определяемых набором МО представлен следующими группами: грамположительные факультативно-анаэробные МО (Streptococcus spp., Staphylococcus spp., Corynebacterium spp.); грамотрицательные факультативно-анаэробные МО (Haemophilus spp., Pseudomonas aeruginosa / Ralstonia spp. / Burkholderia spp.); группа Enterobacteriaceae / Enterococcus spp.; облигатно-анаэробные микроорганизмы (Gardnerella vaginalis, Eubacterium spp., Sneathia spp. / Leptotrichia spp. / Fusobacterium spp., Megasphaera spp. / Veillonella spp. / Dialister spp., Bacteroides spp. / Porphyromonas spp. / Prevotella spp., Anaerococcus spp., Peptostreptococcus spp. / Parvimonas spp., Atopobium cluster), микоплазмы (Mycoplasma hominis, Ureaplasma urealyticum, Ureaplasma parvum), группа Lactobacillus spp., грибы рода Candida.
В качестве отрицательного контрольного образца использовали стерильную деионизированную воду. В отрицательном контрольном образце положительные сигналы по некоторым группам МО в ПЦР-РВ фиксировали не ранее 35 цикла амплификации (что соответствовало микробной нагрузке менее 103 ГЭ/мл). На основании этого значимым считали количество МО не менее 103 ГЭ/мл, что соответствовало положительному сигналу в ПЦР- РВ до 35 цикла. Исключение составляли U. urealyticum, U. parvum, M. hominis, по которым положительный сигнал в отрицательном контрольном образце отсутствовал. При получении сигнала на любом цикле амплификации результат ПЦР-РВ по этим группам МО расценивали как положительный. Грибы рода Candida в данном исследовании не учитывали.
Статистические методы
Анализ структурных особенностей микробиоты эякулята проводили с использованием модели кластеризации MSSC, минимизирующей сумму по всем кластерам внутрикластерных сумм квадратов расстояний от элементов кластеров до их центроидов [13]. Решение задачи кластеризации проводили с использованием алгоритма k-means++ [14], реализованного в библиотеке машинного обучения scikit-learn. Выбор оптимальной кластеризации проводили на основе внутренних оценок качества кластеризации: индекса силуэта [15] и индекса Дэвиса–Болдуина [16]. Для оптимальной кластеризации исследована устойчивость кластеров к изменению размера выборки.
РЕЗУЛЬТАТЫ ИССЛЕДОВАНИЯ
Частота выявления отдельных групп МО
ОБМ в надпороговом количестве (не менее 103 ГЭ/мл) определяли в 460 (72,5%) из 634 проб. Из них в 110 (17,4%) образцах число всех отдельных групп МО было ниже установленного порога. В 174 (27,5%) пробах бактериальная ДНК присутствовала в количестве менее 103 ГЭ/мл.
В 350 (55,2%) образцах одновременно выявляли от 1 до 14 групп МО в надпороговых значениях. Частота выявления отдельных групп МО представлена в табл. 1.
Разные группы МО встречались во множестве ассоциаций друг с другом. Поэтому было принято решение провести кластерный анализ с целью определения характерных для эякулята микробных сообществ.
Кластерный анализ микробиоты эякулята
Для проведения кластерного анализа были отобраны 350 проб, отвечающие следующим критериям: ОБМ не менее 103 ГЭ/мл, как минимум одна группа МО не менее 103 ГЭ/мл.
Для запуска алгоритма кластеризации k-means++ каждый исследуемый образец был представлен в виде вектора (p, s) ε R50, состоящего из вектора первичных признаков p ε R19, взятых из данных исследований микробиоты эякулята методом ПЦР-РВ, и вектора вторичных признаков s ε R31, рассчитываемых на основе первичных признаков.
Первичными признаками являлись абсолютные значения показателей, определяемых используемым тестом (ОБМ и 18 групп МО).
На основе первичных признаков были рассчитаны следующие вторичные признаки: скорректированная ОБМ (СОБМ), равная суммарной массе 18 определяемых групп МО; массовые доли МО по отношению к СОБМ; массы укрупненных в соответствии с компоновкой используемого теста групп МО: Lactobacillus spp., грамположительных факультативных анаэробов (ГПФА), облигатных анаэробов (ОА), грамотрицательных факультативных анаэробов (ГОФА), Enterobacteriaceae spp. / Enterococcus spp. (ЕЕ) и микоплазм; массовые доли укрупненных групп МО по отношению к СОБМ.
Определение оптимального количества кластеров в исследуемом наборе данных проводили на основе значений индексов силуэта и Дэвиса–Болдуина (табл. 2).
Наилучшему качеству кластеризации соответствуют наибольшее значение индекса силуэта и наименьшее значение индекса Дэвиса–Болдуина. В соответствии с полученными значениями индексов оптимальным было выделение четырех основных кластеров микробиоты эякулята.
Каждый из полученных кластеров отличался преобладанием определенной укрупненной группы МО. На рис. 1 представлены диаграммы размаха признаков объектов, попавших в соответствующий кластер.
Кластер 1 — вариант с преобладанием ОА. Абсолютное количество всех ОА было сопоставимо с ОБМ и составило в центроиде 104,3 ГЭ/мл (рис. 1А). Доля ОА в центроиде достигала 82,8% относительно СОБМ. Данный вариант микробиоты определяли в 172 (49,1%) из 350 образцов.
Кластер 2 — вариант с преобладанием Lactobacillus spp. В образцах, отнесенных к данному кластеру, абсолютное количество Lactobacillus spp. было сопоставимо с СОБМ и составило в центроиде 104,0 ГЭ/мл (рис. 1Б). Доля Lactobacillus spp. в центроиде достигала 80,9% относительно СОБМ. Данный вариант микробиоты эякулята идентифицировали в 78 (22,3%) из 350 образцов.
Кластер 3 — вариант с преобладанием ГПФА. Абсолютное количество всех ГПФА было сопоставимо с СОБМ и в центроиде составило 103,6 ГЭ/мл (рис. 2В). Доля ГПФА в центроиде составила 89,4% относительно СОБМ. Данный вариант микробиоты выявляли в 62 (17,7%) из 350 образцов.
Кластер 4 — вариант с преобладанием группы ЕЕ. Абсолютное количество всех ЕЕ было ниже количества СОБМ и составило в центроиде 103,5 ГЭ/мл (рис. 2Г). Доля ЕЕ в центроиде составила 64,5% относительно СОБМ. Данный вариант микробиоты эякулята был определен в 38 (10,9%) из 350 образцов.
Анализ устойчивости микробных кластеров
Для исследования устойчивости выделенных кластеров генерировали подвыборки образцов объема ƒ = 1,100% от исходной выборки (1000 случайных подвыборок без возврата на каждое значение объема). Для сгенерированных подвыборок проводили процедуру разбиения на четыре кластера. Для каждой (m = 1,1000) сгенерированной подвыборки образцов объема ƒ (обозначим такую подвыборку через X ) рассчитывали индекс устойчивости кластера k по следующей формуле:
где n — количество образцов в подвыборке X ; 1{true}:{true,
flase} → {0,1}индикаторная функция логического аргумента; x ε X — образец из подвыборки X , A (x); A'm (x) — метка кластера, в который попал образец x в результате кластеризации исходного набора образцов и подвыборки X , соответственно; k = {1, 2, 3, 4}, l = {1, 2, 3, 4} метки кластеров.
Дополнительно рассчитывали индекс устойчивости кластера k, общий для подвыборок объема ƒ. Расчет проводили по следующей формуле:
Графики индексов устойчивости кластеров, рассчитанных по формулам (1) и (2), представлены на рис. 3. Полученные четыре кластера устойчивы: на достаточно небольших объемах подвыборок вероятность отнесения двух произвольных наблюдений к одному и тому же кластеру при 4-кластеризации исходной выборки и произвольной подвыборки стремится к 1. Наиболее устойчивы кластеры с преобладанием Lactobacillus spp. (кластер 2; рис. 3Б), с преобладанием ГПФА (кластер 3; рис. 3В) и с преобладанием ЕЕ (кластер 4; рис. 3Г). Наименее устойчив кластер 1 с преобладанием ОА (рис. 3А).
ОБСУЖДЕНИЕ РЕЗУЛЬТАТОВ
Высокая чувствительность метода ПЦР и присутствие бактериальной ДНК как в окружающей среде, так и в реагентах для проведения анализа (KITomе) являются ограничивающими факторами для интерпретации результатов исследования образцов с низкой микробной нагрузкой [17]. Учитывая, что при исследовании отрицательного контрольного образца для большинства групп МО после 35 цикла в ПЦР-РВ (что соответствовало микробной нагрузке менее 103 ГЭ/мл) были получены положительные сигналы, в качестве порогового значения был взят показатель 103 ГЭ/мл. Все остальные результаты рассматривали как отрицательные. Исключение составляли группы U. urealyticum, U. parvum, M. hominis, по которым положительный сигнал в отрицательном контрольном образце отсутствовал. При получении сигнала на любом цикле амплификации результат ПЦР-РВ по этим группам МО расценивали как положительный.
Наличие микробной нагрузки выше порогового значения отмечали только в 460 (72,5%) пробах. При этом в 110 образцах число всех отдельных групп МО было ниже установленного порога. Почти половина образцов эякулята (44,8%) содержала бактериальную ДНК в подпороговых значениях (менее 103 ГЭ/мл), что принято рассматривать как вариант нормы [12].
В 350 (55,2%) образцах одновременно обнаруживали от 1 до 14 групп МО в надпороговых значениях, что согласуется с результатами других исследователей, отмечающих гетерогенность микробиоты эякулята [1, 2, 5, 7]. Чаще других выявляли следующие группы МО: Corynebacterium spp. (21,0%), Bacteroides spp. / Porphyromonas spp. / Prevotella spp. (20,7%), Lactobacillus spp. (19,7%), Eubacterium spp. (17,0%), Peptostreptococcus spp. / Parvimonas spp. (16,9%). Реже обнаруживали другие группы МО с частотой 3,3– 14,8%. Ранее проведенные исследования также показали, что при использовании молекулярно-биологических методов наряду с факультативными анаэробами в эякуляте часто выявляют облигатных анаэробов и Lactobacillus spp. [1, 2, 5, 7, 18].
Кластерный анализ микробиоты эякулята в образцах, содержащих надпороговые значения ОБМ и хотя бы одной из групп МО, показал, что оптимально разбиение на четыре кластера. Для каждого кластера было характерно преобладание одной из укрупненных групп МО: для кластера 1 — ОА, для кластера 2 — Lactobacillus spp., для кластера 3 — ГПФА, для кластера 4 — ЕЕ. Схожие данные были получены в ранее проведенных исследованиях, использующих метод NGS для оценки состава микробиоты эякулята [1, 2]. Еще одни авторы при исследовании семенной жидкости здоровых мужчин и мужчин с бесплодием также выделили несколько кластеров МО, в том числе с преобладанием ГПФА, ОА, Lactobacillus spp. [2].
Кластер 2 (с преобладанием Lactobacillus spp.), кластер 3 (с преобладанием ГПФА) и кластер 4 (с преобладанием ЕЕ) характеризовались высокой устойчивостью. При этом для кластеров 2 и 3 было нетипично присутствие других групп МО в количествах, сопоставимых с образующими кластер группами. Тогда как для кластера 4 было характерно присутствие наряду с ЕЕ других групп бактерий: ГПФА, ОА и грамотрицательных факультативных анаэробов.
Кластер 1 (с преобладанием ОА) характеризовался меньшей устойчивостью, что может быть обусловлено большим видовым разнообразием микробиоты в этих образцах эякулята.
Результаты настоящего исследования подтверждают наблюдения других авторов о гетерогенном составе микробиоты эякулята, которая может быть сгруппирована в ряд кластеров. Примененный нами подход подтвердил устойчивость выделенных четырех кластеров на случайно сгенерированных выборках разного размера.
Предметом дальнейших исследований может стать определение частоты выявления описанных в настоящей работе бактериальных кластеров в образцах эякулята, полученных от пациентов с нормоспермией и различными вариантами патоспермии. Установление взаимосвязи между особенностями микробиоты эякулята и нарушениями фертильности у мужчин позволит выработать новые алгоритмы ведения пациентов с бесплодием в зависимости от состава микробиоты эякулята.
ВЫВОДЫ
1.Методом ПЦР-РВ бактериальную ДНК в количестве не менее 103 ГЭ/мл выявляли в 72,5% образцов эякулята; в 55,2% проб эякулята одновременно определяли от 1 до 14 групп МО в надпороговых значениях.
2. Выделили четыре устойчивых кластера микробиоты эякулята, каждый из которых отличался преобладанием определенной укрупненной группы микроорганизмов: ОА, Lactobacillus spp., грамположительных факультативных анаэробов, Enterobacteriaceae / Enterococcus.
3. В половине образцов эякулята микробиота была представлена кластером 1 (с преобладанием ОА), для которого характерны наименьшая стабильность и наибольшее видовое разнообразие.