МНЕНИЕ
Выбор метода количественной оценки микробиоты кишечника: сравнительный анализ 16S NGS и ПЦР-РВ
1 Центр стратегического планирования и управления медико-биологическими рисками здоровью Федерального медико-биологического агентства, Москва, Россия
2 Национальный медицинский исследовательский центр терапии и профилактической медицины Министерства здравоохранения Российской Федерации, Москва, Россия
Для корреспонденции: Ольга Анатольевна Злобовская
ул. Погодинская, д. 10, с. 1, г. Москва, 119121, Россия; ur.abmfpsc@ayaksvobolZO
Вклад авторов: О. А. Злобовская — идея, анализ литературы, написание рукописи; А. С. Курносов, А. Ф. Шептулина, Е. В. Глазунова — редактирование рукописи.
16S NGS: широкие возможности и значительные ограничения
Метод 16S NGS стал важным инструментом для изучения микробиоты благодаря возможности параллельного секвенирования множества образцов и выявления широкого спектра микроорганизмов. Он позволяет проводить комплексную оценку таксономического состава микробного сообщества и его разнообразия, что делает этот метод незаменимым для фундаментальных исследований. Однако, несмотря на потенциал, этот метод имеет ряд следующих серьезных ограничений, которые приводят к искажению результатов количественной оценки.
Неравномерная амплификация (зависимость от праймеров)
Для амплификации вариабельных регионов гена 16S рРНК используют универсальные праймеры. Они обладают разным сродством к ДНК различных таксонов, что приводит к неравной эффективности амплификации в процессе изготовления библиотек [1]. В результате этого искажаются данные о структуре микробиоты, так как одни таксоны могут быть переоценены, а другие — недооценены или вовсе пропущены.
Неравномерная амплификация (зависимость от количественного состава)
Наиболее представленные таксоны получают значительное преимущество на ранних этапах амплификации [2], что снижает вероятность точного определения редких таксонов (до 10% от общего количества). Поскольку каждый образец имеет уникальный состав микробиоты, невозможно применить единую систематическую корректировку для всех образцов даже при использовании одинаковых протоколов [3, 4].
Низкая чувствительность
При использовании метода 16S NGS для каждого образца в среднем получают от пяти до 50 тыс. прочтений. Однако, согласно Пуассоновскому распределению, количественнуюIоценку таксона можно считать статистически корректной только при наличии как минимум 100 прочтений данного таксона в образце [5]. Это ограничивает возможность достоверной оценки таксонов, которые составляют менее 0,2–2% от общего числа ридов (в зависимости от суммарного числа прочтений). Увеличение числа прочтений в образце не всегда целесообразно, так как амплификация доминирующих таксонов происходит на ранних этапах, что приводит к значительной недооценке минорных таксонов или их полному исчезновению из анализа. Как следствие, кривая насыщения таксономического разнообразия достигает плато при 20–50 тыс. прочтений, и дальнейшее увеличение числа ридов не повысит репрезентативность данных. Это особенно актуально для минорных условнопатогенных микроорганизмов, которые могут иметь клиническое значение при низких концентрациях, но часто либо не обнаруживаются, либо их количественная оценка оказывается ненадежной. Кроме того, среди исследователей нет единого мнения по вопросу: что более корректно — сравнивать образцы с различным числом прочтений или вводить искажения при унификации их количества [6, 7].
Сниженная специфичность
При исследовании отдельных регионов (V1-V3, V3-V4, V6, и т. д.) высокая степень консерватизма региона 16S в ряде случаев не позволяет получить таксономическое разрешение на уровне видов, а иногда и родов [1, 8]. Использование полной последовательности гена 16S увеличивает разрешающую способность секвенирования, но доступно только на платформах ONT, PacBio и LoopSeq. К существенным недостаткам данных платформ можно отнести более высокую частоту ошибок относительно ошибок при коротких прочтениях, получаемых, например, на платформе Illumina.
Ограниченность относительной оценки таксонов
Метод 16S NGS оценивает только относительное содержание таксонов, а не их абсолютное количество. Это означает, что увеличение представленности одного таксона, например, вследствие внедрения изменений в рацион, автоматически приведет к уменьшению доли других при анализе методом 16S NGS. При одновременном изменении нескольких таксонов в сторону уменьшения/ увеличения восстановить истинную картину динамики не представляется возможным [4–6].
Влияние количества копий гена 16S рРНК
Каждый вид микроорганизмов обладает уникальным количеством копий гена 16S рРНК, что редко учитывают при анализе, особенно при идентификации последовательности до уровня родов или семейств. Даже в случае использования специализированного плагина для QIIME 2 искажения, как правило, сохраняются. Причина в том, что при отсутствии данных о копийности гена для конкретной таксономической группы базе данных rrnDB алгоритм автоматически присваивает значение копийности, равное единице.
Неравная филогенетическая разрешающая способность
Разные регионы гена 16S рРНК имеют различную филогенетическую разрешающую способность [1, 8–10].
Это приводит к неравномерной точности классификации таксонов, что создает дополнительные трудности при сопоставлении данных из разных исследований.
Различия в платформах секвенирования и методах обработки данных
Разные платформы секвенирования и методы подготовки библиотек могут приводить к значительным различиям в результатах [1, 11, 12]. Как было сказано выше, это усложняет сопоставление данных между различными исследованиями.
Зависимость от базы данных
Разные базы данных (RDP, SILVA, Greengenes и т. д.) могут давать разные количественные оценки одного и того же образца [1, 13]. Кроме того, базы обновляют раз в несколько лет, из-за чего в них могут отсутствовать недавно введенные таксономические единицы.
ПЦР-РВ: специализированные задачи, высокая точность
В отличие от NGS, метод ПЦР в реальном времени (ПЦР-РВ) основан на амплификации специфических фрагментов ДНК. Из этого следует ряд его преимуществ.
Высокая чувствительность и широкий количественный диапазон оценки
ПЦР-РВ предоставляет возможность обнаруживать и количественно оценивать от нескольких копий мишени в реакции с высокой точностью. Это особенно важно при исследовании редких клинически значимых таксонов, которые могут быть пропущены при 16S NGS. Метод ПЦР-РВ позволяет достоверно количественно определить до 107–108 копий мишени в реакции.
Высокая специфичность
Олигонуклеотиды подбирают таким образом, чтобы с высокой точностью отличить даже близкородственные микроорганизмы.
Повышенная точность
В отличие от 16S NGS, за счет отсутствия одновременной амплификации нескольких сотен разных мишеней индивидуальная оценка содержания определенного таксона более достоверна.
Быстрая и простая интерпретация
В отличие от 16S NGS, ПЦР-РВ не требует сложных биоинформатических методов для интерпретации данных. Это делает его более удобным и доступным для клинических исследований и диагностики, где важна скорость и точность результатов.
Высокая воспроизводимость
Метод ПЦР-РВ обладает более высокой степенью воспроизводимости по сравнению с 16S NGS благодаря простоте метода и анализа результатов, что особенно важно для клинической диагностики и долгосрочных исследований. Этот фактор также облегчает сравнение данных между различными исследованиями и лабораториями.
Абсолютная количественная оценка
В отличие от относительного подхода NGS, ПЦР-РВ предоставляет возможность как для относительной, так и для абсолютной количественной оценки таксонов. Это позволяет анализировать динамику содержания микробиоты при различных состояниях.
Сниженная зависимость от качества биоматериала
Анализ методом ПЦР-РВ менее требователен к исходному качеству образца (количество, содержание ингибиторов ПЦР) по сравнению с методом 16S NGS, где данные факторы существенно влияют на предварительный этап подготовки библиотек.
Тем не менее метод ПЦР-РВ также обладает определенными ограничениями. Однако в отличие от ограничений, присущих методу NGS, большинство из них можно свести к минимуму при условии учета и коррекции следующих возможных проблемных аспектов.
Выбор целевых микроорганизмов
ПЦР-РВ ориентирована на амплификацию заранее выбранных генетических мишеней, что требует предварительного знания о ключевых представителях микробиоты в данном исследовании.
Выбор региона для разработки систем
Наиболее исследованным регионом для большинства бактерий является ген 16S РНК, поэтому чаще всего именно он является мишенью для разработки систем. Однако это высококонсервативная область генома, поэтому не для всех таксономических единиц на уровне видов (а иногда и родов, например, Oscillibacter / Dysosmobacter) возможно разработать специфичные системы, амплифицирующие данный регион. Для ряда микроорганизмов есть полногеномные данные, позволяющие выбрать другой регион для детекции. Однако таких организмов меньшинство, поэтому выбранная мишень может быть неспецифичной или система будет амплифицировать не всех представителей данной таксономической группы.
Ограничение одновременного количества исследуемых таксонов
Поскольку ПЦР-РВ направлена на специфичную амплификацию фрагментов ДНК, количество одновременно анализируемых таксонов ограничено. Для точной количественной оценки желательно совмещать не более двух мишеней (при широком возможном диапазоне и стабильном присутствии обеих в большинстве образцов) или трех мишеней (для редких таксонов) в пробирке. Кроме того, из-за ограниченного суммарного числа таксонов в анализе, метод ПЦР-РВ не предоставляет информацию о структуре всего микробного сообщества или его разнообразии, которые также могут обладать клинической значимостью. Искажения, связанные с количеством копий генов
Данная проблема может возникнуть, если система подобрана для детекции таксономической группы на высоком уровне (например, семейства) и внутри группы разные роды / виды обладают существенно различающимся количеством копий гена 16S.
Необходимость стандартизации данных
Для перевода данных, полученных с помощью ПЦР-РВ, в абсолютные значения требуется использование калибровочных стандартов. Для максимальной точности ПЦР-РВ используемые стандарты необходимо предварительно оценивать методом капельно-цифровой ПЦР. При этом чувствительность и линейный диапазон олигонуклеотидных систем крайне желательно исследовать не на модельных образцах (например, титровке плазмиды или ампликона), а на геномной ДНК соответствующего таксона, предпочтительно на фоне фекальной ДНК в клинически релевантном количестве.
ЗАКЛЮЧЕНИЕ
Сравнение особенностей методов 16S NGS и ПЦР-РВ показывает, что NGS лучше подходит для исследования общего состава микробиоты и ее разнообразия, в то время как его использование для количественной оценки ограничено рядом проблем, которые на текущий момент не имеют практического решения. В то же время ПЦР-РВ обеспечивает более точную и надежную количественную оценку, что делает его предпочтительным методом для исследований, где важна высокая точность, а исследуемые маркеры известны.