ОРИГИНАЛЬНОЕ ИССЛЕДОВАНИЕ
Полиморфизмы rs17713054 и rs1800629 генов LZTFL1 и TNF ассоциированы с тяжестью течения COVID-19
1 «Система-БиоТех», Москва, Россия
2 Диагностический центр (Центр лабораторных исследований) Департамента здравоохранения города Москвы, Москва, Россия
3 Научно-исследовательский институт скорой помощи имени Н. В. Склифосовского, Москва, Россия
Для корреспонденции: Наталья Вячеславовна Позднякова
1-я Курьяновская ул., д. 34, кор.11, Москва, Россия; ur.hcetoibametsis@avokayndzop.n
Финансирование: исследование профинансировано главным акционером компании ООО «Система-БиоТех», АФК «Система». Исследование профинансировано в рамках двойного слепого клинического исследования Департаментом здравоохранения г. Москвы.
Благодарности: авторы благодарят заместителя руководителя Департамента здравоохранения г. Москвы Ю. О. Антипову за организацию исследования; за предоставление образцов биологических материалов пациентов ГБУЗ «Диагностический центр (Центр лабораторных исследований) г. Москвы».
Вклад авторов: Н. В. Позднякова, С. В. Поярков — концепция и дизайн исследования; М. М. Минашкин — выполнение молекулярно-генетических работ, лабораторная постановка; С. В. Поярков, А. А. Траспов — обзор литературы, написание статьи; А. А. Траспов — статистическая обработка и редактирование статьи; А. Г. Комаров — руководство, планирование эксперимента, анализ данных; И. А. Штинова, Г. И. Спешилов и И. А. Карбышев — предоставление клинического материала и метаданных; М. А. Годков — контроль за сбором образцов, предоставление обезличенных данных.
Соблюдение этических стандартов: одобрение этического комитета не требовалось в связи с работой с обезличенными данными пациентов и двойным слепым форматом исследования.
За последние десятилетия было показано, что вариации генома человека способствуют возникновению гетерогенности в ответ на инфекционные заболевания.
Пандемия тяжелого острого респираторного синдрома, вызванного коронавирусом SARS-CoV-2, привела к гибели миллионов людей во всем мире.
Для заболевания, вызванного новой коронавирусной инфекцией (COVID-19), характерна высокая вариабельность клинических проявлений (Всемирная организация здравоохранения, 2021 г.). Большинство пациентов, а именно 81%, имеют бессимптомное или легкое течение, тогда как 14% страдают тяжелым и 5% — критическим течением заболевания [1]. Наиболее распространенные симптомы включают лихорадку, сухой кашель и утомляемость; наблюдаются также агевзия, аносмия и желудочно-кишечные симптомы. Для тяжелой формы COVID-19 характерна дыхательная недостаточность, требующая искусственной вентиляции легких или интенсивной подачи кислорода.
Идет постоянный поиск факторов риска, которые могут быть связаны с болезнью. Изначально предполагалось, что люди пожилого возраста, мужского пола, имевшие ранее сердечно-сосудистые заболевания, заболевают в тяжелой форме. Но оказалось, что генетический бэкграунд вносит не меньший вклад. В результате многочисленных исследований было показано, что полиморфизмы в генах факторов организма-хозяина, необходимых для реализации жизненного цикла вируса, например ACE2, TMPRSS2, AR, а также в генах, задействованных во врожденном иммунном ответе, например TNF, TLR7, могут быть связаны с тяжестью COVID-19 [2].
Первое полногеномное ассоциативное исследование (GWAS) тяжести течения COVID-19, в котором сравнивались 1980 пациентов с тяжелым течением из Италии и Испании с контрольной популяцией с неизвестным статусом инфекции SARS-CoV-2, выявил два значимых для всего генома локуса, картируемых в области 3p21.31, включающей шесть генов (SLC6A26, LZTFL1, CXCR6, CCR1, CCR3, CCR9) и в области 9q34.2, которая содержит локус группы крови ABO [3].
Сигнал в локусе 3p21.31 остается наиболее устойчивым и сильным во множестве исследований, что связано как с восприимчивостью к инфекции, так и с тяжестью заболевания. Аллель C варианта rs10490770 связан с самым сильным увеличением риска тяжелого протекания пневмонии COVID-19 в данном локусе [4].
В полногеномно-ассоциативных исследованиях (Genome-Wide Association Studies, GWAS) было выявлено, что область 3p21.31 связана с двукратным увеличением риска появления дыхательной недостаточности [5].
Роль факторов хозяина, определяющих как чувствительность так и тяжесть течения инфекции, показана для многих патогенов, включая микобактерии туберкулеза, HIV, Candida albicans и многих других [6].
Известна ассоциация риска тяжелого течения инфекции с генами, вовлеченными в иммунный и воспалительный ответы. Так, известна роль минорных аллелей в TLR7 [7] и в генах системы интерферона [8].
Помимо аллелей риска, существуют варианты, которые обладают защитным эффектом. Так, генотип ТТ SNP rs5443 в гене GNB3 ассоциирован с защитой от летального исхода при COVID-19 [9]. Полиморфизмы в регуляторных регионах генов провоспалительных цитокинов, которые могут влиять на уровень экспрессии мРНК этих генов, например C-572G rs1800796 в промоторном регионе гена IL6, ассоциирован с защитным эффектом от развития тяжелого течения и смерти от COVID-19 в популяции народов Азии [10].
ПАЦИЕНТЫ И МЕТОДЫ
Клинико-демографические характеристики обследованных пациентов.
В исследование были включены пациенты отделения реанимации и интенсивной терапии (ОРИТ) НИИ скорой помощи им. Н. В. Склифосовского, ГКБ № 1 ООО «Медси», ГКБ № 40, а также сотрудники АФК «Система» и лаборатории «Система-БиоТех». Было проведено ретроспективное исследование (исход заболевания был известен), в которое включили 713 пациентов (n = 713). Критерии включения: коронавирусная инфекция различной степени тяжести. Критерии исключения: наличие различных типов коморбидности, способных резко повлиять на общее состояние пациента (онкология, ИБС, дефекты иммунитета).
Для выявления ассоциации исследуемых вариантов с тяжелым и крайне тяжелым течением пациенты были разделены на две группы: группу контроля, куда были включены две категории (пациенты с легким и средне- тяжелым течением), и опыта (пациенты с тяжелым течением) в соответствии со шкалой визуальной оценки легких по результатам компьютерной томографии (или МСКТ), разработанной во время пандемии новой коронавирусной инфекции специалистами из Центра диагностики и телемедицины США, после изучения КТ-исследований 13 003 человек, которые составили основную выборку. Данная классификация получила широкое распространение и в российской практике [24]. Критерием степени тяжести служили данные компьютерной томографии (КТ) легких: для контрольной группы — КТ1 и 2, для тяжелой — КТ3 и 4. Основные признаки исследуемой когорты представлены в табл. 1.
Выделение геномной ДНК
В качестве биологического материала для выделения геномной ДНК использовали венозную кровь, стабилизированную ЭДТА.
ДНК выделяли с помощью набора для выделения ДНК из цельной крови DiaGene («Диа-М»; Россия). Чистоту выделенной НК проверяли на спектрофотометре NanoDrop OneC (Themo FS; США). Соотношение A260/280 колебалось от 1,8 до 1,91, а соотношение A260/230 — от 1,62 до 2,28. Концентрацию ДНК измеряли с помощью набора dsDNA BR на флуориметре Qubit Flex (Thermo FS; США). Ее значения менялись в пределах 15–300 нг/мкл. Концентрацию всех образцов ДНК доводили до 2 нг/мкл.
Генотипирование ДНК
Генотипирование ДНК в области исследуемых полиморфных маркеров проводили методом ПЦР в реальном времени с флуоресцентной детекцией с использованием наборов для генотипического анализа TaqMan SNP (Thermo FS; США). ПЦР проводили на амплификаторе CFX96 (BioRad; США).
Генотипировали ряд маркеров, который в дальнейшем подтверждали секвенированием по методу Сэнгера. Праймеры были разработаны с использованием PrimerBlast (https://www.ncbi.nlm.nih.gov/tools/primer-blast/ (по состоянию на 24 сентября 2020 г.)). В реакции циклического секвенирования BigDye Terminator v3.1 использовали набор для циклического секвенирования BigDye (Thermo FS; США); секвенирование проводили на Genetic Analyzer 3500 (Thermo FS; США).
Статистическая обработка полученных данных
Для расчета статистической значимости различий частот встречаемости использовали точный двусторонний критерий Фишера и критерий χ2 (хи-квадрат). Расчеты проводили как для минорного аллеля (АА против Аа+аа; доминантная модель), так и для гомозиготных генотипов по минорному аллелю (АА+Аа против аа; рецессивная модель). Для групп, в которых были обнаружены значимые различия, рассчитывали отношение шансов (OR), 95%-й доверительный интервал (CI) и критерий статистической значимости. Расчеты проводились с использованием ресурса SNPStats (https://www.snpstats.net/ (по состоянию на 20 сентября 2021 г.)), которое предназначено для выявления связи между однонуклеотидными полиморфизмами и риском заболевания. Для оценки влияния множественных сравнений для значений OR статистически значимых полиморфизмов была проведена поправка Холма–Бонферрони. Были проанализированы выборки, включая все полиморфизмы, на достаточность размера выборки. Анализ проводили в пакете Statsoft Statistica 12. Чтобы проанализировать требуемый размер выборки при заданной силе 80, мы использовали независимый t-тест с 2 выборками для сравнения двух средних значений между двумя популяциями (нулевая гипотеза μ1 = μ2). Учитывали особенности пакета SNPstats и используемые в нем величины: средние с критериями Акаике (AIC) и Байесовским информационным критерием (Bayesian information criterion, BIC).
РЕЗУЛЬТАТЫ ИССЛЕДОВАНИЯ
В табл. 1 описана исследуемая выборка с целью оценки ее разнообразия.
Для расчета статистической значимости разницы в частотах встречаемости использовали точный двухсторонний критерий Фишера и χ2-критерий. Статистические расчеты проводили в соответствии с доминантной моделью (с идентификацией аллеля риска) и рецессивной моделью (с идентификацией генотипа риска). Кроме того, для групп, в которых были обнаружены значимые различия, рассчитывали отношение шансов (OR), с 95%-м доверительным интервалом и критерием статистической значимости p.
Для всех полиморфизмов был сделан (в зависимости от разделения пациентов на группы) расчет статистической значимости с использованием двух моделей: доминантной и рецессивной. Модель базировалась на оценке риска перехода легкой формы в более тяжелую; частоту сравнивали у пациентов контрольной группы, с одной стороны, и у пациентов со тяжелой формой, с другой (табл. 2).
Поскольку в эксперименте проверяли большое количество гипотез на одном и том же наборе данных, из-за эффекта множественных сравнений была внесена поправка Холма–Бонферрони, чтобы избежать ошибок I типа.
Для двух маркеров наличие минорной аллели и гомозиготного генотипа было связано с повышенным риском тяжелого течения заболевания. Это rs1800629 в гене TNF (OR = 1,5; p = 0,02), и rs17713054 в гене LZTFL1 (OR = 1,60; p = 0,0043), однако rs17713054 показал патогенные свойства и в рецессивной модели (OR = 4,56; p = 0,0025).
В маркере TLR2 защитными свойствами обладал гомозиготный генотип по минорному аллелю в доминантной модели.
Все выявленные маркеры являются факторами риска как для восприимчивости к заболеванию, так и для перехода заболевания в более тяжелую форму, но статистическая значимость была достигнута только для вариантов, проиллюстрированных в таблицах выше.
Кроме того, был также проведен анализ исследуемой выборки на отклонение от распределения равновесия Харди–Вайнберга (n = 713), для 10 исследованных маркеров (табл. 3).
На основе суммирования коэффициентов отклонения от равновесия Харди–Вайнберга и их уровней значимости P было выявлено отклонение от равновесия для IFIH1 (p = 0,0047), CCR2 (p = 0,049) и значительное — для IFITM3 (p = 0,00053).
Таким образом, варианты rs1800629 в гене TNF и rs17713054 в гене LZTFL1 могут быть рассмотрены как потенциальные кандидаты для дальнейшего анализа на расширенных выборках табл. 4.
ОБСУЖДЕНИЕ РЕЗУЛЬТАТОВ
В нашем исследовании мы демонстрируем подтверждающие доказательства участия локуса 3p21.31 человека в патофизиологии заболевания COVID-19 с использованием независимой когорты пациентов и контрольной группы населения Российской Федерации.
Ранее нами были проанализированы распределение 10 SNP и их ассоциация с тяжестью течения [11]. В настоящей работе, проведенной на большей выборке и с расширенным набором полиморфизмов, исключен полиморфизм в TLR7 и добавлен полиморфизм LZTFL1 и обнаружено, что всего два полиморфизма в генах LZTFL1 и TNF показывают сильную ассоциацию с тяжелым течением COVID-19.
Среди проанализированных полиморфизмов только два убедительно ассоциациированы с тяжестью течения. Интересно отметить, что после расширения выборки до 713 пациентов результаты для части полиморфизмов из раннего исследования [11] оказались статистически незначимыми. Тем не менее сильный сигнал был обнаружен в rs17713054 (ген LZTFL1, локус 3p21.3). Вторым по значимости был rs1800629 в гене TNF. Известно, что оба полиморфизма ассоциированы с тяжелым течением COVID-19 и носители минорных аллелей имеют повышенный риск развития тяжелого течения COVID-19 [12]. Полиморфизм rs17713054 располагается в энхансере, который регулирует экспрессию генов в этом локусе, включая LZTFL1 и SLC6A20, а также гены хемокинов.
Этот полиморфизм приводит к появлению нового сайта связывания для транскрипционного фактора C/EBP beta, что приводит к повышению экспрессии LZTFL1 и соседних генов в этом локусе [13]. Ген LZTFL1 участвует в цилиарной функции клеток эпителия легких, что важно для очистки дыхательных путей от вирусов [14].
LZTFL1 широко экспрессируется в эпителиальных клетках легких, включая реснитчатые эпителиальные клетки, которые были идентифицированы как одна из основных клеточных мишеней для инфекции SARS-CoV-2.
Кроме того, гомозиготная потеря LZTFL1 вызывает классическую цилиопатию: синдром Барде–Бидля [15]; известно, что респираторные вирусы могут воздействовать на мукоцилиарный клиренс. LZTFL1 кодирует цитозольный белок с мотивом лейциновой застежки, который связывается c E-кадгерином (эпителиальным маркером) и участвует в переносе многочисленных сигнальных молекул. Известно также, что активация LZTFL1 в контексте злокачественных новообразований ингибирует путь эпителиально-мезенхимального перехода (EMT), который, как известно, является частью как механизма заживления ран, так и иммунного ответа [16]. Исследование посмертных биоптатов легких пациентов, умерших от осложнений COVID-19, демонстрирует широко распространенную эпителиальную дисфункцию с признаками EMT [13]. Сигнал в локусе 3p21.31 остается наиболее устойчивым и сильным по данным нескольких исследований, что связано как с восприимчивостью к инфекции, так и с тяжестью заболевания [17].
Показано, что аллель риска rs17713054 A в энхансере гена LZTFL1, в значительной степени ответственен за двукратное увеличение риска дыхательной недостаточности от COVID-19, связанного с 3p21.31 [13]. LZTFL1 широко экспрессируется в эпителиальных клетках легких, включая реснитчатые эпителиальные клетки, которые были идентифицированы как одна из основных клеточных мишеней для инфекции SARS-CoV-2 [18].
Анализ других полиморфизмов гена LZTFL1, таких как rs11385942, показал повышенный риск госпитализации (р < 0,01; OR = 5,73; 95% CI: 1,2–26,5 по аллельному тесту) в колумбийской [19] и в латышской [20] популяциях; интронный вариант rs35280891 (p = 6,88 × 10–7; OR = 19,846, 95% CI: 5,728–68,761,) ассоциирован с тяжелым течением в сербской популяции [21].
Интересно отметить, что минорный аллель А rs17713054 является частью расширенного гаплотипа, унаследованного от неандертальцев. На сегодняшний день этот гаплотип представляет собой основной генетический фактор риска, связанный с тяжелыми симптомами после заражения SARS-CoV-2. Различия в частоте гаплотипа риска у населения Южной и Восточной Азии привели к предположению, что некое селективное давление, возможно, связанное с холерой, привело к его распространению среди жителей Южной Азии [22].
В нашем исследовании мы подтвердили сильную ассоциацию rs17713054 с тяжелым течением (OR = 4,56; p = 0,0025) в рецессивной модели.
Было также показано, что во всех вариантах выборок как минорный аллель варианта rs1800629 в гене TNF — Т, так и минорный генотип ТТ являются фактором риска развития тяжелой формы при значениях OR = 1,5; p = 0,02.
Известно, что вариант rs1800629 гена TNF связан с необходимостью респираторной поддержки и ее большей продолжительностью у пациентов с COVID-19 [23]. Кроме патогенных вариантов нами был также обнаружен rs1898830 в гене TLR2 с протективным действием (OR = 0,72).
Проведя исследование ассоциации 10 SNP, мы обнаружили, что два полиморфизма обладают достаточной силой для оценки рисков тяжелого течения.
Проведено исследование ассоциации LZTFL1 rs17713054 в РФ на сбалансированной выборке пациентов с тяжелым и легким течением, показавшим убедительную ассоциацию с тяжестью течения. Это подтверждает гипотезу о функциональном значении данного полиморфизма.
Простой, быстрый и недорогой тест, направленный на прогнозирование рисков тяжелого течения COVID-19 на основе индивидуальных полиморфизмов ДНК, был бы полезен как для стратификации пациентов с высоким и низким риском осложнений, а также, что более важно, для оценки тяжести заболевания в популяции здоровых людей в случаях инфицирования и последующего заболевания как перспективный прогностический тест.
ВЫВОДЫ
В генетическом исследовании выборки из 713 пациентов с подтвержденным диагнозом COVID-19, были найдены ключевые SNP в генах TNF и LZTFL1, связанные с тяжелым течением заболевания. Охарактеризован новый генетический маркер в гене LZTFL1, прогностическая ценность которого составила более 91%. Отклонения частот ассоциированных с рисками тяжелого течения COVID-19 генетических полиморфизмов от равновесия Харди–Вайнберга имеют важное эпидемиологическое значение и требуют дальнейшего изучения. Варианты rs1800629 в гене TNF и rs17713054 в гене LZTFL1 могут быть рассмотрены как потенциальные кандидаты для дальнейшего анализа на расширенных выборках. На основании проведенного клинического исследования можно сделать ряд выводов для дальнейшей клинической практики. Общий поток пациентов, поступающих в клиники с диагнозом острой респираторной коронавирусной инфекции, гетерогенен и на ранних этапах может быть разделен на группы пациентов с потенциально легким течением и потенциально тяжелым течением заболевания по факту наличия или отсутствия в генотипе пациента выбранных полиморфизмов TNF rs1800629 и LZTFL1 rs17713054. Полиморфизмы в генах LZTFL1 и TNF могут быть использованы не только как прогностические биомаркеры, но и как предиктивные и представлять собой научное обоснование новых подходов в генотип- ориентированной терапии больных с тяжелым поражением легких, связанным с COVID-19. Настоящее исследование предполагает перспективную возможность организации скрининговых исследований с очевидной экономической доступностью и эффективностью.