ОРИГИНАЛЬНОЕ ИССЛЕДОВАНИЕ
Оценка числа ВИЧ-специфичных Т-лимфоцитов у здоровых доноров по данным высокопроизводительного секвенирования репертуаров Т-клеточных рецепторов
Российский национальный исследовательский медицинский университет имени Н. И. Пирогова, Москва, Россия
Для корреспонденции: Шугай Михаил Александрович
ул. Миклухо-Маклая, д. 16/10, Москва, 117997; moc.liamg@yaguhs.liahkim
Финансирование: работа выполнена при поддержке Российского научного фонда, грант № 17-15-01495.
Вклад всех авторов в работу равнозначен: подбор и анализ литературы, планирование исследования, сбор, анализ и интерпретация данных, подготовка черновика рукописи, внесение исправлений.
Высокая мутабильность вируса иммунодефицита человека (ВИЧ) позволяет ему легко уходить от распознавания иммунной системой [1]. Тем не менее присутствие большого числа иммуногенных эпитопов ВИЧ [2] и протективных аллелей HLA (human leucocyte antigen) [3], а также феномен элитных контроллеров [4] указывают на потенциальную возможность иммунотерапии ВИЧ-инфекции. Хотя разработка протективной вакцины против ВИЧ до сих пор не увенчалась успехом, полученные данные показывают, что Т-клеточная терапия по своему терапевтическому потенциалу близка к антиретровирусной терапии [5].
В данной работе мы исходим из концепции, согласно которой эффективный иммунный ответ индивида против ранее не встречавшегося патогена определяется наличием и количеством специфичных Т-клеток в пуле наивных Т-лимфоцитов [6]. Понимание того, какие эпитопы ВИЧ при определенном наборе аллелей HLA донора наиболее благоприятны для распознавания вируса иммунной системой, позволит в конечном итоге определить механизмы иммунной протекции против ВИЧ и продвинуться в разработке эффективных вакцин против него.
Способность Т-лимфоцитов распознавать чужеродные антигены закодирована в генах альфа- и бета-цепей Т-клеточного рецептора (T-cell receptor, TCR), обладающих невероятным разнообразием: число уникальных последовательностей (вариантов) только для бета-цепи одного человека может превышать 109, а полное число исходно генерируемых тимусом вариантов TCR в человеческой популяции практически не ограничено [7]. Стремительно развивающиеся технологии массированного секвенирования иммунных репертуаров (RepSeq) позволяют одновременно считывать миллионы последовательностей TCR в выбранном образце, например в пробе мононуклеарных клеток периферической крови [8]. Существующие методы сортировки Т-клеток, специфичных к выбранным антигенам, в первую очередь с использованием окрашивания Т-клеток MHC-мультиметрами [9], позволяют накапливать знания об антиген-специфичных TCR. Это открывает возможности для применения RepSeq с целью функционального анализа индивидуальных репертуаров TCR. Так, постоянно пополняемая база данных последовательностей TCR с известной специфичностью (VDJdb, [10]) уже сегодня может быть использована для in silico аннотации и оценки числа эпитоп-специфичных Т-клеток в данных RepSeq.
Следует отметить, что практически невозможно точно подсчитать численность антиген-специфичных Т-клеток среди наивных Т-лимфоцитов стандартными методами, такими как проточная цитометрия: ввиду малого размера популяции (зачастую — менее 1 % [11]), специфичной к одному эпитопу, требуется обогащение, которое может потенциально исказить результаты [12]. В то же время технология RepSeq позволяет уверенно фиксировать Т-клетки с частотой порядка 0,001 % [13].
Имея в распоряжении большие данные, содержащие последовательности TCR 65 доноров из российской и 601 донора из американской популяций, а также набор из 1 688 TCR, для которых показано распознавание эпитопов ВИЧ (см. раздел «Материалы и методы»), мы можем изучить частоту ВИЧ-специфичных Т-клеток в популяции. В данной работе мы используем обозначенные данные для проверки следующих гипотез:
1) эпитопы ВИЧ значительно различаются по частоте специфичных Т-клеток в репертуарах TCR здоровых доноров;
2) наличие у донора цитомегаловирусной (cytomegalovirus, CMV) инфекции влияет на количество ВИЧ-специфичных Т-клеток;
3) число ВИЧ-специфичных Т-клеток зависит от присут- ствия у донора определенных аллелей HLA;
4) число ВИЧ-специфичных Т-клеток зависит от возраста и пола донора.
МАТЕРИАЛЫ И МЕТОДЫ
В работе использовали данные секвенирования бета-цепи TCR из работ Emerson и соавт. [14] и Britanova и соавт. [15]. Из работы Emerson и соавт. взяли только репертуары TCR доноров, для которых был определен гаплотип HLA и был известен CMV-статус — всего 601 образец. Из данных Britanova и соавт. исключили образцы пуповинной крови, в рассмотрение были взяты 65 образцов от взрослых здоровых доноров. Предобработку и картирование последовательностей TCR для данных из [15] провели с помощью инструментов MIGEC [16] и MiTCR [17]. Для данных из [14] провели дополнительное картирование, уточнение V- и J-генов, а также выполнили коррекцию ошибок секвенирования в последовательностях TCR с использованием инструмента MiXCR [18]. Данные были очищены от нефункциональных, содержащих стоп-кодон или сдвиг рамки считывания, последовательностей с использованием инструмента VDJtools [19].
Аннотация данных, т. е. предсказание TCR, специфичных к ВИЧ, проводилась с использованием инструмента VDJtools/VDJdb-standalone [10]. Из VDJdb выбрали TCR, специфичные к эпитопам ВИЧ, причем рассматривали только те эпитопы, которые представлены в базе данных более чем 10 вариантами TCR. TCR из данных RepSeq считали специфичным к определенному эпитопу ВИЧ, если аминокислотная последовательность его гипервариабельного региона CDR3 отличалась не более чем на одну замену от соответствующего варианта TCR в базе данных VDJdb. Подобный метод позволяет значительно увеличить число аннотированных TCR при небольшой доле ошибочных аннотаций, как показано в [10].
Статистический анализ результатов проводили с использованием языка программирования R. В работе применили статистические тесты ANOVA, пост-хок тест Тьюки, а также корреляционный анализ. В разделе «Результаты исследования» для каждого теста приведены значения тестовой статистики (F-статистики для ANOVA и коэффициента корреляции Спирмена R) и статистической значимости (p-value).
РЕЗУЛЬТАТЫ ИССЛЕДОВАНИЯ
Оценки частот TCR, специфичных к различным эпитопам, полученные методом проточной цитометрии, убедительно показывают, что доля специфичных Т-клеток в наивном (интактном) репертуаре сильно варьирует и может различаться на 1–2 порядка между эпитопами, при этом она достаточно стабильна между различными донорами [12]. Наши результаты для данных высокопроизводительного секвенирования TCR (рис. 1) подтверждают эти наблюдения: мы видим сильную зависимость частоты специфичных TCR от эпитопа (F = 2007, p < 10–100, ANOVA), что, однако, не связано с презентирующим аллелем HLA (F = 0,03, p = 0,86, ANOVA). При этом для данных из работ Emerson и соавт. и Britanova и соавт. наблюдается сильный сдвиг между оценками частот специфичных TCR (F = 1690, p < 10–100, в среднем частота выше для данных Emerson и соавт.), что может быть объяснено различиями в методике получения и структуре библиотек TCR. Так, в работе Emerson и соавт. использовали ДНК доноров и мультиплексную ПЦР, в то время как Britanova и соавт. использовали РНК, метод 5’RACE и молекулярное баркодирование [20]. Не вдаваясь в детальное описание различий приведенных выше методов, следует отметить, что молекулярное баркодирование позволяет значительно улучшить точность определения количества определенного TCR в образце [15].
Структура исследования Emerson и соавт. включала разделение доноров на две когорты по серологическому статусу — наличию или отсутствию цитомегаловирусной инфекции. Воспользовавшись этим, мы оценили влияние CMV-инфекции на частоту ВИЧ-специфичных TCR в репертуарах доноров. Как видно из рис. 2, частота ВИЧ-специфичных TCR выше для CMV-отрицательных доноров независимо от эпитопа ВИЧ, и отмеченное различие имеет высокий уровень статистической значимости (F = 495, p < 10–100, ANOVA). Следует отметить, что вариант анализа, при котором не учитывается разница в частоте ВИЧ-специфичных TCR между эпитопами, т. е. сравнение проводится для всех TCR без группировки по эпитопу, дает результат с намного меньшим уровнем статистической значимости (F = 61, p = 7 × 10–15, ANOVA).
Наличие информации о HLA-гаплотипе доноров в работе Emerson и соавт. позволило оценить число ВИЧ-специфичных TCR, учитывая совпадение аллелей HLA, способных представлять распознаваемый эпитоп ВИЧ, и аллелей HLA донора. Как видно из рис. 3, наибольшая доля ВИЧ-специфичных TCR наблюдается для аллелей HLA B27, B57 и B51, считающихся протективными [3]. Для этих 3 аллелей характерно статистически значимое увеличение числа ВИЧ-специфичных TCR по сравнению с 5 остальными (p < 0,01, пост-хок тест Тьюки), кроме различий между B51 и B08. Следует отметить, что достаточно малое количество анализируемых аллелей HLA обусловлено отсутствием для других аллелей известных эпитопов ВИЧ в базе VDJdb.
Возрастные изменения в структуре Т-клеточного репертуара были описаны в ряде ранее опубликованных работ [21], результаты которых можно свести к наблюдаемому падению разнообразия репертуара из-за клональных экспансий, вызванных хроническими инфекциями. Подобное падение разнообразия приводит к уменьшению числа Т-клеток, специфичных к ранее не встречавшимся патогенам, что также наблюдается для ВИЧ-специфичных Т-клеток (рис. 4): R = –0,35 (p = 0,003, здесь и далее — коэффициент корреляции Спирмена) для данных из работы Britanova и соавт. и R = –0,20 (p = 0,001) для CMV-отрицательных доноров из работы Emerson и соавт. В то же время для CMV-положительных доноров наблюдается менее выраженное падение числа ВИЧ-специфичных Т-клеток (R = –0,14, p = 0,03). Крупные клональные экспансии (> 5 % прочтений TCR), наблюдаемые у CMV+-доноров из работы Emerson и соавт., могут быть объяснены кросс-реактив- ностью ВИЧ-специфичных клонотипов к эпитопам CMV. Данные Britanova и соавт. показывают падение числа специфичных Т-клеток для мужчин (R = –0,53, p = 0,002), но не для женщин (p = 0,22), в основном обусловленное наличием среди них долгожительниц (возраст 80–100 лет), обладающих специфическими свойствами репертуара [15].
ОБСУЖДЕНИЕ РЕЗУЛЬТАТОВ
Как показывают наши результаты, медианная частота ВИЧ-специфичных Т-клеток в популяции здоровых доноров может различаться на 1–2 порядка в зависимости от рассматриваемых эпитопов ВИЧ, что хорошо согласуется с оценками, ранее полученными другими методами [11, 12, 22].При этом частота Т-клеток, специфичных к определенному эпитопу, отличается для разных доноров в значительно меньшей степени.
Следует отметить, что одним из основных факторов, определяющих частоту той или иной последовательности TCR в популяции, является вероятность сборки данной последовательности в ходе V(D)J-рекомбинации [7]. Этот процесс хорошо описывается существующими статистическими моделями [23], которые показывают, что параметры данного процесса достаточно стабильны между индивидами, и это согласуется с нашими результатами. Эти наблюдения говорят в пользу того, что оценка частоты ВИЧ-специфичных Т-клеток, полученная in silico, является важной и надежной характеристикой потенциала иммунного ответа против определенных эпитопов на популяционном уровне.
Таким образом, наши результаты предполагают, что для разработки эффективной стратегии вакцинации следует учитывать как пул эпитопов, которые могут быть представлены в контексте аллелей HLA конкретного индивида, так и наличие в иммунной системе достаточного числа наивных Т-клеток, распознающих эти эпитопы.
При анализе частот Т-клеток, способных распознавать эпитопы ВИЧ в контексте известных HLA донора, нами были обнаружены значительные различия по ним для разных HLA. При этом обнаруженные нами аллели HLA с наибольшей частотой ВИЧ-специфичных TCR соответствуют перечню протективных аллелей, приведенному в [23].
Кроме того, нами было обнаружено значительное снижение частоты ВИЧ-специфичных Т-клеток с возрастом и у доноров с CMV-инфекцией. Эти результаты согласуются с более общими наблюдениями уменьшения разнообразия Т-клеточного репертуара, вызванного старением и хроническими инфекциями, такими как CMV [24, 25, 26]. Следует отметить, что сравнение групп разного пола дает противоречивые результаты между исследованиями Emerson и соавт. и Britanova и соавт., обусловленное наличием когорты женщин-долгожителей во второй работе.
ВЫВОДЫ
Наше исследование показывает, что технология секвенирования иммунных репертуаров и соответствующий биоинформатический анализ позволяют детально изучить антиген-специфичные Т-клетки в репертуарах. Использование технологии RepSeq позволяет оценить частоту ВИЧ-специфичных Т-клеток в репертуарах здоровых доноров и определить факторы, которые влияют на этот показатель. С ростом базы данных аннотированных последовательностей TCR VDJdb данное исследование может быть дополнено результатами для новых эпитопов ВИЧ и аллелей HLA. В будущем изучение репертуаров TCR ВИЧ-инфицированных доноров с различными аллелями HLA, в том числе доноров-контроллеров, позволит определить, какие из ВИЧ-специфичных TCR, наблюдаемых в репертуаре наивных Т-лимфоцитов, имеют повышенную частоту и ассоциированы с контролем ВИЧ-инфекции.