ОРИГИНАЛЬНОЕ ИССЛЕДОВАНИЕ

Анализ частот 13 полиморфизмов в генах ТР53 и WRAP53 в российских популяциях

Информация об авторах

1 Медико-генетический научный центр имени академика Н. П. Бочкова, Москва, Россия

2 Институт общей генетики имени Н. И. Вавилова РАН, Москва, Россия

Для корреспонденции: Марина Викторовна Олькова
ул. Губкина, д. 3, г. Москва, 119991; ur.xobni@sciteneg

Информация о статье

Финансирование: исследование выполнено в рамках Государственного задания Министерства науки и высшего образования РФ для Медикогенетического научного центра им. академика Н. П. Бочкова (работы по фенотипированию образцов, созданию базы данных, анализу данных).

Благодарности: О. П. Балановскому, заведующему лабораторией геномной географии Института общей генетики им. Н. И. Вавилова, за руководство исследованием и правку статьи, всем донорам ДНК и АНО «Биобанк Северной Евразии» за предоставленную коллекцию образцов, а также Центру высокоточного редактирования и генетических технологий для биомедицины РНИМУ им. Н. И. Пирогова (Москва, Россия) за возможность использования молекулярно-генетических технологий.

Вклад авторов: М. В. Олькова — дизайн, статистический анализ, написание текста статьи; В. С. Петрушенко — биоинформатический анализ, Г. Ю. Пономарев — экспериментальные работы.

Соблюдение этических стандартов: исследование проведено в соответствии с требованиями Хельсинкской декларации Всемирной медицинской ассоциации. Все образцы для исследования получены из «Биобанка Северной Евразии». От всех доноров получено добровольное информированное согласие.

Статья получена: 26.11.2020 Статья принята к печати: 12.12.2020 Опубликовано online: 12.01.2021
|

Ген ТР53 отвечает за синтез одного из самых известных опухолевых супрессоров — белка р53, играющего ключевую роль в поддержании генетической стабильности клетки и предотвращении развития рака. Однажды активированный в процессе повреждения клетки, р53 запускает ряд клеточных реакций, направленных на восстановление и выживание клеток или, если восстановительный этап невозможен, на запрограммированную гибель клеток. Столь разнообразный плейотропный тканевый эффект белка р53 обусловлен суммарным влиянием клеточных коэкспрессированных изоформ р53. К настоящему моменту описаны по меньшей мере 12 изоформ р53, образуемых путем альтернативной инициации трансляции, использования альтернативных промоторов и альтернативного сплайсинга [1]. Все изоформы белка p53 содержат общий домен связывания с молекулой ДНК, но различные транс-активационный и ингибиторный домены, позволяющие им по-разному воздействовать на генную экспрессию [2].

Наследование в гене ТР53 аутосомно-доминантное, клинически связанное с риском развития синдрома Ли–Фраумени и других наследственных опухолевых синдромов. Подтверждено изменение чувствительности человека к определенным лекарственным препаратам при наличии ряда полиморфизмов этого гена (табл. 1).

Область гена WRAP53, содержащая как минимум три альтернативных промотора, располагается в регионе 13.1 короткого плеча 17-й хромосомы, частично перекрывая 5'-область гена TP53, по отношению к WRAP53 расположенного на противоположно направленной цепи по принципу «голова к голове» [3]. Функция гена WRAP53 двойственна. Во-первых, он кодирует  антисмысловую РНК (WRAP53α), которая, воздействуя на первый экзон ТР53, регулирует уровни мРНК p53, а также участвует в стимуляции выработки белка р53 за счет воздействия на 5'-нетранслируемую область мРНК p53 [4, 5]. Во-вторых, WRAP53 отвечает за синтез белка WRAP53β (также называемого WDR79 и TCAB1), который принадлежит к семейству WD40-протеинов. Этот белок обеспечивает целостность и нормальное функционирование телец Кахаля, необходимых для процесса созревания аппарата сплайсинга и биогенеза теломер [68]. WRAP53β также способствует накоплению фактора репарации 53BP1 в местах двухцепочечных разрывов ДНК, стимулируя восстановление структуры ДНК [9]. Белок WRAP53β предположительно обладает онкогенными свойствами, на что указывает его сверхэкспрессия в различных линиях раковых клеток, отсутствующая в норме [7, 8]. Следует отметить, что в настоящее время причастность этого белка к процессам онкогенеза подвергают сомнению: есть мнение, что сверхэкспрессия может быть вызвана участием WRAP53β в механизмах репарации ДНК при множественных разрывах ДНК, возникающих в случае развития в ткани онкологического процесса [7].

Для мутаций гена WRAP53 характерен аутосомнорецессивный тип наследования. Гомозиготное состояние по мутациям в этом гене может провоцировать развитие врожденного дискератоза, синдрома Ли–Фраумени.

Важная клиническая значимость генов ТР53 и WRAP53 и частое обнаружение герминальных дефектов этих генов при различных распространенных онкопатологиях [10] объясняют необходимость изучения частот их распространения в популяциях разных стран. Частоты полиморфизмов указанных генов уже достаточно детально изучены в некоторых европейских странах и США: подробную информацию о частотах как клинически значимых полиморфизмов, так и маркеров с пока еще неясным биологическим значением можно найти на сайтах таких проектов, как ClinVar [11] Национального центра биотехнологической информации США, Ensembl (совместный научный проект Европейского института биоинформатики и Института Сенгера) [12], Genome Aggregation Database (gnomAD) [13]. В России активно развивают сайт генетической энциклопедии, созданной сотрудниками Новосибирского государственного университета, «Генокарта» [14]. Наше исследование, посвященное изучению распространения и частот 13 полиморфизмов генов ТР53 и WRAP53 в российских популяциях, направлено на расширение научных знаний в этой области применительно к популяциям, проживающим в нашей стране.

ПАЦИЕНТЫ И МЕТОДЫ

Отбор образцов ДНК

Образцы ДНК для исследования были предоставлены «Биобанком Северной Евразии» [15]. ДНК была выделена по стандартной методике фенол-хлороформного выделения из крови и слюны. В работу было включено 1785 образцов ДНК добровольцев, принадлежащих к 28 российским популяциям, которые по географическому положению проживания охватывают основные регионы России (табл. 2). Критерии включения в исследование: принадлежность добровольцев к определенной этнической группе (самоидентификация добровольцев и их предков с данной этнической группой на протяжении четырех и более поколений). Критерии исключения: образцы, не соответствующие критерию принадлежности к этнической группе. Так как работа предполагала изучение аутосомных маркеров, распределение по полу при подборе образцов не учитывали.

Каждая популяция насчитывала от 30 до 87 человек. Состав обследованных популяций представлен в табл. 2. Следует учитывать, что в связи с тем, что изучаемые гены ТР53 и WRAP53 являются аутосомными, фактическое число включенных в работу аллелей было в два раза больше — от 60 до 174 аллелей для каждой популяции.

Отбор полиморфизмов для исследования

Список полиморфизмов в генах ТР53 и WRAP53 был составлен на основе генных вариантов, входящих в базу данных ClinVar и имеющих подтвержденную клиническую значимость (за исключением интронного варианта гена ТР53 — rs17881850). Интронный вариант rs17881850 был включен в исследование для сравнения частот аллелей в популяционно-нейтральном полиморфизме с популяционными частотами генных вариантов с подтвержденной клинической значимостью. К сожалению, значительную часть полиморфизмов из первоначального списка пришлось исключить после генотипирования, т. е. в расчет частот в популяциях были включены только те маркеры, для которых генотипирование во всех популяциях прошло успешно.

Генотипирование

Все индивидуумы были генотипированы по девяти экзонным полиморфизмам гена ТР53 (rs587781663, rs17882252, rs150293825, rs112431538, rs149633775, rs144340710, rs1042522, rs1800371, rs201753350) и одному его интронному варианту (rs17881850), а также по трем полиморфизмам гена WRAP53 (rs17880282, rs2287499, rs34067256). Генотипирование проводили с использованием технологии геномного анализа Illumina (Illumina Inc.; США) на основе биочиповых тест-систем. Для исключения некачественно типированных образцов использовали стандартное пороговое значение GenCall score, равное 0,15.

Основные данные по включенным в исследование полиморфизмам

Вся информация по изучаемым полиморфизмам была получена с сайта Национального центра биотехнологической информации США [16], в частности, из публичного архива ClinVar [17] и базы данных Genome Aggregation Database (gnomAD) [18]. Положение полиморфизма в геноме человека было указано исходя из GRCh38.p12 версии сборки референсного генома (табл. 1).

Так как для некоторых полиморфизмов информация в открытых источниках была неполной, все маркеры были дополнительно исследованы методом функционального анализа с помощью скрытых марковских моделей для прогнозирования функциональных эффектов миссенсвариантов белка на сайте fathmm (functional analisys through hidden Markov models) [19]. Для минимизации количества ложных срабатываний в анализе был выбран консервативный порог, равный –3,0. Полученные данные были внесены в табл. 1.

Математическая и статистическая обработка данных

Расчет популяционных частот альтернативных аллелей исследуемых полиморфизмов, расчет критерия χ2 и р-значения для оценки равновесия частот генотипов в популяциях, согласно правилу Харди–Вайнберга, оценка нормальности распределения частот альтернативных аллелей в исследуемых популяциях были произведены с использованием среды RStudio R, версия 4.0.2 (RStudio; США) и Microsoft Excel (Microsoft Corp.; США). Различия считали значимыми при р < 0,01.

Многомерное шкалирование

Для двумерного представления взаиморасположения популяций в пространстве на основе полученных частот альтернативных аллелей изучаемых генетических маркеров ТР53 и WRAP53 в статистическом пакете STATISTICA10 (StatSoft; США) был проведен анализ методом многомерного шкалирования с применением генетических расстояний Нея, рассчитанных в программе DJ genetic (ФГБНУ «МГНЦ»; Россия).

РЕЗУЛЬТАТЫ ИССЛЕДОВАНИЯ

Расчет частот альтернативных аллелей исследуемых маркеров в российских популяциях

На основе данных генотипирования 28 российских популяций были рассчитаны частоты альтернативных аллелей по девяти экзонным полиморфизмам гена ТР53 (2-й экзон —  rs201753350; 3-й экзон — rs1042522, rs1800371; 6-й экзон — rs144340710; 7-й экзон — rs112431538, rs149633775; 10-й экзон — rs587781663, rs17882252, rs150293825), одному интронному варианту ТР53 (rs17881850), а также по трем полиморфизмам второго экзона гена WRAP53 (rs17880282, rs2287499, rs34067256). Данные по полученным частотам альтернативных аллелей данных маркеров в популяциях отражены в табл. 2.

Взаимосвязь частот альтернативных аллелей и равновесия Харди–Вайнберга

Для оценки равновесия Харди–Вайнберга по изучаемым маркерам ТР53 и WRAP53 в популяциях были произведены расчеты критерия χ2 с учетом существующего соотношения аллелей и их рассчитанных по правилу Харди–Вайнберга частот в популяции. Для визуализации взаимосвязи частот альтернативных аллелей и равновесия Харди–Вайнберга была составлена табл. 3. В пяти из 28 исследованных популяций («Центральный Кавказ», «Дагестан», «северные русские», «татары» и «Закавказье») по большинству маркеров наблюдается сочетание повышенных (по сравнению с указанными в табл. 2 соответствующими им по происхождению референсными частотами в мировых популяциях) частот альтернативных аллелей и их неравновесного состояния в популяциях (оранжевые ячейки). Это позволяет предположить, что на состояние исследуемых аллелей в этих популяциях могли оказать влияние внешние факторы — например, случайный инбридинг. Ошибки при генотипировании также могут сказываться на полученных результатах.

В популяции «юго-восточные русские» наличие альтернативных аллелей было обнаружено для многих маркеров, их частоты также были выше, чем в референсной европейской популяции, однако состояние аллелей в популяции не отклонялось от равновесия Харди–Вайнберга.

В нескольких популяциях («коми и удмурты», «сибирские татары», «западный Кавказ») разнообразие найденных маркеров было выше, чем в соответствующих им по происхождению референсных популяциях, однако при этом их частоты были низкими, близкими к референсным, и подчинялись правилу Харди–Вайнберга. Среди исследуемых маркеров два (rs1042522, находящийся в третьем экзоне ТР53, и rs2287499, принадлежащий второму экзону гена WRAP53) отличались высокими частотами и соответствием правилу Харди–Вайнберга во всех популяциях.

Оценка нормальности распределения частот альтернативных аллелей в популяциях

Так как нейтральные аллели теоретически не должны подвергаться воздействию отбора и их частоты в популяциях могут подчиняться закону нормального распределения, для дополнительной оценки нейтральности изучаемых альтернативных аллелей была выполнена оценка нормальности распределения частот маркеров в популяциях с помощью теста Шапиро–Уилка. Результаты теста позволили подтвердить гипотезу о нормальном распределении для двух маркеров — rs1042522 (W = 0,95, p = 0,18) и rs2287499 (W = 0,97, p = 0,46). Для остальных маркеров нормальность распределения не подтвердилась.

Анализ популяционных частот маркеров методом многомерного шкалирования (ММШ)

В нашем случае многомерное шкалирование — это способ наиболее эффективного размещения изучаемых популяций в пределах плоскости, позволяющий приближенно оценить генетические расстояния между ними. ММШ выполнили для 29 популяций (татарская и африканская популяции были исключены ввиду резкого отличия частот их маркеров от данных для основного пула популяций) (см. рисунок). Для выполненного ММШ уровень стресса составил 0,068, а алиенации — 0,058.

Популяции были предварительно помечены как принадлежащие к одной из трех групп: азиатской, европейской и кавказской. Следует отметить группировку популяций на графике (см. рисунок) в зависимости от происхождения, позволившую выделить три соответствующих кластера — азиатский, европейский и кавказский. При этом в азиатском и европейском кластерах, имеющих значительную область пересечения, популяции расположены ближе друг к другу по значениям частот полиморфизмов, а в кавказском наблюдается большой разброс по частотам между популяциями.

Азиатский кластер имеет достаточно четкие границы. Единственное исключение — объединенная популяция, в состав которой входят казахи, каракалпаки, уйгуры и ногайцы; локация этой популяции вне кластера обусловлена более высоким содержанием в ней некоторых равновесных маркеров по сравнению с остальными азиатскими популяциями (табл. 3).

Европейский кластер имеет более компактную форму с высокой плотностью популяций вокруг центральной референсной европейской популяции, значения частот маркеров которой взяты из открытых источников. Три европейские популяции оказались вынесены далеко за пределы кластера — «северные русские», «юго-восточные русские» и объединенная популяция мари и чувашей. «Северные русские» — единственная европейская популяция, в которой наблюдались повышенные частоты многих маркеров, отсутствующих в других европейских популяциях, находящиеся при этом в неравновесном состоянии (табл. 3). Популяция «юго-восточные русские», для которой характерны повышенные частоты некоторых нетипичных для европейских популяций полиморфизмов, большинство из которых находится в равновесии Харди– Вайнберга (табл. 3), вынесена за пределы европейского кластера в противоположную сторону графика, по сравнению с популяцией «северные русские». «Мари и чуваши» оказались в глубине азиатского кластера, что, возможно, обусловлено антропологическим составом чувашей, в котором помимо индивидов европеоидного типа в значительной мере присутствуют индивиды монголоидного типа и смешанные формы.

Для всех популяций кавказского кластера, кроме популяции «Западный Кавказ», оказавшейся в области пересечения с азиатским кластером и поблизости от европейского кластера,  характерно присутствие повышенных частот большинства анализируемых полиморфизмов в сочетании с их неравновесным состоянием в популяциях (табл. 3), что сближает их по указанным параметрам с «северными русскими» (см. рисунок).

ОБСУЖДЕНИЕ РЕЗУЛЬТАТОВ

Выполненное исследование полиморфизмов генов ТР53 и WRAP53 в 28 популяциях, охватывающих все основные регионы России, позволило оценить частоту и распространенность включенных в исследование маркеров в разных российских регионах и народах.

Оценка частот альтернативных аллелей исследуемых маркеров в российских популяциях позволила выявить две основные тенденции:

  • для двух из 13 исследованных маркеров (rs1042522, находящегося в третьем экзоне ТР53, и rs2287499, принадлежащего второму экзону гена WRAP53) характерны высокие частоты во всех популяциях, нормальное распределение частот маркера в популяциях и соответствие аллелей равновесию Харди–Вайнберга;
  • для пяти популяций («Центральный Кавказ», «Дагестан», «северные русские», «татары» и «Закавказье») частоты большинства маркеров (кроме упомянутых rs1042522 и rs2287499, а также клинически доброкачественного rs144340710 из 6-го экзона гена ТР53) оказались повышенными, при этом аллели этих маркеров находились в неравновесном состоянии. В татарской популяции наличие, частоты и распространенность альтернативных аллелей изучаемых полиморфизмов оказались значительно выше референсных мировых значений, а также заметно отличались в большую сторону от частот и представленности этих полиморфизмов в основном пуле российских популяций (табл. 2). Указанный факт требует дальнейшего изучения.

Два широко распространенных и равновесных маркера, rs1042522 в гене ТР53 и rs2287499 во WRAP53, указаны в базе данных ClinVar как доброкачественные. Это значит, что частота маркера слишком высока, чтобы он мог быть патогенной мутацией; он встречается в гетеро- и гомозиготном состоянии в отсутствие тяжелого заболевания по этому гену; отсутствует ассоциация с заболеванием в исследованиях «положительный/ отрицательный контроль» при статистически оптимальной выборке [20]. Тот факт, что альтернативный аллель полиморфизма rs1042522, входящего в состав ДНКсвязывающего домена р53 [21], во всех популяциях доминирует по частоте по сравнению с референсным, может говорить о том, что в референсном геноме случайным образом оказался зафиксирован минорный аллель. Это предположение косвенно подтверждает упоминание о том, что альтернативный вариант Arg72 белка р53 обладает лучшей функциональной способностью индуцировать апоптоз и предупреждать развитие рака по сравнению с референсным Pro72 вариантом [22].

Несмотря на определение rs1042522 и rs2287499 в научных базах данных как клинически доброкачественных маркеров, в литературе встречается множество данных об их участии в онкогенезе. В частности, для полиморфизма p53 Pro72Arg (табл. 1) было показано, что гетерозиготный вариант Arg/Pro связан с повышенным риском развития меланомы по сравнению с гомозиготным вариантом Pro/Pro [23]; в другой работе была показана связь генотипа Pro/Pro данного маркера с повышенным риском немелкоклеточного рака легких у пациентов из Московской области [21].

Существует множество литературных источников, посвященных изучению выживаемости пациентов с онкологическими заболеваниями при гомо- и гетерозиготном состоянии по Pro72Arg, однако они также содержат противоречивую информацию. Есть свидетельства повышения среднего времени выживания у пациентов с раком шейки матки с генотипом Arg/Pro по сравнению с пациентами с генотипами Arg/Arg и Pro/Pro [24], однако обширное исследование датских ученых [25] показало отсутствие связи указанного полиморфизма с более низкой смертностью от рака и более низкой заболеваемостью раком в общей популяции.

Однако rs1042522 в большей степени известен как маркер, входящий в состав экспертной панели фармакогенетической базы данных Pharmacogenomics Knowledgebase, который связан с измененной реакцией организма на некоторые противоопухолевые препараты [26]. Есть данные о высокой корреляции аллеля p53 Pro с токсичностью при химиотерапии [27], а также о том, что генотипы Pro/Pro коррелируют с более низкой скоростью ответа на химиотерапию фторурацилом у пациентов с раком желудка по сравнению с генотипом Arg/Arg [28].

Клиническое значение маркера rs2287499 гена WRAP53 менее изучено, однако есть свидетельства существования умеренного неравновесия по сцеплению между исследуемыми маркерами rs1042522 и rs2287499. Сочетание их гаплотипов CA/GC связано с повышенным риском рака молочной железы, а сочетание GA/CC, напротив, играет протективную роль при этом заболевании [29].

Представленность и частоты других исследованных полиморфизмов в российских популяциях достаточно сильно варьируют, но для большинства из них рассчитанные частоты соответствуют референсным значениям частот этих маркеров для азиатской и европейской популяций, в соответствии с происхождением рассмотренных российских популяций. Исключение составляют пять перечисленных выше популяций, в которых частоты этих маркеров повышены. Клиническое значение некоторых изученных полиморфизмов (например, интронного варианта rs17881850) остается неясным, однако недавно появились сведения о том, что интронные полиморфизмы гена ТР53 также могут иметь клиническую значимость [30].

ВЫВОДЫ

Исследование позволило получить данные по частотам герминальных полиморфизмов генов ТР53 (10 маркеров из пяти экзонов и одного интрона) и WRAP53 (три маркера из второго экзона) для 28 популяций России. Для большинства популяций полученные значения частот полиморфизмов близки к таковым в соответствующей их происхождению референсной мировой популяции (азиатской или европейской). Шесть популяций отличаются повышенными относительно референсных частотами маркеров («Центральный Кавказ», «Дагестан», «северные русские», «юго-восточные русские», «татары» и «Закавказье»), при этом во всех указанных популяциях, кроме «юго-восточных русских», аллели маркеров с повышенными частотами не подчиняются правилу Харди–Вайнберга. Для татарской популяции характерны особенно высокие частоты неравновесных аллелей полиморфизмов, что говорит о необходимости их более глубокого изучения в данной популяции для выяснения причины таких различий.

КОММЕНТАРИИ (0)