Статья размещена в открытом доступе и распространяется на условиях лицензии Creative Commons Attribution (CC BY).
ОРИГИНАЛЬНОЕ ИССЛЕДОВАНИЕ
Генофонд Урало-Поволжья: генетическая история населения Мордовии по данным филогеографии гаплогруппы N3a1-Y23475 Y-хромосомы
1 Медико-генетический научный центр имени Н. П. Бочкова, Москва, Россия
2 Московский государственный университет имени М. В. Ломоносова, Москва, Россия
Для корреспонденции: Анастасия Торосовна Агджоян
ул. Москворечье, д. 1, 115522, г. Москва, Россия; moc.liamg@nayohzdgaa
Финансирование: Государственное задание Министерства науки и высшего образования РФ для Медико-генетического научного центра им. академика Н. П. Бочкова.
Благодарности: авторы благодарят всех участников экспедиционного обследования (доноров образцов) и АНО «Биобанк Северной Евразии» (за предоставление коллекций ДНК).
Вклад авторов: Е. В. Балановская — руководство; А. Г. Штрунов-Шлыков — экспедиционное обследование популяций Мордовии; Г. Ю. Пономарёв, М. М. Воронина, Д. С. Адамов — генотипирование Y-SNP и Y-STR маркеров; А. Т. Агджоян, Г. Ю. Пономарёв, Д. С. Адамов, И. О. Горин, А. Ю. Потанина, С. М. Кошель — статистический, филогенетический, картографический анализ; Е. В. Балановская, А. Т. Агджоян — дизайн исследования и написание статьи.
Соблюдение этических стандартов: исследование одобрено этическим комитетом Медико-генетического научного центра имени Н. П. Бочкова (протокол № 1 от 29 июня 2020 г.).
Y-гаплогруппа N3 представляет один из базовых компонентов генофонда Северной Евразии и считается маркером экспансии древнего населения, в ходе которой распространялись уральские языки [1–2]. Основная часть ареала гаплогруппы N3 приходится на территорию России, где на сегодняшний день проживает более 1,6 млн носителей языков уральской лингвистической семьи из 20 этнических групп [3]. Более 90% численности носителей уральских языков РФ представляют финноязычные народы Урало-Поволжья трех языковых групп: марийской (марийцы), мордовской (мокша, шокша, эрзя) и пермской (бесермяне, коми-зыряне, коми-пермяки, удмурты). Из трех самых частых в Европе ветвей гаплогруппы N3 (N3a1, N3a3, N3a4) только для гаплогруппы N3a1 показана самая высокая и значимая корреляция с уральской предковой компонентой аутосомного генома [4].
Гаплогруппа N3a1 распространена в генофондах народов Уральского региона и редка за его пределами: у удмуртов (67%), коми-зырян (18–43%), чувашей (20%), хантов и манси (19%), коми-пермяков (12%), марийцев (14%) и мордвы (5–10%) [1]. Распространение N3a1 отличается значительным размахом частоты в ее ареале: от 1% на периферии ареала (у башкир, белорусов, карел, русских, хакасов) до мирового максимума у удмуртов (67%). Данная гаплогруппа, как и другие линии N3, могла быть привнесена в Европу населением, связанным с сейминско-турбинским межкультурным феноменом в бронзовом веке, хотя эта гипотеза пока не подтверждена при прямом анализе палеоДНК [5–6].
Структура гаплогруппы N3a1-B211, частой у финноязычных народов Урало-Поволжья, и датировки формирования ее ветвей изучены слабо, но общее представление о ней дают данные открытого ресурса YFull [7]. Среди участников коммерческого тестирования одной из частых в популяциях Урало-Поволжья является ветвь N3a1-Y23475, распространенная в западной части региона: у мордвы-эрзя, поволжских татар и русских (Брянской, Нижегородской, Пензенской, Кировской и Свердловской областей). Согласно данным YFull, активное накопление современного разнообразия внутри N3a1-Y23475 происходило в среднем за последние 2,4–2,7 тыс. лет.
Цель исследования — на основе обширных данных о популяциях народонаселения Северной Евразии изучить геногеографию и филогенетическую структуру гаплогруппы N3a1-Y23475.
ПАЦИЕНТЫ И МЕТОДЫ
Биологические образцы получены с письменного информированного согласия доноров в ходе экспедиционных обследований, проведенных под руководством профессора Е. В. Балановской и профессора РАН О. П. Балановского по единой программе, описанной ранее [8]. Донорами были неродственные мужчины, предки которых минимум на три поколения относили себя к данному этносу и родились в данной популяции. В Мордовии изучены этнические группы мокши и эрзи, в том числе обособленная группа эрзян-шокши Теньгушевского района, далее называемая как шокша.
Выделение ДНК из образцов венозной крови проводили с помощью станции выделения нуклеиновых кислот QIAsymphony SP или фенол-хлороформным методом с помощью протеиназы К, этапы пробоподготовки описаны ранее [9]. В общем массиве 4051 образцов (табл. 1) выявлены 395 образцов носителей гаплогруппы N3a1-B211 из 29 популяций Восточной Европы, Урало- Поволжья и Сибири. Для них проведено генотипирование Y-SNP-маркера Y23475 методом ПЦР в реальном времени с использованием TaqMan-зондов и технологии OpenArray на амплификаторе QuantStudio 12 Flex (Thermo Fisher Scientific, США). Выявлено 78 носителей ветви N3a1-Y23475. Из них для 74 образцов с помощью коммерческих наборов Yfiler Plus (Thermo Fisher Scientific, США), Powerplex Y23 (Promega, США) и генетического анализатора «Нанофор 05» («Синтол», Россия) получены результаты фрагментного анализа (37 Y-STR-маркеров).
Картографический анализ проводили с помощью оригинального картографического пакета «GeneGeo» [10], разработанного под руководством Е. В. Балановской и О. П. Балановского. Геногеографическая карта распространения гаплогруппы N3a1-Y23475 построена на основе данных генотипирования методом средневзвешенной интерполяции с радиусом влияния 400 км и степенью убывания весовой функции 3.
Филогенетическая сеть N3a1-Y23475 построена по принципу median-joining (медианные сети) [11] с помощью программы Network v.10.2.0.0 (Fluxus Technology Ltd, Англия). Изображение сети визуализировано в программе Network Publisher v.2.1.2.5 (Fluxus Technology Ltd, Англия). Вес каждого из 37 Y-STR маркеров принят равным 10 с параметром ε = 0. Расчет возраста ближайшего общего предка (TMRCA) для всей филогенетической сети и выделенных на ней кластеров (табл. 2) проведен методом ASD [12]. Исключен локус DYF387S1b из-за частичной AZFc-делеции в палиндроме P1 в образцах гаплогруппы N3-M178. Константа интенсивности мутаций для 36-маркерного гаплотипа выбрана по мировым данным [13–14] в размере 0,0038 на локус на поколение. Средний интервал одного мужского поколения принят как 31,5 года [15].
РЕЗУЛЬТАТЫ ИССЛЕДОВАНИЯ
Геногеография гаплогруппы N3a1-Y23475
Ареал гаплогруппы N3a1-Y23475 простирается с северо-запада на юго-восток (от вологодских русских до монголов), но с прерывистым и неравномерным распределением частоты (табл. 1). Основная часть (84%) носителей гаплогруппы сосредоточена в финноязычных популяциях Урало-Поволжья, где частота N3a1-Y23475 варьирует от 0,4% до 25% (рис. 1). Наиболее высоких частот гаплогруппа достигает в популяциях Мордовии, где сосредоточено более 70% ее носителей со следующими значениями частоты: 8% — у мокши, 9% — у эрзи и максимум (25%) — у теньгушевских эрзи-шокши (далее — шокши). Почти на порядок реже N3a1-Y23475 встречается у соседних тюркоязычных народов: мишарей (2%), казанских татар (1%) и крайне редко — у башкир (0,4%). В русских популяциях гаплогруппа редка: 3% — в Вологодской области и по 1% — в Белгородской, Калужской, Орловской областях (табл. 1). В Сибири и Центральной Азии гаплогруппа N3a1-Y23475 обнаружена у алтайцев (6%), а также у одного монгола.
Выявленная геногеография гаплогруппы N3a1-Y23475 требует рассмотрения двух вопросов: 1) о факторах, приведших к ее накоплению в популяциях Мордовии; 2) об источниках ее появления у алтайцев. Поиск ответов на эти вопросы проведен с помощью филогенетического анализа.
Филогенетическая структура и датировки кластеров-ветвей
Для всех популяций, где встречена гаплогруппа N3a1-Y23475, изучены образцы ее носителей по панели 37 Y-STR маркеров. Суммарно получено 74 гаплотипа (таблица в приложении), на основе которых построена филогенетическая сеть (рис. 2).
Использование 37 Y-STR маркеров позволило достигнуть высокого филогенетического разрешения: основная часть гаплотипов распределилась в шесть кластеров (рис. 2). Четыре кластера (Б, В, Г, Д) характеризуются абсолютной специфичностью: каждый из них сформирован образцами только из одной этнической группы Мордовии — эрзи, мокши или шокши. Кластеры А и Е включают в себя три специфичных субкластера, два из которых (А1 и Е1) также сформированы гаплотипами из популяций Мордовии. Для всех кластеров и субкластеров рассчитаны датировки их формирования (табл. 2 — возраст ближайшего общего предка, TMRCA).
Субкластеры А1 и кластер Б (рис. 2) мокши сформировались в один период — около 500 лет назад (табл. 2). Субкластер А1 включил четыре различных гаплотипа мокши из Инсарского района Мордовии (здесь и далее указаны места рождения дедов по отцу обследованных индивидов). Кластер Б представлен образцами мокши из трех соседних районов Мордовии: четыре образца — из Инсарского района, три — из Атюрьевского и один — из Ковылкинского.
Кластеры В и Д (рис. 2) эрзи сформировались около 900–1000 лет назад (табл. 2). Кластер В составляют представители Ичалковского района Мордовии, кластер Д — преимущественно соседнего Чамзинского района.
Кластер Г и субкластер Е1 шокши удалены друг от друга на филогенетической сети, хотя все индивиды происходят из популяций Теньгушевского района на северо-западе Мордовии. При этом датировки различаются почти в два раза: субкластер Е1 сформировался около 500 лет назад, кластер Г — около 900 лет назад (табл. 2).
Все гаплотипы казанских татар и мишарей расположились вне кластеров. Отдаленное сходство с ними выявлено для двух образцов мокши и двух образцов башкир (рис. 2), а также субкластера Г шокши.
Образцы русских также не формируют отдельный субкластер, но при этом вошли в состав наиболее гетерогенного кластера Е вместе с гаплотипами мокши, башкира и монгола, а также субкластерами шокши и алтайцев-теленгитов.
Гаплотипы алтайцев на филогенетической сети распределились между кластерами А и Е. Датировка кластера А, включающего единственный образец северного алтайца-кумандинца, составляет около 1150 лет.
Это значение в два раза превышает таковую для мокшанского субкластера А1, от которого и происходит алтайский гаплотип. Образцы южных алтайцев-теленгитов объединились в специфичный субкластер Е2, что указывает на их происхождение от единого предка. Возраст ближайшего общего предка для субкластера Е2 составляет около 800 лет (табл. 2).
Полученные нами результаты расчета возраста всей гаплогруппы N3a1-Y23475 по Y-STR гаплотипам (2340 ± 330 лет) в пределах погрешности согласуется с оценкой коллектива YFull [7], полученной по Y-SNP- маркерам (2700 ± 300 лет). Для половины Y-STR кластеров, выявленных при популяционном изучении, можно найти соответствие на филогенетическом древе YFull (табл. 2).
ОБСУЖДЕНИЕ РЕЗУЛЬТАТОВ
Выявленное накопление гаплогруппы N3a1-Y23475 в генофондах населения Мордовии и два импульса роста численности отражают их демографическую историю. Рост численности около 500 лет назад может быть связан с освобождением населения от системы зависимости от Монгольской империи и Золотой орды (длившейся с середины XIII до конца XV в.). Импульс роста численности около 1000 лет назад связывается с этапом оформления в X в. этнических очагов мокши (на Цне и в Присурье) и эрзи (в Потешье). Поздние рязанско-окские традиции, прослеживаемые по керамическому комплексу Шокшинского могильника, развивались в ареале шокши изолированно, наследуя и развивая черты керамики предшествующего времени [16].
Своеобразие генофонда шокши прослеживается как по высокой частоте N3a1-Y23475 (25% при 8–9% у мокши и эрзи), так и при анализе аутосомного генофонда. Метод ADMIXTURE выявил две предковые компоненты [17]. Одна предковая компонента («Мокша-Эрзя») объединяет только популяции мокши и эрзи, вторая («Шокша») — характерна только для популяций шокши. Обе предковые компоненты встречаются в геномах большинства русских популяций, указывая на вклад дославянского населения в русский генофонд (табл. 3).
Накопление гаплогруппы N3a1-Y23475 в народонаселении Мордовии можно объяснить последовательным действием двух факторов: миграции и эффекта основателя. Присутствие этой линии во всех мордовских популяциях указывает на ее наследование прапопуляцией мордвы из единого источника — вероятно, пришлых носителей гаплогруппы N3a1. Действие эффекта основателя предположительно проявилось уже после обособления этнических групп Мордовии. Это объясняет высокую специфичность кластеров и субкластеров (накопление гаплотипического разнообразия в пределах каждой популяции) и их структуру на филогенетической сети (рис. 2).
Дать предварительный ответ на вопрос об источниках появления гаплогруппы N3a1-Y23475 у алтайцев позволяют результаты филогенетического анализа N3a1-Y23475. Гаплотип северного алтайца-кумандинца наиболее близок к мокшанским (рис. 2, кластер А). Поскольку численность кумандинцев мала (2400 человек), единичная линия мокши могла появиться у них в результате массового расселения мордвы на Алтай в XIX–XX вв. [18]: в Алтайском крае в начале XX в. по численности мордва являлась третьим (после русских и украинцев) этносом.
Вопрос о популяции-источнике ветви N3a1-Y23475 у южных алтайцев связан с вопросом об ее прародине, которая гипотетически могла располагаться или в Уральском регионе («Уральская прародина»), или в Южной Сибири («Сибирская прародина»).
Южные алтайцы-теленгиты образуют на филогенетической сети собственный субкластер Е2, который вместе с двумя белгородскими образцами и монгольским восходит к самому частому гаплотипу шокши (рис. 2, кластер Е). Датировка субкластера Е2 указывает на возможность появления предка современных носителей ветви N3a1-Y23475 в ареале южных алтайцев-теленгитов около 800 лет назад (в интервале от 500 до 1100 лет назад).
Предпосылки гипотезы «Уральская прародина». Наибольшее разнообразие и кластеров, и единичных гаплотипов N3a1-Y23475 наблюдается в современных популяциях Урало-Поволжья, что косвенно указывает на возможность происхождения гаплогруппы на этой территории. В таком случае появление гаплогруппы N3a1-Y23475 у южных алтайцев и монголов связано с миграциями из Уральского региона на восток. При этом миграция на Алтай должна была происходить не позднее 500 лет назад, поскольку субкластер Е2 значительно обособлен от основного пула гаплотипов из популяций Урало-Поволжья.
Предпосылки гипотезы «Сибирская прародина». Альтернативная гипотеза помещает прародину гаплогруппы N3a1-Y23475 в Южную Сибирь. В пользу этой гипотезы свидетельствует ранее показанный общий вектор распространения гаплогруппы N с востока на запад [1]. В этом случае субкластер Е2 южных алтайцев-теленгитов сохраняет генетическую память о древних носителях гаплогруппы N3a1-Y23475, мигрировавших из Южной Сибири в Уральский регион. Кластер Е отличается от остальных на филогенетической сети (рис. 2) самой высокой популяционной гетерогенностью и наиболее древней датировкой (1710 ± 290 лет назад; табл. 2). В структуре кластера Е прослеживается значительное число ретикуляций, а между гаплотипами из разных регионов и обоими субкластерами — достаточно отдаленные взаимосвязи. Рассчитанные датировки указывают на формирование кластера Е в среднем лишь на 600 лет позже, чем всей гаплогруппы N3a1-Y23475. Оба эти наблюдения указывают на существование в прошлом многих субкластеров внутри кластера Е, от которых сохранились в современности только отдельные гаплотипы.
Гипотезе о южносибирской прародине гаплогруппы N3a1-Y23475 не противоречит характер ее распространения в современных популяциях, поскольку высокая частота и гаплотипическое разнообразие в популяциях Мордовии сформировались лишь за последнюю тысячу лет. Датировка кластера Е косвенно указывает на общий корень и южносибирских, и части поволжских, и всех русских популяций около 1700 лет назад. В этот период N3a1-Y23475 могла появиться в Южной Сибири в популяции носителей гаплогруппы N3a1-B211, мигрировавших на запад. Основатель субкластера Е2 может являться потомком этого населения, оставившего редкий след в генофонде современных южных алтайцев-теленгитов.
Имеющиеся данные пока не дают однозначного подтверждения справедливости той или иной гипотезы. Поэтому планируется провести анализ всего комплекса гаплогрупп и гаплотипов Y-хромосомы с целью проследить генетические связи генофондов Уральского региона и Южной Сибири.
ВЫВОДЫ
Гаплогруппа N3a1-Y23475 сформировалась в период 2,3– 2,7 тыс. лет назад, но ее активное накопление происходило преимущественно в популяциях Мордовии в период с X в. Высокая доля гаплогруппы во всех мордовских популяциях указывает на ее общий для них источник. Прослеживаются два импульса роста численности предков мордвы: около 1000 лет назад — у эрзи, около 500 лет назад — у мокши, а в популяции шокши зафиксированы оба импульса. Невысокая частота N3a1-Y23475 в популяциях тюркоязычных и славянских народов связана с субстратным пластом финноязычных народов в их генофондах. Наличие гаплогруппы N3a1-Y23475 у северных алтайцев-кумандинцев предположительно связано с миграцией мордовского населения на Алтай в XIX–XX вв. Источник N3a1-Y23475 у южных алтайцев- теленгитов требует проверки двух гипотез: «Уральской прародины» с незначительными миграциями на восток и «Сибирской прародины» с миграцией из Южной Сибири в Урало-Поволжье около 1700 лет назад.