ОРИГИНАЛЬНОЕ ИССЛЕДОВАНИЕ
Определение доли плодовой ДНК в плазме крови беременной женщины с помощью высокопроизводительного секвенирования набора частотных однонуклеотидных полиморфизмов
1 Национальный медицинский исследовательский центр акушерства, гинекологии и перинатологии имени В. И. Кулакова, Москва, Россия
2 ООО «ДНК-Технология», Москва, Россия
Для корреспонденции: Екатерина Шубина
ул. Академика Опарина, д. 4, г. Москва, 117997; moc.liamg@anibuhs.aniretakej
Финансирование: работа поддержана Министерством образования и науки Российской Федерации (соглашение № 14.607.21.0136, идентификатор проекта RFMEFI60715X0136).
Неинвазивный пренатальный ДНК-скрининг (НИПС) анеуплоидий по крови матери применяется для обнаружения хромосомных анеуплоидий (ХА) с 2011 г. [1]. Многочисленные клинические исследования показали, что важным параметром при проведении НИПС является доля плодовой ДНК [2, 3]. При недостаточном количестве плодовой ДНК снижается чувствительность теста и возможны ложноотрицательные результаты [3].
Долю плодовой ДНК просто определить в случае с беременностью плодом мужского пола. Для этого используют сравнение покрытия Y-хромосомы с покрытием остальных аутосом. Если женщина вынашивает плод женского пола, то оценка представленности плодовых фрагментов становится более сложной задачей.
Известные способы определения представленности плодовой ДНК среди всей свободной циркулирующей ДНК (сцДНК) основаны на выявлении и подсчете фрагментов, для которых можно определить их происхождение. Среди них использование фрагментов, специфичных для Y-хромосомы, которое возможно только для плода мужского пола; не зависящий от пола анализ по-разному метилированных фрагментов сцДНК [4], однонуклеотидных полиморфизмов [5–7], разницы длин фргаментов плодовой и материнской ДНК [8], распределения фрагментов плодовой ДНК по геному [9–11].
С помощью таргетного секвенирования однонуклеотидных полиморфизмов (SNP) помимо определения доли плодовой ДНК становится возможной генетическая идентификация образца. Кроме того, этот же подход можно использовать для неинвазивного определения отцовства и пренатальной диагностики [12, 13].
Целью данной работы была разработка тест-системы, позволяющей определять долю плодовой ДНК вне зависимости от пола плода с помощью таргетного секвенирования SNP.
МАТЕРИАЛЫ И МЕТОДЫ
Выбор однонуклеотидных полиморфизмов
По данным широкомасштабных популяционных исследований HAPMAP [14] (http://hapmap.ncbi.nlm.nih.gov/) были отобраны 73 полиморфизма с частотой встречаемости гетерозиготного генотипа, равной 49–51% для представителей популяции CEU (люди, произошедшие из западной и северной Европы), и 45–55% для представителей африканской (ASW), китайской (CHD, CHB) и японской популяций (JPT); отобранные полиморфизмы находились на расстоянии не менее 20 млн п.н. на 1–12 хромосомах. Для каждого из отобранных полиморфизмов подобрали специфичные праймеры для амплификации выбранного фрагмента. Праймеры отбирали таким образом, чтобы длина ПЦР- продукта была не более 110 п.н.
Образцы ДНК и плазмы
Оценку частоты встречаемости полиморфизмов в российской популяции проводили по результатам исследования 827 образцов ДНК, выделенных из крови доноров. Долю плодовой ДНК определяли в 87 образцах плазмы крови беременных женщин (в 45 образцах — у женщин с плодом мужского пола, в 42 — у женщин с плодом женского пола).
Оценка частоты встречаемости полиморфизмов в российской популяции
Поскольку широкомасштабных популяционных данных о частоте встречаемости различных полиморфизмов в российской популяции нет и для отбора полиморфизмов использовали данные, полученные для других популяций, частота встречаемости выбранных полиморфизмов в исследуемой популяции может отличаться от опубликованных данных. В работе проводили оценку частоты встречаемости в российской популяции с помощью таргетного секвенирования смешанных (пулированных) в равных концентрациях образцов ДНК доноров.
Проводили секвенирование 10 пулов из 827 образцов (51–114 образцов/пул). Перед смешиванием ДНК оценивали ее концентрацию с помощью метода полимеразной цепной реакции (ПЦР) в реальном времени. Для оценки частоты встречаемости полиморфизмов в популяции суммировали частоты встречаемости, полученные для каждого пула, с учетом количества образцов в пуле. Результаты оценки частоты встречаемости полиморфизмов, полученные с помощью пулирования, сравнивали с результатами, полученными секвенированием 87 отдельных образцов.
Определение доли плодовой ДНК
Оценку доли плодовой ДНК проводили с помощью секвенирования 53 частотных полиморфизмов, которые были отобраны на основании предварительных данных секвенирования пулированных образцов. Для определения доли плодовой ДНК использовали полиморфизмы, для которых представленность одного аллеля была более 80%, но менее 99,5%. В этом случае полагали, что мать имеет гомозиготный генотип, а плод гетерозиготный. Долю плодовой ДНК определяли по формуле ff = 2 • B / (A + B), где A — более представленный аллель, B — менее представленный аллель. В качестве значения доли плодовой ДНК использовали медиану значений для всех информативных полиморфизмов. Значение доли плодовой ДНК, определенные с помощью SNP, сравнивали со значением доли плодовой ДНК, определенным по покрытию Y-хромосомы.
Секвенирование
Библиотеки из ПЦР-продуктов подготавливали согласно рекомендациям производителя (Thermo Fisher Scientific Inc., США). Секвенирование проводили на приборах Ion Proton и Ion S5 (Thermo Fisher Scientific Inc., США) согласно протоколу производителя.
Анализ данных
Первичный анализ данных осуществляли с помощью программного обеспечения Torrent Server 4.4.3. Выравнивание на референсный геном версии GRCh37/hg19 проводили с помощью программного модуля TMAP (Thermo Fisher Scientific Inc., США), после чего для позиций на геноме, соответствующих выбранным полиморфизмам, подсчитывали количество прочтений для каждого из аллелей (разработанный авторами скрипт с использованием программного пакета pysam [15]), для анализа отбирали фрагменты только с качеством выравнивания не менее 30 и с длиной не менее 80% от ожидаемой длины фрагмента.
РЕЗУЛЬТАТЫ ИССЛЕДОВАНИЯ
Секвенирование пулированных образцов
Результаты секвенирования пулированных образцов представлены в табл. 1. После оценки работы системы в целом и частоты встречаемости отдельных полиморфизмов для дальнейшей работы было отобрано 53 SNP. Исключены полиморфизмы с низкой представленностью. В табл. 2 представлены результаты сравнения частоты встречаемости для 53 SNP по данным секвенирования пулированных образцов и по данным анализа 87 отдельных образцов. Медиана разницы, полученой двумя способами частоты встречаемости составила 3,4%.
Результаты определения доли плодовой ДНК
Среднее количество полиморфизмов, для которых у матери был гомозиготный генотип, составило 28 (25–32), из них информативных полиморфизмов было 14 (10–18). На рисунок представлено сравнение результатов определения доли плодовой ДНК с помощью SNP и по данным о покрытии Y-хромосомы, корреляция составила 0,7.
ОБСУЖДЕНИЕ РЕЗУЛЬТАТОВ
Проведена оценка встречаемости выбранных полиморфизмов в исследуемой популяции с помощью секвенирования пулированных образцов. Продемонстрировано, что при пулировании и при определении генотипов отдельных образцов получаются сопоставимые результаты. Показана возможность оценки доли плодовой ДНК с помощью таргетного секвенирования небольшого количества частотных полиморфизмов вне зависимости от пола плода. Корреляция результатов определения доли плодовой ДНК с применением таргетного секвенирования и по Y-хромосоме в нашей работе ниже, чем по упоминающимся в литературе данным об использовании сопоставимого количества полиморфизмов для определения доли плодовой ДНК [7], что можно объяснить использованием в работе этих авторов молекулярных индексов и подсчета отдельных молекул.
ВЫВОДЫ
Предложенный метод можно использовать для оценки частоты встречаемости аллелей в случае частотных полиморфизмов. Помимо определения доли плодовой ДНК, описанный подход может быть применен для идентификации образцов, неинвазивного определения отцовства и неинвазивной диагностики наследственных заболеваний в случае наследования от отца мутации, которой нет у матери.