ОРИГИНАЛЬНОЕ ИССЛЕДОВАНИЕ
Рак молочной железы: анализ спектра соматических драйверных мутаций с применением высокопроизводительного секвенирования
1 ООО «Генотек», Москва
2 Карельский научный центр Российской академии наук, Петрозаводск
3 Институт общей генетики имени Н. И. Вавилова РАН, Москва, Россия
4 Национальный медицинский исследовательский центр онкологии имени Н. Н. Блохина, Москва, Россия
5 Научно-исследовательский институт биомедицинской химии имени В. Н. Ореховича, Москва, Россия
Для корреспонденции: Ильинский Валерий Владимирович
Наставнический пер., д. 17, стр. 1, под. 14, 15, г. Москва, 105120; ur.ketoneg@ofni
Финансирование: работа выполнена при поддержке Министерства образования и науки РФ (идентификатор соглашения RFMEFI60716X0152).
Вклад всех авторов в работу равнозначен: подбор и анализ литературы, планирование исследования, сбор, анализ и интерпретация данных, подготовка черновика рукописи, внесение исправлений.
Рак молочной железы (РМЖ) является вторым по распространенности типом рака в мире, занимает первое место в структуре онкологической заболеваемости и второе — в структуре смертности среди женщин [1]. Заболеваемость РМЖ увеличивается с возрастом и особенно велика среди женщин 60–65 лет, при этом патология зачастую диагностируется на поздних стадиях, что и определяет высокий уровень смертности от нее. Наибольшую опасность представляет собой метастазирующий РМЖ, который крайне трудно поддается лечению, несмотря на применение комбинированных схем, включающих химио- и гормонотерапию, а также использование таргетных противоопухолевых препаратов. Общий уровень 5-летней выживаемости пациентов при РМЖ составляет 55 %. В этой связи представляется актуальной разработка подходов для более эффективного скрининга РМЖ и выбора средств для таргетной терапии, учитывающих молекулярно-генетические особенности опухолей.
Стремительное развитие технологий высокопроизводительного секвенирования (next-generation sequencing, NGS) привело к получению большого количества данных о генетических вариантах [2]. Идентифицировано множество мутаций, связанных с развитием РМЖ, в том числе соматические и герминальные мутации в генах PIK3CA, STK11/LKB1, CDH1, ATM, CHEK2, BRIP1, PALB2, а также мутации в высокопенетрантных генах TP53, PTEN, MLH1, BRCA1, BRCA2, ассоциированных с наследственными формами РМЖ [3].
Большинство мутаций, возникающих в опухолях, являются соматическими и играют важную роль в патогенезе онкологических заболеваний и развитии de novo резистентности к лекарственным препаратам. Поэтому многие исследования направлены на профилирование вариантов в образцах опухолей с применением NGS. В результате было идентифицировано значительное количество вариантов с неизвестной функцией. Для их описания необходимы математические алгоритмы, позволяющие обрабатывать большие массивы данных в автоматическом режиме, предсказывать потенциально патогенные мутации и отличать их от нейтральных изменений генома опухолевых клеток. Результаты подобных исследований могут быть использованы для разработки скрининговых и диагностических инструментов (включая технологии жидкостной биопсии), а также инструментов подбора таргетных противоопухолевых препаратов.
В настоящей работе представлены результаты анализа спектра мутаций в составе ключевых онкогенов при РМЖ с применением метода высокопроизводительного секвенирования и ранее разработанного биоинформатического алгоритма для функциональной аннотации мутаций и оценки их патогенности.
ПАЦИЕНТЫ И МЕТОДЫ
Для проведения исследования были получены образцы опухолей от 16 пациенток со злокачественными новообразованиями молочной железы в возрасте от 27 до 76 лет (средний возраст — 50,7 ± 11,3 года), проходивших комплексное обследование и получавших комбинирование лечение в Национальном медицинском исследовательском центре онкологии имени Н. Н. Блохина (Москва). Критериями включения в исследование были: возраст 18–70 лет, женский пол, наличие гистологически и цитологически подтвержденного диагноза «рак молочной железы». Критериями исключения являлись наличие других форм новообразований в анамнезе и беременность.
Стадию опухолевого процесса устанавливали согласно классификации TNM [4]. В исследование были включены пациентки со стадиями T1–3N0–3M0–1.
Работа была выполнена с соблюдением принципов добровольности и конфиденциальности. От всех пациентов были получены письменные информированные согласия на проведение исследования. Клиническая характеристика больных представлена в табл. 1.
Выделение ДНК и контроль качества
Выделение ДНК из образцов опухолевой ткани проводили с применением набора DNeasy Blood and Tissue Kit (Qiagen, США). Измельченные образцы опухолевой ткани после добавления буфера ATL обрабатывали протеиназой K и инкубировали при 56 °C до полного лизиса. Затем обрабатывали ферментом РНКазой А. Далее последовательно добавляли 200 мкл буфера AL и 96 % этанола. Полученную смесь переносили на спин-колонки и центрифугировали при 8 000 g в течение 1 мин. Затем образцы промывали с применением буферов AW1 и AW2 для удаления солей (гуанидина и SDS). Для элюции ДНК колонки обрабатывали буфером 1x Low-TE (дважды, по 30 мкл), затем инкубировали и центрифугировали согласно протоколу производителя. Контроль качества полученной ДНК проводили на флуориметре Qubit 3.0 (Thermo Fisher Scientific, США), а также с помощью электрофореза в 1 % агарозном геле с добавлением бромистого этидия.
Секвенирование таргетной панели онкогенов
Из образцов ДНК опухолей молочной железы готовили библиотеки с применением набора реагентов NEBNext Ultra DNA Library Prep Kit for Illumina (New England Biolabs, США). Двойное баркодирование библиотек проводили с помощью ПЦР с применением наборов реагентов NEBNext Ultra DNA Library Prep Kit for Illumina и NEBNext Multiplex Oligos for Illumina (Dual Index Primers Set 1, New England Biolabs). Контроль качества полученных библиотек фрагментов ДНК проводили на приборе Agilent Bioanalyzer 2100 (Agilent Technologies, США) с помощью набора реагентов этого же производителя High Sensitivity Kit в соответствии с протоколом производителя.
Для таргетного обогащения кодирующих регионов геномов опухолей использовали набор MYbaits Onconome KL v1.5 Panel (MYcroarray, США). Анализ проводили с применением системы высокопроизводительного секвенирования HiSeq 2500 (Illumina, США) методом парных прочтений длиной 100 нуклеотидов. Подготовку образцов и запуск секвенирования осуществляли согласно стандартным протоколам Illumina.
Биоинформатическая обработка данных
Для биоинформатической обработки полученных при секвенировании NGS-данных применяли ранее разработанный алгоритм [5]. На начальном этапе проводили оценку качества прочтений, полученных при секвенировании ДНК опухолей: последовательности, имевшие качество прочтения ниже 10, удаляли с помощью программного обеспечения Cutadapt [6]. После этого прочтения картировали на референсный геном hg19 (GRCh37.p13) с помощью алгоритма BWA (Burrows–Wheeler Aligner) [7]. ПЦР-дубликаты удаляли специализированной командой rmdup в составе программной платформы SAMtools [8].
Для поиска мутаций применяли инструмент MuTect [9]. В качестве значимых вариантов, рассматривали последовательности ДНК, число покрытий которых в результате секвенирования составило не менее 12.
Для оценки функционального эффекта обнаруженных мутаций проводили их аннотирование и предсказание их влияния на кодируемый белок на основе анализа геномных координат фрагментов с помощью программы SnpEff [10].
РЕЗУЛЬТАТЫ ИССЛЕДОВАНИЯ
С применением метода высокопроизводительного секвенирования на платформе Illumina мы провели скрининг образцов 16 опухолей молочной железы на наличие мутаций. Среди онкогенов в составе таргетной панели были исследованы BRCA1, BRCA2, ATM, CDH1, CHEK2, MRE11A, NBN, PALB2, PTEN, RAD50, RAD51C, TP53, SEC23B. В результате применения биоинформатического алгоритма для анализа данных были обнаружены 58 точечных мутаций в генах BRCA1, BRCA2, ATM, CDH1, CHEK2 и TP53, среди них — 19 гомозигот и 39 гетерозигот. Список уникальных мутаций представлен в табл. 2.
На рисунок представлено распределение частот встречаемости мутаций в генах, в которых их было обнаружено больше всего: ATM, TP53 и BRCA1. Наиболее часто встречающиеся мутации — c.376-283T>C (TP53), c.3994-193T>C и c.8010+186C>T (ATM), а также c.5215+66G>A (BRCA1).
Среди обнаруженных нами генетических вариантов по результатам биоинформатической обработки данных и аннотирования мутаций с применением баз данных были отобраны мутации с потенциально значимым влиянием на регуляторную или белковую последовательность. Для оценки патогенности и консервативности выявляемых генетических вариантов использовали данные, которые извлекали из таких источников, как COSMIC (Catalogue of Somatic Mutations In Cancer) [11] и dbNSFP [12]. Дополнительно для предсказания патогенности обнаруженных вариантов, оценки их эффекта на функцию кодируемого белка применяли утилиты SIFT (Sorting Intolerant From Tolerant) и PolyPhen2 [13, 14]. Информацию о частоте мутаций получали на основе данных проекта 1000 Genomes и консорциума ExAC [15, 16].
Всего в результате проведенного анализа отобрали 14 мутаций, влияющих на белковую последовательность: BRCA2 — c.4828G>A (p.Val1610Met), c.5070A>C (p.Lys1690Asn); TP53 — c.524G>A (p.Arg175His), c.469G>T (p.Val157Phe); CHEK2 — c.1289C>T (p.Thr430Ile); ATM — c.146C>G (p.Ser49Cys), c.4258C>T (p.Leu1420Phe), c.1192G>C (p.Asp398His); CDH1 — c.790C>T (p.Gln264), c.1342C>T (p.Gln448); BRCA1 — c.1865C>T (p.Ala622Val), c.384G>A (p.Met128Ile), c.54G>T (p.Met18Ile).
ОБСУЖДЕНИЕ РЕЗУЛЬТАТОВ
Для детекции известных мутаций в генах, связанных с риском развития РМЖ, в России получили наибольшее распространение методы, основанные на полимеразной цепной реакции. Однако на современном этапе развития методов генетической диагностики одной из наиболее перспективных технологий выявления генетических вариантов в клетках злокачественных опухолей является высо- копроизводительное секвенирование. При этом наиболее актуально его применение для изучения вариабельности исследуемых участков геномов опухолей, характеризуемых высокой генетической гетерогенностью. В данной работе нами был исследован методом высокопроизводительного секвенирования спектр мутаций ключевых онкогенов при РМЖ и проведено тестирование разработанного ранее алгоритма для биоинфоматической обработки NGS-данных.
Одним из наиболее детально изученных генов, играющих важную роль в патогенезе РМЖ, является TP53, регулирующий клеточный цикл, процессы апоптоза и репарации ДНК. Мутации в этом гене приводят к нарушению вышеуказанных процессов и способствуют развитию злокачественных новообразований. TP53 представляет собой онкосупрессор, мутации в нем обнаруживаются примерно в половине всех случаев онкологических заболеваний и более чем в 30 % случаев РМЖ. Что касается спорадического РМЖ, то при нем частота мутаций в гене TP53 варьирует от 25 до 86 % — в зависимости от стадии опухолевого процесса и методов детекции. Прогностическая значимость мутаций в TP53 при РМЖ была подробно изучена [17]. Среди мутаций, выявленных нами, чаще всего встречалась мутация c.376-283T>C: у 13 из 16 пациенток (81 %).
При РМЖ отмечена относительно высокая частота возникновения мутаций в генах BRCA1 и BRCA2, в особенности для некоторых форм РМЖ. Эти гены участвуют в регуляции многих клеточных процессов, обеспечивая прежде всего поддержание стабильности генома, гомологичную рекомбинацию при репарации разрывов двуцепочечной ДНК. Мутации в этих генах часто приводят к нарушению нормального протекания вышеуказанных процессов и являются этиологическим фактором развития наследственного РМЖ, значительно увеличивают индивидуальный риск развития рака. Примерно четверть всех случаев наследственного РМЖ ассоциирована с мутациями в BRCA1/2 [17].
В России распространены мутации в BRCA1, составляющие порядка 80 % всех мутаций в этих двух генах при РМЖ. К примеру, одной из наиболее часто встречающихся является мутация 5382insC (rs80357906), приводящая к сдвигу рамки считывания и потере функции кодируемым белком. Значительную долю обнаруженных нами вариантов также составили мутации в генах BRCA1 и BRCA2, при этом чаще всего встречалась мутация c.5215+66G>A (rs3092994) в гене BRCA1, обнаруженная у 9 из 16 пациенток (52,9 %).
Результаты общего анализа спектра мутаций в генах ATM, TP53 и BRCA1 в целом согласуются с данными литературы, в соответствии с которыми при РМЖ к наиболее часто встречающимся мутациям относятся изменения в гене TP53 [17]. Сопоставимы с известными данными и результаты оценки разнообразия генетических вариантов в генах BRCA1/2. Важно, что мутации в этих генах ассоциированы с неблагоприятным прогнозом и развитием инфильтративного протокового РМЖ. Наличие таких мутаций также учитывается при оценке объема хирургического вмешательства [17]. По нашим данным, из 12 пациенток с РМЖ и мутациями в генах BRCA1 и BRCA2 у 8 был диагностирован именно инфильтративный протоковый РМЖ. При этом наиболее часто (у 6 пациенток из 8) встречалась мутация c.5215+66G>A (BRCA1).
В результате биоинформатического анализа данных, полученных в ходе высокопроизводительного секвенирования, нами было обнаружено множество мутаций-драйверов в образцах злокачественных опухолей молочной железы. С применением различных баз данных были отобраны и аннотированы мутации со значимым функциональным эффектом. Всего нами было обнаружено 14 патогенных мутаций, оказывающих влияние на аминокислотную последовательность кодируемых белков. В каждом из исследованных образцов была обнаружена минимум одна такая мутация. Разработанный нами протокол для биоинформатического анализа NGS-данных позволяет обрабатывать их в автоматическом режиме.
ВЫВОДЫ
Высокопроизводительное секвенирование в комбинации с современными алгоритмами для биоинформатической обработки данных позволяет проводить поиск генетических вариантов и оценку функционального эффекта выявляемых мутаций в опухолях, что представляет интерес для применения данных технологий в медицинских целях. На сегодняшний день уровень развития методов NGS позволяет проводить молекулярную классификацию опухолей при РМЖ, определять подтипы опухолей в зависимости от спектра выявляемых мутаций и профиля экспрессии генов, подбирать на основе этих данных наиболее подходящие противоопухолевые препараты. Одной из главных текущих задач в сфере онкогенетики является поиск и разработка инструментов для идентификации биомаркеров РМЖ, удобных для клиницистов при постановке диагноза и назначении адекватной терапии. Следующим этапом в развитии данной области исследований должно стать совершенствование биоинформатических подходов, переход к системам автоматического анализа генетического профиля опухолей и внедрение технологий NGS в клиническую практику.