ОРИГИНАЛЬНОЕ ИССЛЕДОВАНИЕ
Идентификация микроорганизмов с помощью инфракрасных Фурье-спектров
1 Институт биохимической физики имени Н. М. Эмануэля РАН, Москва, Россия
2 Национальный медицинский исследовательский центр сердечно-сосудистой хирургии имени А. Н. Бакулева, Москва
3 Национальный медицинский исследовательский центр акушерства, гинекологии и перинатологии имени В. И. Кулакова, Москва, Россия
4 Институт общей генетики имени Н. И. Вавилова РАН, Москва, Россия
5 Московская государственная академия ветеринарной медицины и биотехнологии имени К. И. Скрябина, Москва
Для корреспонденции: Алексей Борисович Шевелев
ул. Косыгина, д. 4, г. Москва, 119334; moc.liamtoh@a_levehs
Идентификация видовой принадлежности микроорганизмов важна в медицинской микробиологии. В частности, экспресс-идентификация патогена необходима для выбора схемы антибиотикотерапии при лечении гнойных инфекций и сепсиса. Эти заболевания характеризуются стремительным течением и служат одной из частых причин летальных исходов при проведении операций на сердечно-сосудистой системе [1], а также у родильниц и новорожденных детей [2].В настоящее время во всем мире для окончательной идентификации возбудителей гнойно-воспалительных заболеваний, помимо традиционных микробиологических, широко используются новые методы, в частности, метод матричной лазерной десорбционной ионизационной времяпролетной масс-спектрометрии (MALDI-ToF MS). Из наиболее распространенных приборов можно назвать MALDI-ToF масс-спектрометры марок MALDI BioTyper (Bruker; Германия) и Vitek MS (Biomerieux; Франция). Они дают быстрые и достоверные результаты, однако имеют высокую стоимость и пока недоступны для повсеместного использования в лечебных учреждениях. Кроме того, приборы достаточно громоздки и неудобны для работы в полевых условиях, что препятствует их использованию структурами, отвечающими за биологическую безопасность населения.В качестве возможной альтернативы MALDI ToF масс-спектрометрии для идентификации микроорганизмов может быть рассмотрен метод инфракрасной колебательной Фурье-спектроскопии (Fourier transformation Infrared, FTIR). Он позволяет анализировать химический состав культуры по содержанию любых типов макромолекул и низкомолекулярных соединений. Подготовка образцов культур к анализу толь же проста, как и в случае MALDI ToF масс-спектрометрии: достаточно поместить культуру на подложку из материала, прозрачного в ИК-области спектра и высушить. Спектроскопия FTIR может рассматриваться в качестве метода экспресс-диагностики. Однако ее использование в практической микробиологии ограничено изменчивостью FTIR-спектров культуры в зависимости от состава среды культивирования и фазы ее роста. Целью работы была разработка алгоритма идентификации микроорганизмов в чистых культурах, основанного на анализе FTIR-спектров культур, позволяющем надежно идентифицировать культуру в любой фазе роста на среде любого состава.
МАТЕРИАЛЫ И МЕТОДЫ
Штаммы патогенов человека
В работе использовали штаммы наиболее распространенных возбудителей гнойно-септических инфекций человека: S. aureus (20 изолятов с фенотипом MRSA и 47 изолятов без лекарственной устойчивости), E. faecalis (n = 10), E. faecium (n = 10), K. pneumoniae (n = 10), E. coli (n = 10), S. marcescens (n = 10), E. cloacae (n = 10), A. baumannii (n = 10), P. aeruginosa (n = 10), S. epidermidis (n = 10) и C. albicans (n = 10).
Возбудители гнойно-септических инфекций человека были выделены от больных, проходивших лечение в стационарах ННПЦССХ им. А. Н. Бакулева и НМИЦ АГП им. В. И. Кулакова. Выделение и типирование штаммов осуществляли по стандартной методике [3] с использованием дифференциально-диагностических сред: элективного солевого агара для стафилококков, агара для выделения энтерококков, агара Эндо-ГРМ для выделения грамотрицательных палочек, включая энтеробактерии и P. aeruginosa, среды Сабуро и мясо-пептонной среды с добавлением 1% глюкозы для C. albicans. Подтверждение принадлежности изолятов к указанным видам патогенов проводили с помощью масс-спектрометра MALDI BioTyper (Bruker; Германия).
Изоляты, заранее депонированные при –70 °С с использованием системы длительной криоконсервации «Криобанк», первоначально высевали на кровяной агар в аэробных условиях при 37 °С в течение суток. Каждый изолят высевали на агаризованную и жидкую среду двух типов: с содержанием крови и без нее — всего четыре типа сред для каждого изолята. В качестве сред без содержания крови использовали желточно-солевой и мясо-пептонный бульон, бульон Эндо и среду Сабуро. Материал для анализа методом спектроскопии FTIR собирали через 12, 24 и 48 ч.
С целью исключения опасности инфицирования оператора FTIR-спектрометра, а также с целью консервации культур патогенов при закладке на хранение, до снятия спектров их инактивировали добавлением 70% спирта. Для этого из свежих жидких культур отбирали по 30 мкл, помещали в полипропиленовую микропробирку и добавляли 70 мкл 96% этанола, перемешивая пипетированием. Материал с поверхности агаризованных сред отбирали микробиологической петлей и суспендировали в 70% водном этаноле из расчета 30 мг биомассы на 100 мкл спиртового раствора.
Регистрация ИК-спектров культур изолятов
Для регистрации ИК-спектров изолятов использовали фиксированные в 70% водном этаноле суспензии культур патогенов. Процедура подготовки проб индивидуальных патогенов к измерению методом ИК-спектроскопии «на пропускание» состояла в том, что на поверхность стандартных (диаметр 12,5 мм, толщина 2 мм) ZnSe- подложек (Электростекло; Москва) микропипеткой наносили 5–10 мкл конкретной суспензии, которую затем высушивали на воздухе до полного испарения этанола (5–15 мин). Все спектры регистрировали с помощью FTIR-спектрометра Spectrum Two (Perkin-Elmer; США) в интервале волновых чисел 4000–600 см-1 при оптическом разрешении 4 см-1 (цифровое разрешение 1 см-1). Для записи спектров культур изолятов ZnSe-подложку с нанесенной пробой патогена устанавливали вертикально в специальный держатель образцов «Microfocus» (Perkin- Elmer; США) на пути горизонтального зондирующего ИК-луча прибора и аккумулировали с усреднением 16 индивидуальных сканов (около 2 мин). Для записи фонового спектра прибора в идентичных условиях использовали чистую стандартную ZnSe-подложку, а сам фоновый спектр регулярно обновляли незадолго до регистрации ИК-спектра каждой новой пробы патогена.
Анализ данных
После исключения аномальных спектров полученные исходные данные состояли из 347 спектров чистых культур: 188 спектров S. aureus (39 — с MRSA-фенотипом, 48 — с MSSA-фенотипом (methicillin-sensitive S. aureus), 101 — не охарактеризованные по наличию фенотипа устойчивости к антибиотикам) и 169 спектров других патогенов (14 — A. baumannii, 32 — C. albicans, 8 — E. cloacae, 21 — E. faecalis, 20 — E. faecium, 11 — E. coli, 17 — K. pneumoniae, 18 — P. aeruginosa, 8 — S. marcescens, 188 — S. aureus, 10 — S. epidermidis); 10 спектров смешанных культур: 2 — S. aureus (MRSA) + E. coli, 2 — S. aureus (MSSA) + E. coli, 2 — S. aureus (MRSA) + K. pneumoniae, 2 — S. aureus (MSSA) + K. pneumoniae, 2 — S. aureus (MSSA) + P. aeruginosa. На рис. 1 представлены исходные спектры, использованные при анализе.
С помощью широко известных в спектроскопии рутинных алгоритмов все исходные спектры подвергали предварительной обработке для приведения всего набора к единому формату и устранения артефактов, вызванных, например, искривлением базовой линии спектров или флуктуациями в атмосфере содержания влаги и углекислого газа. Для этого исходные спектры нормировали на среднее пропускание, после чего рассчитывали первую производную от огибающей спектра, а принимаемые в расчет диапазоны спектральных данных ограничивали интервалами волновых чисел 600–1800 см-1 и 2800–3000 см-1. Поскольку исходные спектры изначально были хорошего качества и не требовали предварительного сглаживания, расчет производной проводили с помощью формулы симметричной разности по двум точкам для численного дифференцирования. На рис. 2 представлены спектры после предобработки.
На основе предобработанных спектров строили модель, позволяющую идентифицировать присутствие в образце S. aureus. Кроме того, на основе спектров S. aureus по наличию MRSA/MSSA-фенотипа была построена модель, дискриминирующая MRSA- и MSSA-штаммы. Для построения обеих моделей использовали спектры только чистых культур. Спектры смешанных культур использовали только для валидации полученных моделей. Обе модели строили с помощью пошагового применения метода главных компонент (principal component analysis, PCA) и линейного дискриминантного анализа (linear discriminant analysis, LDA) [4]. Линейный дискриминантный анализ [5] позволяет вычислить линию (или гиперплоскость), в проекции на которую две (или более) группы разделяются наиболее эффективно. Эффективность разделения групп определяется отношением межгрупповой дисперсии к внутригрупповой. Но из-за особенностей матричных вычислений, принятых в методе, при анализе спектральных данных он не используется напрямую, так как имеется большое количество коррелированных признаков и неинформативных участков. Поэтому перед применением LDA, как правило, используют метод главных компонент, в котором выделяют наиболее информативную и некоррелированную часть информации, имеющуюся в данных. В качестве оценки информативности в методе используется дисперсия: если на каком-то волновом числе дисперсия небольшая, то почти все спектры ведут себя в этой области одинаково и такой участок не несет полезной информации. Выделение информативной и некоррелированной информации в PCA выполняется также путем проецирования данных на соответствующие направления — главные компоненты. Фактически, модель, получаемая с помощью PCA-LDA, является проецированием спектральных данных на новое направление, что на практике означает расчет линейной комбинации с определенными коэффициентами.
Построенные модели валидировали методом скользящего контроля [6]. Суть его заключается в проведении серии слепых контролей: исходные спектры разбивают случайным образом на k частей, одна из частей (тестовая) отбрасывается, а к оставшимся k – 1 частям (обучающим) применяется PCA-LDA, и полученная модель предсказывает значения для тестовой части так, как-будто она не была известна на момент построения модели; данная процедура повторяется для каждой из k частей. Усреднив результаты на тестовых частях, можно получить оценку предсказательной модели на новых неизвестных спектрах. Однако при разбиении на k частей важно контролировать, чтобы спектры, относящиеся к одному и тому же изоляту, попадали только в одну часть. В противном случае оценка искусственно завышается. При построении модели, идентифицирующей S. aureus, использовали метод скользящего контроля с k = 20, т. е. из общей выборки спектров выделяли 20 частей таким образом, что спектры, относящиеся к одному изоляту, всегда попадали в одну и ту же часть. При построении модели, дискриминирующей MSSA- и MRSA-штаммы, использовали равное количество изолятов каждого типа (k = 40). Таким образом, в данном случае каждая часть соответствовала одному изоляту.Все процедуры предобработки и анализа спектральных данных проводили в программной среде R [7] и интегрированной среде разработки RStudio. Для работы со спектральными данными использовали библиотеку hyperSpec [8], для построения и валидации классифицирующих моделей — caret [9] и MASS [10]. Иллюстрации были получены с помощью библиотеки ggplot2 [11].
РЕЗУЛЬТАТЫ ИССЛЕДОВАНИЯ
Идентификация золотистого стафилакокка
На основе полученных спектров 11 типов наиболее часто встречающихся возбудителей гнойно-септических инфекций человека: S. aureus, S. epidermidis, E. faecalis, E. faecium, K. pneumoniae, E. coli, S. marcescens, E. cloacae, A. baumannii, P. aeruginosa и C. albicans методом PCA-LDA была построена математическая модель, позволяющая идентифицировать S. aureus. Точность модели была оценена методом скользящего контроля по 20 блокам (спектры одного изолята попадали в один блок) и составила в среднем 98,4% (± 4%). Однако более детальный анализ результатов применения метода скользящего контроля показал, что почти все ошибки были получены тогда, когда в тестовую часть попадал изолят S. epidermidis. Это говорит о том, что на уровня рода модель в существующем виде (с учетом размера и качественного состава штаммов в «обучающей» базе данных) работает хорошо. Для достоверной идентификации штаммов на уровне вида в обучающей выборке оказались недостаточно представлены спектры стафилококков других видов: всего в исходных данных, использованных для анализа, присутствовали спектры только двух изолятов S. epidermidis. Наихудшая точность, полученная в методе скользящего контроля (81%), как раз приходится на случай, когда в тестовую часть попадают спектры изолята S. epidermidis, так как в обучающей части недостаточно данных для более достоверного различения S. epidermidis и S. aureus.
Можно предположить, что эти два родственных вида в принципе не различимы с помощью такого подхода. Но финальная модель, построенная по всем данным (без скользящего контроля, когда все спектры использовались при построении модели), демонстрирует способность различать эти два вида со 100% точностью. Эту способность также наглядно демонстрирует проекция спектральных данных на линейный дискриминант (разделяющую линию в методе PCA-LDA) (рис. 3).
Приведенная проекция на линейный дискриминант по сути результат произведения каждого спектра на вектор коэффициентов: если представить (предобработанный) спектр в виде вектора (набора значений), то линейный дискриминант является результатом линейной комбинации. Настройка модели заключается в подборе оптимальных коэффициентов. Значения данных коэффициентов для полученной модели представлены в виде графика на рис. 4.
Отображение коэффициентов позволяет получить грубую интерпретацию полученной модели: чем больше (по абсолютной величине) значение коэффициента, тем более значим соответствующий диапазон; более высокие (по абсолютной величине) значения (с учетом предобработки и вычисления производной) в областях, где коэффициенты отрицательны, говорят о том, что представленный спектр не относится к S. aureus, и наоборот.
Для более развернутой оценки возможности применения подхода в практике медицинской микробиологии была исследована способность полученной модели идентифицировать целевой патоген в смеси с другими бактериями. Для анализа использовали 2 штамма S. aureus с фенотипом MRSA и 3 штамма без лекарственной устойчивости. Микроорганизмы выращивали на кровяном бульоне в течение 24 или 48 ч. По окончании культивирования образцы готовили путем смешивания равных объемов культур S. aureus с культурами грамотрицательных палочек E. coli, K. pneumoniae и P. aeruginosa, выращенных на бульоне Эндо. Содержание бактериальных тел в единице объема среды не исследовали. Все образцы-смеси, фиксированные спиртом, были представлены на идентификацию финальной модели, упомянутой выше (таблица). Во всех спектрах, кроме двух, относящихся к одному образцу, с высокой вероятностью был обнаружен целевой патоген, что говорит о надежности модели и перспективности использования подобного подхода на практике.
Предсказание наличия у изолятов S. aureus фенотипа лекарственной устойчивости
Важной задачей медицинской микробиологии является возможность определения антибиотикорезистетности патогена. В данной работе была предпринята попытка выявления фенотипа MRSA/MSSA у изолятов S. aureus по спектру FTIR. Построение классифицирующей модели происходило аналогичным образом, т. е. методом PCA-LDA с последующей валидацией методом скользящего контроля.Такого же хорошего качества модели, как в случае идентификации S. aureus, получить не удалось. Точность модели, оцененная методом скользящего контроля, составила 73%. Проекция на линейный дискриминант представлена на рис. 5. Точки разделяются существенно хуже, чем в случае дискриминации S. aureus от других патогенов. Однако 80% спектров были идентифицированы точно. Это наблюдение позволяет предполагать, что за счет увеличения объема «обучающей» базы данных удастся повысить достоверность идентификации до практически приемлемого уровня.
ОБСУЖДЕНИЕ
Впервые сообщение об использовании FTIR для идентификации микроорганизмов было опубликовано в 1991 г. [12]. Затем вышли работы, посвященные идентификации бактерий во внешней среде, в частности, лактобацилл и возбудителей пищевых токсикоинфекций [13, 14]. В ряде исследований была впервые показана возможность использования FTIR для идентификации таких патогенов, как микобактерии и листерии [15–17]. В 2011 г в связи с появлением коммерчески доступных спектрометров производства Bruker (Германия) и Perkin-Elmer (США), позволяющих достоверно определять колебательные спектры нативных культур микроорганизмов, возросло число публикаций, посвященных использованию FTIR в микробиологии [18–20]. К этому времени относится появление групп, работающих в этой области за пределами Германии: в Польше [21], Великобритании [22, 23] и Нидерландах [24]. Последняя работа интересна тем, что в ней впервые проведена идентификация возбудителей сепсиса у человека, а также приводится сопоставление разрешающей способности различных методов колебательной спектроскопии: FTIR, спектроскопии Рамановского рассеяния и спектроскопии Рамановского рассеяния с поверхностным усилением (SERS). Авторы делают вывод о том, что FTIR и спектроскопия Рамановского рассеяния дают достоверные и примерно одинаковые результаты, но уступают по чувствительности методу SERS. Метод SERS, напротив, обладает существенно более высокой чувствительностью, но не обеспечивает воспроизводимости результатов идентификации.В последнее время также появляется много работ, посвященных использованию FTIR в медицинской микробиологии [25–28]. В первой из них на примере ряда патогенных и непатогенных бактерий P. aeruginosa,
- putida, E. coli, E. faecium, Streptomyces lividans, B. subtilis,
- cereus и пекарских дрожжей Saccharomyces cerevisiae
сравнивается разрешающая способность методов колебательной спектроскопии с применением современной приборной базы: SERS (точность 74,9%), спектроскопии Рамановского рассеяния (97,8%) и FTIR (96,2%). В последней работе описывается метод экспресс-идентификации бактерий в форме микроколоний диаметром 50–300 мкм с помощью новейшего Фурье-спектрометра IR-BioTyper (Bruker): колонии автоматически переносятся с агаризованной среды на подложки из CaF2, а для анализа спектров методом главных компонент используется искусственная нейронная сеть (ANN), доступная через сервер Bruker.
Результаты цитированных работ свидетельствуют, что FTIR-спектры достаточно полно характеризуют химический состав клеток (включая биополимеры, являющиеся строительным материалом стенок клетки и мембран, а также внутриклеточные ДНК, фосфолипиды, сахара и др.), чтобы обеспечить возможность: (а) надежной межвидовой дискриминации патогенных бактерий; (б) точной идентификации микроорганизмов до вида; (в) выявления с помощью соответствующих цифровых библиотек спектров принадлежности вновь полученного изолята к таксономической группе внутри вида. Решение этих задач посредством экспресс-анализа, основанного исключительно на данных ИК-спектроскопии, позволило бы оптимизировать процедуру антибиотикотерапии для лечения конкретного больного, избегая назначения препаратов, заведомо неэффективных для борьбы с выявленным у него этиологическим агентом. Однако проблемой на пути внедрения этого подхода в практику клинической микробиологии является отсутствие алгоритма, позволяющего в автоматическом режиме анализировать FTIR-спектры культур микроорганизмов. Такой алгоритм должен выявлять те компоненты спектра, которые зависят только от генетических особенностей штамма и не зависят от условий его культивирования: состава среды, фазы роста и степени деградации культуры и т. д. Особенностью же всех процитированных выше работ является стремление авторов стандартизировать условия культивирования микроорганизмов, что трудно достижимо в условиях клинической диагностики и увеличивает время проведения анализа.
В рамках нашей работы была решена задача по разработке алгоритма, позволяющего идентифицировать видовую принадлежность бактерий вне зависимости от фазы роста и среды культивирования. Для этого наборы клинических изолятов бактерий видов S. aureus, E. faecalis, E. faecium, K. pneumoniae, E. coli, S. marcescens, E. cloacae, A. baumannii, P. aeruginosa, S. epidermidis и C. albicans культивировали в различных условиях: на нескольких средах в течение различного времени. Используя метод главных компонент, вычленяли наиболее информативную часть FTIR-спектра бактериальных культур. Результат анализа фиксировали в виде системы коэффициентов, которая позволяла за короткое время идентифицировать видовую принадлежность новых изолятов по их FTIR-спектрам. Точность нового метода была оценена в слепом тесте на модели изолятов S. aureus и их смесей с P. aeruginosa, E. coli и K. pneumoniae.
Результаты показывают, что предложенный алгоритм анализа FTIR-спектров после обучения на выборке из 11 патогенов различной таксономической принадлежности (бактерии и дрожжи-аскомицеты) достоверно выявляет наличие в культуре S. aureus вне зависимости от длительности культивирования (24 или 48 ч). Все образцы до снятия спектра инактивировались 70% этанолом, что облегчает организацию работы с вирулентными штаммами и хранение образцов для повторного анализа. Присутствие в образце цельной крови и примесей посторонних микроорганизмов (грамотрицательных палочек E. coli, K. pneumoniae и P. aeruginosa) в концентрациях, примерно равных концентрации S. aureus, не снижает способность алгоритма выявлять целевой патоген. Модель с точностью до 80% может предсказывать наличие у изолятов S. aureus фенотипа лекарственной устойчивости (MRSA/MSSA). Результаты тестирования позволяют надеяться, что описанный алгоритм после необходимого расширения «обучающей» базы данных будет способен выявлять любые другие патогены, культивируемые на средах любого удобного для работы состава.
ВЫВОДЫ
Описан способ формирования баз данных и программы сравнения, пригодных для идентификации патогенных микроорганизмов с помощью инфракрасной Фурье-спектроскопии вне зависимости от стадии роста культуры и состава среды. Способ может быть успешно реализован на базе стандартного и доступного по стоимости серийного прибора Spectrum Two (Perkin-Elmer; США). Проведена апробация способа на модели клинических изолятов S. aureus, которые достоверно дискриминировались от других распространенных возбудителей гнойных и внутрибольничных инфекций: E. faecalis, E. faecium, K. pneumoniae, E. coli, S. marcescens, E. cloacae, A. baumannii, P. aeruginosa и C. albicans в виде чистых культур и парных смесей.