ОРИГИНАЛЬНОЕ ИССЛЕДОВАНИЕ
Адаптация технологии интерфейсов мозг-компьютер на волне P300 для оценивания состояния больных нервной анорексией
1 Биологический факультет, Московский государственный университет имени М. В. Ломоносова, Москва, Россия
2 Научно-практический центр психического здоровья детей и подростков имени. Г. Е. Сухаревой, Москва, Россия
3 Российский национальный исследовательский медицинский университет имени Н. И. Пирогова, Москва, Россия
Для корреспонденции: Илья Петрович Ганин
Ленинские горы, д. 1, стр. 12, к. 246, г. Москва,119234; ur.liam@ninagpi
Вклад авторов в работу: все авторы участвовали в планировании эксперимента; И. П. Ганин — проведение исследования, анализ и интерпретация данных, анализ литературы, подготовка текста рукописи; Е. А. Косиченко — проведение исследования, анализ литературы, анализ данных; А. В. Соколов — проведение исследования, интерпретация данных, редактирование текста; О. М. Иоаннисянц — диагностика и подбор пациентов для исследования; И. М. Арефьев — обеспечение экспериментов, интерпретации данных; А. Я. Басова — интерпретация данных, редактирование текста; А. Я. Каплан — интерпретация данных.
В настоящее время технология интерфейсов мозг-компьютер (ИМК) входит в стандартный исследовательский инструментарий все большего числа нейрофизиологических лабораторий мира [1]. ИМК является научно-инженерной разработкой, нацеленной на обеспечение людей с утраченными или поврежденными двигательными функциями возможностью передачи команд к внешним исполнительным устройствам за счет декодирования специфических паттернов электроэнцефалограммы (ЭЭГ) [2]. Развитие исследований ИМК определяется их острой востребованностью в медицине, в частности, для управления вспомогательными устройствами [3, 4], в реабилитационных целях [5], а также для коммуникации [6].
Нынешний уровень развития технологии ИМК позволяет в некоторых случаях на основе анализа сигнала ЭЭГ распознавать команды оператора ИМК с довольно высокой точностью, что говорит о возможном расширении потенциала использования данной технологии. В первую очередь подходы и алгоритмы, используемые в ИМК, можно применять не только для распознавания конкретных команд, ассоциированных с произвольной концентрацией внимания пользователя, но и для детектирования неявных фокусов внимания к внешним стимулам или собственным внутренним состояниям. Такое непроизвольное смещение интереса или, напротив, отсутствие в ЭЭГ признаков наличия внимания в определенных условиях, в частности может быть использовано в системах инструментальной диагностики различных нарушений психики.
Среди возможных вариантов ИМК для разработки подобных систем наиболее подходящим является ИМК на основе волны P300, или ИМК-P300 [2, 6, 7]. В данном интерфейсе выбор команд основан на предъявлении человеку внешних стимулов-команд. Последовательно активируя стимулы (например, подсвечивая буквы на экране компьютера) и анализируя ЭЭГ-ответы на разные стимулы, система тем самым может определить целевую команду. Она детектируется по увеличенной амплитуде потенциалов, связанных с событиями (ПСС) в ответ на целевой, или значимый, для пользователя стимул. Основным компонентом ПСС является хорошо известная волна P300, имеющая наибольшую амплитуду именно в реакциях на редкие и значимые стимулы, поэтому данный тип ИМК и получил упомянутое выше название.
Для возникновения в ЭЭГ специфичного ответа на внешний стимул требуется избирательное активное внимание пользователя ИМК к соответствующей команде. Тем не менее волна P300 и другие ЭЭГ-признаки наличия внимания к событию могут быть вызваны стимулами, привлекающими внимание человека неявным образом и не обладающими явным практическим интересом для человека. Наличие такого непроизвольного внимания может быть обусловлено субъективной значимостью тех или иных стимулов для человека ввиду его личного опыта, или психоэмоционального статуса [8, 9]. Таким образом, парадигма предъявления стимулов ИМК-P300 подходит для оценки на основе ЭЭГ-реакций особенностей восприятия субъектом определенной информации и распознавания фокуса неявного интереса к некоторым классам внешних стимулов. При этом в такой системе стимулы могут предъявляться в так называемой парадигме пассивного внимания, когда от испытуемых не требуется реагировать на определенный класс стимулов, а нужно лишь смотреть на появляющиеся зрительные стимулы [10]. Оправданность этого подхода объясняется тем, что даже в отсутствии осознанного восприятия выделяющегося биологически или эмоционально стимула он в любом случае может вызывать реакцию [11], поскольку значим для субъекта. Поэтому такой стимул можно рассматривать «целевым» в контексте ИМК, и к нему могут быть применимы существующие подходы классификации на основе анализа ЭЭГ.
Наиболее логичным представляется использование в подобных методиках эмоционально окрашенного контента на фоне нейтрального [12]. Подобные системы могут быть использованы для автоматического распознавания повышенного состояния возбуждения среди людей с профессиями высокой эмоциональной нагрузки [13], а также для инструментальной диагностики нарушения эмоционального восприятия, например, при аутизме [14, 15].
Не менее интересно использование методик на базе ИМК-P300 для оценки состояния больных с нарушениями пищевого поведения. В частности, анализ показателей ЭЭГ в ответ на предъявление таким пациентам набора зрительных стимулов, связанных с анорексией, может служить дополнительным критерием мониторинга успешности проводимого лечения. У пациентов с нервной анорексией ранее на ЭЭГ-уровне были выявлены нарушения в восприятии эмоционально окрашенных стимулов [16]. Кроме того, у таких больных известны особенности волны P300 и других компонентов ПСС в заданиях на внимание, которые свидетельствуют о снижении некоторых функций мозга [17].
Несмотря на существование ряда работ по выявлению особенностей показателей ЭЭГ в ответ на предъявление зрительных стимулов в различных условиях, на сегодняшний день не было предложено прототипа такой системы, которая могла бы на основе сигнала ЭЭГ распознавать фокус интереса к определенным классам стимулов. Исходя из этого, целями настоящей работы были выявление особенностей ПСС в ответ на предъявление стимулов различной эмоциональной значимости больным нервной анорексией в парадигме пассивного внимания, а также проверка гипотезы о возможном детектировании фокуса внимания к субъективно значимым стимулам на основе технологии ИМК-P300.
ПАЦИЕНТЫ И МЕТОДЫ
В исследовании принимали участие 12 девушек подросткового возраста (11–16 лет), проходивших лечение в ГБУЗ «НПЦ психического здоровья детей и подростков им. Г. Е. Сухаревой ДЗМ». Критерии включения пациентов в исследование: наличие диагноза F50.0 «Нервная анорексия»; период реабилитации. Критерии исключения: наличие тяжелой соматической патологии; высокая степень белково-энергетической недостаточности; пребывание на строгом постельном режиме. У участников регистрировали ЭЭГ во время того, как они смотрели на экран, на котором предъявляли наборы фотоизображений.
Изображения с угловыми размерами 12,9 × 9,6° предъявляли на сером фоне в режиме одбол-парадигмы: в центре экрана последовательно появлялись стимулы, в промежутках между ними экран оставался пустым. Длительность предъявления стимула составляла 200 мс, межстимульный интервал — 500 мс. В качестве значимых стимулов использовали два типа изображений: фотографии еды и частей тела людей с истощением. Нейтральными («незначимыми») стимулами служили изображения предметов, животных, геометрических фигур, пейзажей и др., взятые из базы IAPS [18], из которой также частично были отобраны изображения еды. Основная часть значимых стимулов была получена на основе анализа интернет-каналов анорексической тематики. Все изображения предварительно оценивал врач, постоянно работавший с пациентами, участвовавшими в исследовании. Все изображения были скомбинированы в наборы по 6 штук, 5 изображений набора относились к категории «незначимые», а одно изображение — к категории «значимые». Каждый набор стимулов предъявляли в рамках одной записи ЭЭГ длительностью менее минуты; записи были разделены короткими паузами. Предъявление осуществляли в виде стимульных последовательностей: одна такая последовательность включает появление каждого изображения по одному разу в случайном порядке. Одна запись ЭЭГ состояла из 10 стимульных последовательностей. Наборы изображений предъявляли каждому испытуемому в псевдослучайном порядке, при этом записи со стимульным материалом на основе изображений еды и частей тела чередовали. Общее количество записей для стимулов на основе изображений еды и частей тела составляло обычно 10 и 12 соответственно у каждого испытуемого.
ЭЭГ регистрировали монополярно в отведениях Cz, P3, Pz, P4, PO7, PO8, O1, O2 с референтным электродом на мочке левого уха при помощи усилителя NVX52 с частотой дискретизации сигнала 500 Гц. Запись данных и управление предъявлением стимулов осуществляли в программной среде BCI2000 (www.bci2000.org).
Выделение и анализ ПСС осуществляли в среде MATLAB 7.1 (MathWorks; США). Для этого сигнал ЭЭГ подвергали полосной фильтрации в диапазоне 0,5–20 Гц (фильтр Баттерворта), а затем разбивали на эпохи относительно момента подачи стимула с границами от 0,1 до 0,7 с. После удаления из общего массива эпох, содержащих глазодвигательные артефакты, происходило разделение эпох на целевые («значимые») и нецелевые («незначимые»). Эпохи разделяли также на два блока в зависимости от типа значимого изображения (еда или часть тела). Количество целевых и нецелевых эпох выравнивали за счет исключения части последних. Отдельно усредняли эпохи для целевых и нецелевых стимулов. Таким образом, целевые и нецелевые ПСС получали во всех каналах ЭЭГ в двух блоках для каждого испытуемого. Кроме того, выделяли «разностные» ПСС, получаемые вычитанием нецелевых кривых из целевых.
Амплитуды компонентов P300, N1 и LPP измеряли как максимальное либо минимальное значение в индивидуально подобранном для каждого участника временном окне. Амплитуды компонента P300 были измерены в каналах Cz и Pz, амплитуды компонентов N1 и LPP — в каналах PO7, PO8, O1 и O2. Не все компоненты проявлялись у каждого из испытуемых и во всех каналах, поэтому в описании результатов указывали число испытуемых (n), у которых тот или иной анализ производили.
Чтобы оценить эффективность распознавания по ЭЭГ наличия особой реакции внимания к значимому стимулу, был смоделирован подход классификации целевых команд в ИМК-P300 на основе линейного дискриминанта Фишера. Обучение и тестирование классификатора происходило с использованием кросс-валидации по двум классам — целевым и нецелевым стимулам. В ходе тестирования в каждой попытке (одна запись) в соответствии с обученным классификатором определяли один наиболее выделяющийся из шести стимул. Если распознанное таким образом стимул-изображение принадлежало к категории «значимые», то попытку классификации считали успешной.
По результатам вычисления амплитуд ПСС и точности классификации проводили статистический анализ данных с помощью пакета STATISTICA 7.0 (StatSoft; США), и рассчитывали средние значения для каждой величины в обоих блоках. При нормальном распределении выборок использовали парный критерий Стьюдента, в случае отклонения распределения от нормального — ранговый критерий Уилкоксона.
РЕЗУЛЬТАТЫ ИССЛЕДОВАНИЯ
У большинства пациентов с нервной анорексией на индивидуальных разностных кривых были идентифицированы пики N1 (латентность 120–180 мс), P300 (350–450 мс) и LPP (550–700 мс). Эти пики видны также на усредненных по всей группе целевых и нецелевых ПСС, а также разностных кривых (рис. 1). Соотношение амплитуд целевых и нецелевых ПСС, отображаемое на разностных кривых, позволяет судить о том, насколько сильно привлекали внимание значимые в контексте задания стимулы по сравнению с незначимыми. Поскольку индивидуальная латентность пиков варьировалась и не все пики можно наблюдать у всех испытуемых, на групповом усреднении компоненты ПСС в некоторых отведениях выглядят размытыми и мало выраженными, поэтому рис. 1 отражает лишь общую картину. Средние значения всех анализируемых компонентов в целевых, нецелевых и разностных кривых представлены в таблице.
В обоих блоках амплитуда компонента P300 на целевых кривых была выше, чем на нецелевых: как в канале Cz (p < 0,01; n = 11 и p < 0,01, n = 12, парный критерий Стьюдента), так и в канале Pz (p < 0,01, n = 12 и p < 0,01, n = 11) при предъявлении изображений пищи и частей тела людей с истощением соответственно (таблица). При сравнении амплитуд P300 на разностных кривых между двумя типами стимулов не было выявлено значимых различий (рис. 2).
Амплитуды компонента N1 в целевых ПСС были выше, чем в нецелевых, как при предъявлении изображений пищи (p < 0,05, n = 9; p < 0,05, n = 10; p < 0,05, n = 9; p < 0,05, n = 11, в отведениях PO7, PO8, O1, O2 соответственно, парный критерий Стьюдента), так и при предъявлении изображений частей тела (p < 0,01, n = 9; p < 0,01, n = 12; p < 0,01, n = 12; p < 0,01, n = 11, критерий Уилкоксона). Несмотря на более высокие средние значения амплитуд N1 на разностных кривых для изображений частей тела по сравнению с изображениями пищи (рис. 1 и таблица), значимые различия между двумя типами стимулов выявлены только в отведении PO8 (p < 0,05, n = 10; критерий Уилкоксона) (рис. 2).
Компонент LPP имел наибольшую амплитуду в затылочных отведениях. Амплитуды LPP в целевых ПСС были выше, чем в нецелевых, как при предъявлении изображений пищи (p < 0,01, n = 8; p < 0,01, n = 9; p < 0,05, n = 8; p < 0,01, n = 9, в отведениях PO7, PO8, O1, O2 соответственно, парный критерий Стьюдента), так и при предъявлении изображений частей тела (p < 0,01, n = 9; p < 0,01, n = 10; p < 0,01, n = 10; p < 0,01, n = 10). В среднем для изображений частей тела амплитуды LPP были выше, чем для изображений пищи, однако различия были значимы только в отведениях PO7 и PO8 (p < 0,05, n = 7; p < 0,05, n = 8 соответственно) (рис. 2).
На рис. 3 представлены средние значения точности классификации значимых стимулов среди нейтральных в двух блоках. Средняя точность распознавания классификатором стимулов с изображениями пищи составила 59,1 ± 5,3% и была ниже, чем для стимулов с изображениями частей тела людей с истощением, для которых составила 89,1 ± 2,3% (p = 0,0002, n = 12, парный критерий Стьюдента).
ОБСУЖДЕНИЕ РЕЗУЛЬТАТОВ
Главным результатом работы стал ряд выявленных особенностей ПСС при пассивном восприятии эмоционально значимых изображений, а также показанная возможность распознавания ЭЭГ-реакций внимания к таким стимулам среди нейтрального стимульного контента с точностью, близкой к современным ИМК-системам.
Известно, что для людей, относящихся к высокой группе риска развития расстройств пищевого поведения, характерна повышенная восприимчивость к эмоционально значимым стимулам, которые связаны с формой и массой тела [19]. Такую особую субъективную значимость подобных стимулов для больных с нервной анорексией можно объяснить тем, что в ее развитии важную роль играет особое отношение к своему телу с формированием синдрома дисморфофобии/дисморфомании на фоне низкого уровня самооценки и самоуважения [19, 20]. Нами были выявлены более высокие амплитуды компонентов ПСС в ответ на предъявление изображений пищи или частей тела людей с истощением, что говорит о субъективной значимости этих стимулов для пациентов, хотя сила реакции в ответ на два типа изображений различалась.
Иcходя из литературных данных, более высокую амплитуду ПСС в ответ на значимые стимулы можно было бы объяснить их редкостью среди нейтральных стимулов: в одбол-парадигме редкие целевые стимулы вызывают более высокие ответы [21]. При этом, в отличие от классической одбол-парадигмы с простыми сильно различающимися двумя классами стимулов, все изображения в нашей работе были одинаково разнородными как внутри классов значимые/незначимые, так и между классами. Это говорит о том, что полученные в работе различия не связаны с графическими особенностями изображений, а вызваны исключительно субъективной значимостью смыслового содержания этой группы стимулов для пациентов. Так, предъявление изображений частей тела вызывало существенно более сильную реакцию в ПСС по сравнению с изображениями пищи, несмотря на одинаковую вероятность появления значимого стимула в обоих случаях. Это может говорить о том, что реакция на выделяющийся из контекста стимул обусловлена не просто его редкостью, но и его особой эмоциональной значимостью для пациентов. Такое предположение подтверждается и тем, что амплитуда волны P300, которая отражает частотные характеристики стимула, не различалась для двух типов изображений, в то время как другие компоненты ПСС и точность классификации были чувствительны к типу стимула.
Одним из самых важных результатов описываемой работы можно считать крайне высокие значения точности классификации по ЭЭГ-реакциям субъективно значимых стимулов среди всех изображений. Точность для изображений пищи составила 59%, а для изображений частей тела — 89%. Следует отметить, что эти результаты получены в задании без привлечения активного внимания к стимулам. Такая точность не просто многократно превышает случайный уровень распознавания в 16,7% (выбор одного из шести стимулов), но близка к значениям, достигаемым в ИМК-P300, где пользователь, напротив, активно фокусирует внимание на целевом стимуле- команде, игнорируя остальные стимулы [22, 23].
Описываемое в настоящей работе исследование является в большой мере пилотным, и его ценность определяется адаптацией существующих подходов ИМК для создания методик и систем детектирования субъективных фокусов внимания. Потому одним из ограничений работы является отсутствие контрольной группы здоровых испытуемых. При этом в качестве контроля можно рассматривать режим с предъявлением изображений пищи по сравнению с предъявлением изображений частей тела: компонентный состав ПСС различался между режимами, несмотря на одинаковые вероятностные характеристики значимого стимула и идентичный набор незначимых стимулов (см. выше). Полученные результаты можно также сравнить с результатами другой недавней работы авторского коллектива, где здоровые испытуемые выполняли похожее задание: пассивно наблюдали на экране различные изображения, часть из которых была эмоционально выделяющейся из контекста, но не несла для испытуемых субъективной значимости [12]. Амплитуды компонентов в ответ на выделяющиеся стимулы были значительно ниже, чем в настоящем исследовании, а точность классификации составляла 40–45%. По некоторым данным, у больных нервной анорексией наблюдали сниженные ПСС-ответы на пищевые зрительные стимулы по сравнению со здоровыми испытуемыми [24]. В нашем же исследовании изображения частей тела людей с истощением вызывали существенно более высокую реакцию, подтвержденную на ЭЭГ, чем изображения пищи. Это может свидетельствовать о способностях первых привлекать внимание в большей степени и подчеркивает их особую значимость для больных нервной анорексией.
Компонент N1 отражает процессы фиксации на определенном стимуле, а также связан с эмоциональным восприятием [25], что позволяет судить о наличии внимания пациентов к изображениям пищи и частей тела, а также о том, что значимость данных стимулов была обусловлена эмоциональной реакцией на них. Компонент LPP связывают с поздними стадиями эмоционального процессинга зрительных стимулов [26]. Это также может служить подтверждением того, что особая ЭЭГ-реакция в ответ на используемые в исследовании значимые изображения определяется особенностями когнитивной обработки, а не просто частотностью их появления среди остальных стимулов. В целом более высокие амплитуды компонентов N1 и LPP, а также значения точности классификации для изображений частей тела людей с истощением по сравнению с изображениями пищи подтверждают предположение о том, что основной причиной анорексии может являться особое отношение к своему телу, искаженное восприятие его формы и размера, навязчивое желание соответствовать определенным физическим стандартам, а не собственно неприятие пищи [19].
ВЫВОДЫ
Использованный метод выявления непроизвольного внимания при предъявлении изображений пищи и частей тела истощенных людей обеспечил высокую точность классификации реакций непроизвольного внимания к эмоционально значимым стимулам у больных нервной анорексией. Развитие такой методики может способствовать созданию систем детектирования по ЭЭГ эмоциональных фокусов внимания. Подобные системы, в частности, могут быть использованы в диагностике состояния пациентов для определения особенностей их эмоционального восприятия на разных этапах лечения. Была выявлена более сильная реакция, подтвержденная на ЭЭГ, в ответ на предъявление изображений частей тела истощенных людей по сравнению с изображениями пищи. Это, с одной стороны, может подтверждать известные данные о факторах развития нервной анорексии, а, с другой стороны, открывает потенциал использования соответствующего стимульного материала в упомянутых системах.