ОРИГИНАЛЬНОЕ ИССЛЕДОВАНИЕ

Адаптация технологии интерфейсов мозг-компьютер на волне P300 для оценивания состояния больных нервной анорексией

И. П. Ганин1, Е. А. Косиченко1, А. В. Соколов2,3, О. М. Иоаннисянц2, И. М. Арефьев2, А. Я. Басова2,3, А. Я. Каплан1
Информация об авторах

1 Биологический факультет, Московский государственный университет имени М. В. Ломоносова, Москва, Россия

2 Научно-практический центр психического здоровья детей и подростков имени. Г. Е. Сухаревой, Москва, Россия

3 Российский национальный исследовательский медицинский университет имени Н. И. Пирогова, Москва, Россия

Для корреспонденции: Илья Петрович Ганин
Ленинские горы, д. 1, стр. 12, к. 246, г. Москва,119234; ur.liam@ninagpi

Информация о статье

Вклад авторов в работу: все авторы участвовали в планировании эксперимента; И. П. Ганин — проведение исследования, анализ и интерпретация данных, анализ литературы, подготовка текста рукописи; Е. А. Косиченко — проведение исследования, анализ литературы, анализ данных; А. В. Соколов — проведение исследования, интерпретация данных, редактирование текста; О. М. Иоаннисянц — диагностика и подбор пациентов для исследования; И. М. Арефьев — обеспечение экспериментов, интерпретации данных; А. Я. Басова — интерпретация данных, редактирование текста; А. Я. Каплан — интерпретация данных.

Статья получена: 08.10.2018 Статья принята к печати: 27.03.2019 Опубликовано online: 10.04.2019
|

В настоящее время технология интерфейсов мозг-компьютер (ИМК) входит в стандартный исследовательский инструментарий все большего числа нейрофизиологических лабораторий мира [1]. ИМК является научно-инженерной разработкой, нацеленной на обеспечение людей с утраченными или поврежденными двигательными функциями возможностью передачи команд к внешним исполнительным устройствам за счет декодирования специфических паттернов электроэнцефалограммы (ЭЭГ) [2]. Развитие исследований ИМК определяется их острой востребованностью в медицине, в частности, для управления вспомогательными устройствами [3, 4], в реабилитационных целях [5], а также для коммуникации [6].
Нынешний уровень развития технологии ИМК позволяет в некоторых случаях на основе анализа сигнала ЭЭГ распознавать команды оператора ИМК с довольно высокой точностью, что говорит о возможном расширении потенциала использования данной технологии. В первую очередь подходы и алгоритмы, используемые в ИМК, можно применять не только для распознавания конкретных команд, ассоциированных с произвольной концентрацией внимания пользователя, но и для детектирования неявных фокусов внимания к внешним стимулам или собственным внутренним состояниям. Такое непроизвольное смещение интереса или, напротив, отсутствие в ЭЭГ признаков наличия внимания в определенных условиях, в частности может быть использовано в системах инструментальной диагностики различных нарушений психики.
Среди возможных вариантов ИМК для разработки подобных систем наиболее подходящим является ИМК на основе волны P300, или ИМК-P300 [2, 6, 7]. В данном интерфейсе выбор команд основан на предъявлении человеку внешних стимулов-команд. Последовательно активируя стимулы (например, подсвечивая буквы на экране компьютера) и анализируя ЭЭГ-ответы на разные стимулы, система тем самым может определить целевую команду. Она детектируется по увеличенной амплитуде потенциалов, связанных с событиями (ПСС) в ответ на целевой, или значимый, для пользователя стимул. Основным компонентом ПСС является хорошо известная волна P300, имеющая наибольшую амплитуду именно в реакциях на редкие и значимые стимулы, поэтому данный тип ИМК и получил упомянутое выше название.

Для возникновения в ЭЭГ специфичного ответа на внешний стимул требуется избирательное активное внимание пользователя ИМК к соответствующей команде. Тем не менее волна P300 и другие ЭЭГ-признаки наличия внимания к событию могут быть вызваны стимулами, привлекающими внимание человека неявным образом и не обладающими явным практическим интересом для человека. Наличие такого непроизвольного внимания может быть обусловлено субъективной значимостью тех или иных стимулов для человека ввиду его личного опыта, или психоэмоционального статуса [8, 9]. Таким образом, парадигма предъявления стимулов ИМК-P300 подходит для оценки на основе ЭЭГ-реакций особенностей восприятия субъектом определенной информации и распознавания фокуса неявного интереса к некоторым классам внешних стимулов. При этом в такой системе стимулы могут предъявляться в так называемой парадигме пассивного внимания, когда от испытуемых не требуется реагировать на определенный класс стимулов, а нужно лишь смотреть на появляющиеся зрительные стимулы [10]. Оправданность этого подхода объясняется тем, что даже в отсутствии осознанного восприятия выделяющегося биологически или эмоционально стимула он в любом случае может вызывать реакцию [11], поскольку значим для субъекта. Поэтому такой стимул можно рассматривать «целевым» в контексте ИМК, и к нему могут быть применимы существующие подходы классификации на основе анализа ЭЭГ.
Наиболее логичным представляется использование в подобных методиках эмоционально окрашенного контента на фоне нейтрального [12]. Подобные системы могут быть использованы для автоматического распознавания повышенного состояния возбуждения среди людей с профессиями высокой эмоциональной нагрузки [13], а также для инструментальной диагностики нарушения эмоционального восприятия, например, при аутизме [14, 15].

Не менее интересно использование методик на базе ИМК-P300 для оценки состояния больных с нарушениями пищевого поведения. В частности, анализ показателей ЭЭГ в ответ на предъявление таким пациентам набора зрительных стимулов, связанных с анорексией, может служить дополнительным критерием мониторинга успешности проводимого лечения. У пациентов с нервной анорексией ранее на ЭЭГ-уровне были выявлены нарушения в восприятии эмоционально окрашенных стимулов [16]. Кроме того, у таких больных известны особенности волны P300 и других компонентов ПСС в заданиях на внимание, которые свидетельствуют о снижении некоторых функций мозга [17].
Несмотря на существование ряда работ по выявлению особенностей показателей ЭЭГ в ответ на предъявление зрительных стимулов в различных условиях, на сегодняшний день не было предложено прототипа такой системы, которая могла бы на основе сигнала ЭЭГ распознавать фокус интереса к определенным классам стимулов. Исходя из этого, целями настоящей работы были выявление особенностей ПСС в ответ на предъявление стимулов различной эмоциональной значимости больным нервной анорексией в парадигме пассивного внимания, а также проверка гипотезы о возможном детектировании фокуса внимания к субъективно значимым стимулам на основе технологии ИМК-P300.

ПАЦИЕНТЫ И МЕТОДЫ

В исследовании принимали участие 12 девушек подросткового возраста (11–16 лет), проходивших лечение в ГБУЗ «НПЦ психического здоровья детей и подростков им. Г. Е. Сухаревой ДЗМ». Критерии включения пациентов в исследование: наличие диагноза F50.0 «Нервная анорексия»; период реабилитации. Критерии исключения: наличие тяжелой соматической патологии; высокая степень белково-энергетической недостаточности; пребывание на строгом постельном режиме. У участников регистрировали ЭЭГ во время того, как они смотрели на экран, на котором предъявляли наборы фотоизображений.
Изображения с угловыми размерами 12,9 × 9,6° предъявляли на сером фоне в режиме одбол-парадигмы: в центре экрана последовательно появлялись стимулы, в промежутках между ними экран оставался пустым. Длительность предъявления стимула составляла 200 мс, межстимульный интервал — 500 мс. В качестве значимых стимулов использовали два типа изображений: фотографии еды и частей тела людей с истощением. Нейтральными («незначимыми») стимулами служили изображения предметов, животных, геометрических фигур, пейзажей и др., взятые из базы IAPS [18], из которой также частично были отобраны изображения еды. Основная часть значимых стимулов была получена на основе анализа интернет-каналов анорексической тематики. Все изображения предварительно оценивал врач, постоянно работавший с пациентами, участвовавшими в исследовании. Все изображения были скомбинированы в наборы по 6 штук, 5 изображений набора относились к категории «незначимые», а одно изображение — к категории «значимые». Каждый набор стимулов предъявляли в рамках одной записи ЭЭГ длительностью менее минуты; записи были разделены короткими паузами. Предъявление осуществляли в виде стимульных последовательностей: одна такая последовательность включает появление каждого изображения по одному разу в случайном порядке. Одна запись ЭЭГ состояла из 10 стимульных последовательностей. Наборы изображений предъявляли каждому испытуемому в псевдослучайном порядке, при этом записи со стимульным материалом на основе изображений еды и частей тела чередовали. Общее количество записей для стимулов на основе изображений еды и частей тела составляло обычно 10 и 12 соответственно у каждого испытуемого.
ЭЭГ регистрировали монополярно в отведениях Cz, P3, Pz, P4, PO7, PO8, O1, O2 с референтным электродом на мочке левого уха при помощи усилителя NVX52 с частотой дискретизации сигнала 500 Гц. Запись данных и управление предъявлением стимулов осуществляли в программной среде BCI2000 (www.bci2000.org).

Выделение и анализ ПСС осуществляли в среде MATLAB 7.1 (MathWorks; США). Для этого сигнал ЭЭГ подвергали полосной фильтрации в диапазоне 0,5–20 Гц (фильтр Баттерворта), а затем разбивали на эпохи относительно момента подачи стимула с границами от 0,1 до 0,7 с. После удаления из общего массива эпох, содержащих глазодвигательные артефакты, происходило разделение эпох на целевые («значимые») и нецелевые («незначимые»). Эпохи разделяли также на два блока в зависимости от типа значимого изображения (еда или часть тела). Количество целевых и нецелевых эпох выравнивали за счет исключения части последних. Отдельно усредняли эпохи для целевых и нецелевых стимулов. Таким образом, целевые и нецелевые ПСС получали во всех каналах ЭЭГ в двух блоках для каждого испытуемого. Кроме того, выделяли «разностные» ПСС, получаемые вычитанием нецелевых кривых из целевых.
Амплитуды компонентов P300, N1 и LPP измеряли как максимальное либо минимальное значение в индивидуально подобранном для каждого участника временном окне. Амплитуды компонента P300 были измерены в каналах Cz и Pz, амплитуды компонентов N1 и LPP — в каналах PO7, PO8, O1 и O2. Не все компоненты проявлялись у каждого из испытуемых и во всех каналах, поэтому в описании результатов указывали число испытуемых (n), у которых тот или иной анализ производили.
Чтобы оценить эффективность распознавания по ЭЭГ наличия особой реакции внимания к значимому стимулу, был смоделирован подход классификации целевых команд в ИМК-P300 на основе линейного дискриминанта Фишера. Обучение и тестирование классификатора происходило с использованием кросс-валидации по двум классам — целевым и нецелевым стимулам. В ходе тестирования в каждой попытке (одна запись) в соответствии с обученным классификатором определяли один наиболее выделяющийся из шести стимул. Если распознанное таким образом стимул-изображение принадлежало к категории «значимые», то попытку классификации считали успешной.
По результатам вычисления амплитуд ПСС и точности классификации проводили статистический анализ данных с помощью пакета STATISTICA 7.0 (StatSoft; США), и рассчитывали средние значения для каждой величины в обоих блоках. При нормальном распределении выборок использовали парный критерий Стьюдента, в случае отклонения распределения от нормального — ранговый критерий Уилкоксона.

РЕЗУЛЬТАТЫ ИССЛЕДОВАНИЯ

У большинства пациентов с нервной анорексией на индивидуальных разностных кривых были идентифицированы пики N1 (латентность 120–180 мс), P300 (350–450 мс) и LPP (550–700 мс). Эти пики видны также на усредненных по всей группе целевых и нецелевых ПСС, а также разностных кривых (рис. 1). Соотношение амплитуд целевых и нецелевых ПСС, отображаемое на разностных кривых, позволяет судить о том, насколько сильно привлекали внимание значимые в контексте задания стимулы по сравнению с незначимыми. Поскольку индивидуальная латентность пиков варьировалась и не все пики можно наблюдать у всех испытуемых, на групповом усреднении компоненты ПСС в некоторых отведениях выглядят размытыми и мало выраженными, поэтому рис. 1 отражает лишь общую картину. Средние значения всех анализируемых компонентов в целевых, нецелевых и разностных кривых представлены в таблице.
В обоих блоках амплитуда компонента P300 на целевых кривых была выше, чем на нецелевых: как в канале Cz (p < 0,01; n = 11 и p < 0,01, n = 12, парный критерий Стьюдента), так и в канале Pz (p < 0,01, n = 12 и p < 0,01, n = 11) при предъявлении изображений пищи и частей тела людей с истощением соответственно (таблица). При сравнении амплитуд P300 на разностных кривых между двумя типами стимулов не было выявлено значимых различий (рис. 2).
Амплитуды компонента N1 в целевых ПСС были выше, чем в нецелевых, как при предъявлении изображений пищи (p < 0,05, n = 9; p < 0,05, n = 10; p < 0,05, n = 9; p < 0,05, n = 11, в отведениях PO7, PO8, O1, O2 соответственно, парный критерий Стьюдента), так и при предъявлении изображений частей тела (p < 0,01, n = 9; p < 0,01, n = 12; p < 0,01, n = 12; p < 0,01, n = 11, критерий Уилкоксона). Несмотря на более высокие средние значения амплитуд N1 на разностных кривых для изображений частей тела по сравнению с изображениями пищи (рис. 1 и таблица), значимые различия между двумя типами стимулов выявлены только в отведении PO8 (p < 0,05, n = 10; критерий Уилкоксона) (рис. 2).
Компонент LPP имел наибольшую амплитуду в затылочных отведениях. Амплитуды LPP в целевых ПСС были выше, чем в нецелевых, как при предъявлении изображений пищи (p < 0,01, n = 8; p < 0,01, n = 9; p < 0,05, n = 8; p < 0,01, n = 9, в отведениях PO7, PO8, O1, O2 соответственно, парный критерий Стьюдента), так и при предъявлении изображений частей тела (p < 0,01, n = 9; p < 0,01, n = 10; p < 0,01, n = 10; p < 0,01, n = 10). В среднем для изображений частей тела амплитуды LPP были выше, чем для изображений пищи, однако различия были значимы только в отведениях PO7 и PO8 (p < 0,05, n = 7; p < 0,05, n = 8 соответственно) (рис. 2).
На рис. 3 представлены средние значения точности классификации значимых стимулов среди нейтральных в двух блоках. Средняя точность распознавания классификатором стимулов с изображениями пищи составила 59,1 ± 5,3% и была ниже, чем для стимулов с изображениями частей тела людей с истощением, для которых составила 89,1 ± 2,3% (p = 0,0002, n = 12, парный критерий Стьюдента).

ОБСУЖДЕНИЕ РЕЗУЛЬТАТОВ

Главным результатом работы стал ряд выявленных особенностей ПСС при пассивном восприятии эмоционально значимых изображений, а также показанная возможность распознавания ЭЭГ-реакций внимания к таким стимулам среди нейтрального стимульного контента с точностью, близкой к современным ИМК-системам.
Известно, что для людей, относящихся к высокой группе риска развития расстройств пищевого поведения, характерна повышенная восприимчивость к эмоционально значимым стимулам, которые связаны с формой и массой тела [19]. Такую особую субъективную значимость подобных стимулов для больных с нервной анорексией можно объяснить тем, что в ее развитии важную роль играет особое отношение к своему телу с формированием синдрома дисморфофобии/дисморфомании на фоне низкого уровня самооценки и самоуважения [19, 20]. Нами были выявлены более высокие амплитуды компонентов ПСС в ответ на предъявление изображений пищи или частей тела людей с истощением, что говорит о субъективной значимости этих стимулов для пациентов, хотя сила реакции в ответ на два типа изображений различалась.
Иcходя из литературных данных, более высокую амплитуду ПСС в ответ на значимые стимулы можно было бы объяснить их редкостью среди нейтральных стимулов: в одбол-парадигме редкие целевые стимулы вызывают более высокие ответы [21]. При этом, в отличие от классической одбол-парадигмы с простыми сильно различающимися двумя классами стимулов, все изображения в нашей работе были одинаково разнородными как внутри классов значимые/незначимые, так и между классами. Это говорит о том, что полученные в работе различия не связаны с графическими особенностями изображений, а вызваны исключительно субъективной значимостью смыслового содержания этой группы стимулов для пациентов. Так, предъявление изображений частей тела вызывало существенно более сильную реакцию в ПСС по сравнению с изображениями пищи, несмотря на одинаковую вероятность появления значимого стимула в обоих случаях. Это может говорить о том, что реакция на выделяющийся из контекста стимул обусловлена не просто его редкостью, но и его особой эмоциональной значимостью для пациентов. Такое предположение подтверждается и тем, что амплитуда волны P300, которая отражает частотные характеристики стимула, не различалась для двух типов изображений, в то время как другие компоненты ПСС и точность классификации были чувствительны к типу стимула.

Одним из самых важных результатов описываемой работы можно считать крайне высокие значения точности классификации по ЭЭГ-реакциям субъективно значимых стимулов среди всех изображений. Точность для изображений пищи составила 59%, а для изображений частей тела — 89%. Следует отметить, что эти результаты получены в задании без привлечения активного внимания к стимулам. Такая точность не просто многократно превышает случайный уровень распознавания в 16,7% (выбор одного из шести стимулов), но близка к значениям, достигаемым в ИМК-P300, где пользователь, напротив, активно фокусирует внимание на целевом стимуле- команде, игнорируя остальные стимулы [22, 23].

Описываемое в настоящей работе исследование является в большой мере пилотным, и его ценность определяется адаптацией существующих подходов ИМК для создания методик и систем детектирования субъективных фокусов внимания. Потому одним из ограничений работы является отсутствие контрольной группы здоровых испытуемых. При этом в качестве контроля можно рассматривать режим с предъявлением изображений пищи по сравнению с предъявлением изображений частей тела: компонентный состав ПСС различался между режимами, несмотря на одинаковые вероятностные характеристики значимого стимула и идентичный набор незначимых стимулов (см. выше). Полученные результаты можно также сравнить с результатами другой недавней работы авторского коллектива, где здоровые испытуемые выполняли похожее задание: пассивно наблюдали на экране различные изображения, часть из которых была эмоционально выделяющейся из контекста, но не несла для испытуемых субъективной значимости [12]. Амплитуды компонентов в ответ на выделяющиеся стимулы были значительно ниже, чем в настоящем исследовании, а точность классификации составляла 40–45%. По некоторым данным, у больных нервной анорексией наблюдали сниженные ПСС-ответы на пищевые зрительные стимулы по сравнению со здоровыми испытуемыми [24]. В нашем же исследовании изображения частей тела людей с истощением вызывали существенно более высокую реакцию, подтвержденную на ЭЭГ, чем изображения пищи. Это может свидетельствовать о способностях первых привлекать внимание в большей степени и подчеркивает их особую значимость для больных нервной анорексией.
Компонент N1 отражает процессы фиксации на определенном стимуле, а также связан с эмоциональным восприятием [25], что позволяет судить о наличии внимания пациентов к изображениям пищи и частей тела, а также о том, что значимость данных стимулов была обусловлена эмоциональной реакцией на них. Компонент LPP связывают с поздними стадиями эмоционального процессинга зрительных стимулов [26]. Это также может служить подтверждением того, что особая ЭЭГ-реакция в ответ на используемые в исследовании значимые изображения определяется особенностями когнитивной обработки, а не просто частотностью их появления среди остальных стимулов. В целом более высокие амплитуды компонентов N1 и LPP, а также значения точности классификации для изображений частей тела людей с истощением по сравнению с изображениями пищи подтверждают предположение о том, что основной причиной анорексии может являться особое отношение к своему телу, искаженное восприятие его формы и размера, навязчивое желание соответствовать определенным физическим стандартам, а не собственно неприятие пищи [19].

ВЫВОДЫ

Использованный метод выявления непроизвольного внимания при предъявлении изображений пищи и частей тела истощенных людей обеспечил высокую точность классификации реакций непроизвольного внимания к эмоционально значимым стимулам у больных нервной анорексией. Развитие такой методики может способствовать созданию систем детектирования по ЭЭГ эмоциональных фокусов внимания. Подобные системы, в частности, могут быть использованы в диагностике состояния пациентов для определения особенностей их эмоционального восприятия на разных этапах лечения. Была выявлена более сильная реакция, подтвержденная на ЭЭГ, в ответ на предъявление изображений частей тела истощенных людей по сравнению с изображениями пищи. Это, с одной стороны, может подтверждать известные данные о факторах развития нервной анорексии, а, с другой стороны, открывает потенциал использования соответствующего стимульного материала в упомянутых системах.

КОММЕНТАРИИ (0)