ОРИГИНАЛЬНОЕ ИССЛЕДОВАНИЕ
Влияние ориентационных характеристик изображения на распределение зрительных фиксаций при решении простых когнитивных задач
1 Российский национальный исследовательский медицинский университет имени Н. И. Пирогова, Москва, Россия
2 Курский государственный медицинский университет, Курск, Россия
Для корреспонденции: Екатерина Анатольевна Петраш
ул. Островитянова, д. 1, г. Москва, 117997, Россия; ur.liam@hsartep
Соблюдение этических стандартов: исследование одобрено этическим комитетом РНИМУ им. Н. И. Пирогова (протокол № 211 от 18 октября 2021 г.), проведено в соответствии с требованиями Основ законодательства «Об охране здоровья граждан»; все участники подписали информированное согласие на обследование.
Слежение за глазодвигательными реакциями представляет собой неинвазивную методику изучения широкого спектра когнитивных и регуляторных процессов: внимания, мнемических процессов, процессов категоризации мышления [1–3].
Методика оценки особенностей глазодвигательных реакций эффективна при решении простых когнитивных задач с целью оптимизации процессов обучения, в том числе с использованием дистанционных образовательных технологий [4–7]. Когнитивная задача включает в себя процесс функционирования первоначальных представлений, уточнения, дополнения, конкретизации, систематизации, дифференцирования и обобщения знаний. В качестве простой когнитивной задачи мы рассматриваем задачу на узнавание изображений. Объектом узнавания выбрано изображение лица человека как сложного социального стимула восприятия [8–14]. Сложность объекта восприятия обусловлена множественностью детализаций, организованных в единое симметричное пространство с учетом определенности места расположения каждого элемента. Социальность объекта позволяет его идентифицировать в границах вида (человек) и по гендерному основанию.
Библиометрический анализ, проведенный по наукометрическим базам Elibrary (по ключевым словам «глазодвигательные реакции») и Web of Science (по ключевым словам «eye movements») за последние пять лет (2015–2020) позволяет констатировать меньший исследовательский интерес к изучению у отечественных специалистов по сравнению с зарубежными коллегами. Результаты изучения глазодвигательных реакций представлены в нейронауках, психологии, медицинских областях научного знания (офтальмологии и психиатрии), компьютерных науках, инженерии. Доля публикаций в общем объеме научных работ, посвященных изучению глазодвигательных реакций, составляет 29%. Многоаспектность и многоплановость изучения глазодвигательных реакций в зарубежных исследованиях доказывает высокую информативность и универсальность данного метода для изучения когнитивных процессов и решения практических задач, связанных с процессами мышления и зрительным восприятием как таковым.
Отношение к воспринимаемым стимулам и их категоризация находит отражение в изменении параметров глазодвигательных реакций, таким образом окуломоторная активность обеспечивает взаимодействие человека с миром. Движения глаз, приобретая статус операций и действий, формируют целостные окуломоторные структуры. Каждая из формируемых окуломоторных структур связана с определенными мотивами и условиями выполнения конкретной деятельности [8, 9]. Отслеживание движений глаз позволяет также измерять переменные, которые трудно получить с помощью других методов исследования, таких как прямая оценка того, куда конкретно люди смотрят в статических или динамических визуальных стимулах, и мгновенное задействование когнитивных ресурсов в соответствии с требованиями задачи [14].
Нормирование параметров глазодвигательных реакций при зрительном восприятии рассматривается как статистическая процедура распределения изучаемых показателей в рамках одного возрастного периода исключительно в группе с отсутствием соматической и психической патологии (условно здоровых). Организация предъявляемой информации с учетом параметров глазодвигательных реакций при решении простых когнитивных задач позволит оптимизировать процессы обучения, в том числе с использованием дистанционных образовательных технологий.
При изучении влияния числа фиксаций взгляда на успешность распознавания изображений лиц установлено, что успешность распознавания изображений знакомых и незнакомых лиц существенно выше при двух фиксациях взгляда, нежели, чем при одной. Кроме того, увеличение числа фиксаций не приводит к повышению качества распознавания [15]. Основной вывод авторов исследования был о том, что для узнавания лица человека по его изображению достаточно двух фиксаций. В качестве общей тенденции следует отметить также направление сканирования изображения лица — слева направо. При этом фиксации взгляда на обучающем этапе по своему расположению на изображении лица существенно отличаются от таковых на собственно экспериментальном «идентификационном» этапе.
В отечественных исследованиях глазодвигательных реакций тоже был подтвержден вывод о необходимости двух фиксаций взгляда для успешного распознавания изображения лица человека [16].
В качестве факторов, влияющих на параметры глазодвигательных реакций, рассматривают экспериментальную задачу (способную влиять на распределение фиксаций взгляда на стимульном изображении), с одной стороны, и формат предъявляемого изображения, с другой. Оценку влияния двух указанных факторов на параметры глазодвигательных реакций осуществляли в рамках схемы, включающей в себя два эксперимента. Оба эксперимента имели одинаковую задачу (на идентификацию изображений лиц) при различиях в формате предъявляемого изображения и с разным углом наклона предъявляемого стимула. Основное внимание исследователей при изучении характеристик глазодвигательных реакций при восприятии изображений лиц сосредоточено на анализе числа фиксаций взгляда в содержательных зонах изображения лица — области глаз, рта и носа [11–13]. Пространственно-ориентационные характеристики (в направлениях право-лево, верх-низ, угол наклона изображения) при этом не учитывают. Авторы указывают также на значимость фактора возраста для зрительно-пространственных функций (полей зрительного восприятия, глазомера и др.). Корреляционные отношения между координатными осями зрительного сенсорного поля в период взрослости или совсем не обнаруживаются (в отличие от предшествующих возрастных этапов), или носят избирательный характер. По мере взросления существенно ослабляются функциональные связи между границами поля зрения по отдельным направлениям. В перцептивном зрительном поле, наоборот, периоды усиления структурности совпадают с моментами общего значительного улучшения пространственноразличительной деятельности по мере взросления. Таким образом, проявление структурированности зрительного восприятия в данном случае имеет важное значение для достижения зрелости и сохранения на оптимальном уровне данной зрительно-пространственной функции на протяжении жизни [17].
В поисках ответа на вопрос, какие характеристики (содержательные или ориентационные) оказывают большее влияние на восприятие визуального стимула, мы исходили из предположения о том, что изменение угла наклона будет определять распределение и число фиксаций на изображении. В случае преимущественного влияния содержательных характеристик на восприятие изображения лица распределение фиксаций взгляда будет оставаться относительно постоянным на определенных областях изображения лица (в области глаз, носа, рта). При преимущественном влиянии ориентационных характеристик основное число фиксаций взгляда будет сосредоточено в одном из четырех квадрантов изображения вне зависимости от изменения угла наклона.
Целью исследования было изучение параметров глазодвигательных реакций (число фиксаций, необходимое для решения простой когнитивной задачи на узнавание; распределение фиксаций по областям изображения) при решении простой когнитивной задачи по возрастной группе.
ПАЦИЕНТЫ И МЕТОДЫ
Общий объем исследовательской выборки составил 97 испытуемых (47 мужчин и 50 женщин) в возрасте 21–36 лет, что соответствует периоду ранней взрослости. Нормирование показателей глазодвигательных реакций осуществляли по возрастным группам: 21–26 лет — 34 человека; 27–32 года — 29 человек; 33–36 лет — 34 человека. 49% испытуемых из общего объема выборки используют средства коррекции зрения (очки или линзы с диоптриями).
В исследовании использовали разработанную авторскую методику и программно-аппаратный комплекс Tobii EyeX (ПО «GazeControl») [18]. Частота записи изображения айтрекером Tobii EyeX Controller составляет 90 Гц. Рабочее расстояние айтрекера — 50–95 см, размеры отслеживаемого пространства — 40–30 см на расстоянии 75 см.
В соответствии с авторской процедурой испытуемым необходимо определить, различаются ли два последовательно показанных изображения лиц (предъявлены изображения лиц двух разных людей) или это изображение одного и того же человека. Ответ фиксировали по каждой предъявляемой паре изображений лиц.
Стимульный материал представлял собой изображения двух типов: схематичные монохромные (рис. 1А) и полноцветные. Каждый тип стимульного материала содержал по 45 пар лиц, разделенных на две группы: 15 пар изображений лиц, в которых угол наклона центральной оси изображения лица составлял 0°; 30 пар лиц, где два стимульных изображения лица различаются между собой углом наклона центральной оси изображения. Шаг угла поворота центральных осей каждого из изображений в паре относительно друг друга вне зависимости от направления составлял 12°. В качестве основания выбора угла поворота изображения в 12° приняты результаты более ранних исследований [19].
Все стимульные изображения имеют разрешение 1600–900 пикселей, формат «.jpg». Монохромное изображение лица содержит черные контуры овала лица, границы волос, ушей, бровей, глаз, носа, рта на белом фоне; полноцветное изображение лица представляет собой фотографию лица мужчины на белом фоне. Каждое изображение (в том числе изображения-интерференции) предъявлялось в течение 3 с, время предъявления одной пары лиц (включая интерференцию) составляло 15 с, время предъявления одного стимульного ряда — 7 мин 30 с, общее время предъявления монохромного и полноцветного стимульного ряда достигало 15 мин.
Между предъявлениями монохромных и полноцветных изображений испытуемый отдыхал в течение 2 мин, мог свободно рассматривать окружение и говорить.
Число допущенных ошибок в суждениях о схожести или различии двух изображений лиц в паре позволяет оценивать особенности процесса зрительного восприятия при изменении угла наклона одного из предъявляемых двух стимульных изображений в паре. Анализ допущенных ошибок распознавания при решении простой когнитивной задачи на узнавание, допускаемых при выполнении экспериментального задания, позволяет определить, при каких углах наклона центральной оси предъявляемого стимульного изображения лица возникают затруднения в узнавании изображений лиц.
По результатам исследования получены тепловые карты распределения взгляда для каждого предъявляемого стимула. Зоны, отмеченные красным цветом на тепловой карте, полученной после прохождения испытуемым авторской методики, обозначаются как фиксации взгляда и подсчитываются. Подсчет числа фиксаций взгляда осуществлялся относительно квадрантов предъявляемого лица.
Статистическую обработку осуществляли с использованием методов сравнительной статистики (непараметрический U-критерий Манна–Уитни с соблюдением ограничений в его использовании; T-критерия Уилкоксона для сопоставления показателей, измеренных в двух разных условиях, на одной и той же выборке испытуемых). Сравнение трех групп участников осуществляли попарно.
РЕЗУЛЬТАТЫ ИССЛЕДОВАНИЯ
Первым этапом осуществляли анализ числа верно распознанных пар схематичных монохромных и полноцветных лиц по всей выборке испытуемых (без дифференциации по возрастным группам). В результате исследования выявлены следующие тенденции: показатель общего числа верно распознанных лиц у мужчин и женщин при узнавании как схематичных монохромных (U = 246; р = 0,453), так и полноцветных (U = 278; р = 0,887) изображений, статистически значимых различий не выявлено. Аналогичные результаты получены также при сравнении групп испытуемых, использующих и не использующих средства коррекции зрения (при восприятии схематичных монохромных изображений U = 272; р = 0,597; при восприятии полноцветных изображений U = 264,5; р = 0,505). Полученные результаты позволяют нам сделать вывод о том, что у испытуемых вне зависимости от пола и использования средств коррекции зрения эффективность решения простой когнитивной задачи на узнавание изображение лиц значимо не различается. Следовательно, факторы пола и использования средств коррекции зрения не являются значимыми для эффективности узнавания.
Далее осуществляли анализ эффективности решения простой когнитивной задачи (распознавания лиц) через расчет показателей общего числа ошибок и общего числа фиксаций (фиксации распределялись по четырем квадрантам изображения). При восприятии схематичных монохромных и полноцветных изображений в целом по выборке испытуемых установлены углы наклона предъявляемых лиц, при которых фиксировалось наибольшее число ошибок (рис. 2).
Максимальное число ошибок при решении простых когнитивных задач на узнавание изображений лиц фиксируется при следующих углах наклона центральной оси изображения лица (как схематичных монохромных, так и полноцветных): 72°, 216°, 312°, 324° и 336°. При повороте оси изображения второго лица в предъявляемой паре относительно первого в границах указанных углов частота ошибок узнавания в среднем составляет 57,6% случаев. При этом установлено, что при восприятии полноцветных изображений тоже высокий процент ошибок выявлен при предъявлении изображения под углом 24° (рис. 2Б), что не установлено при восприятии схематичных монохромных изображений (рис. 2А).
В результате сравнительной оценки числа ошибок по трем возрастным группам получены следующие результаты: статистически значимое увеличение числа ошибок при увеличении возраста (р1 — показатель значимости различий между группами 21–26 лет и 27–32 года; р2 — показатель значимости различий между группами 27–32 года и 33–36 лет; р3 — показатель значимости различий между группами 21–26 лет и 33–36 лет) при узнавании как схематичного монохромного изображения (р1 = 0,014; р2 = 0,016; р3 = 0,014), так и полноцветного изображения (р1 = 0,015; р2 = 0,015; р3 = 0,017) (рис. 3).
Увеличение числа ошибок при увеличении возраста может быть связано со стереотипизацией зрительного восприятия и снижением детализации восприятия. На это указывает характер допускаемых испытуемыми ошибок. Испытуемые первой возрастной группы (21–26 лет) при узнавании изображений лиц допускали ошибки, преимущественно связанные с детализацией восприятия: при последовательном предъявлении одного и того же изображения, но с разными углами наклона утверждали, что это изображения разных лиц. Испытуемые возрастной группы 33–36 лет при решении простой когнитивной задачи на узнавание при последовательном предъявлении изображений разных лиц, отличающихся углом наклона центральной оси изображения, утверждали, что предъявляемые изображения — одинаковые, т. е. допускали ошибки, связанные со стереотипизацией восприятия. При этом в возрастной группе 27–32 года испытуемые допускали оба типа ошибок с равной частотой: не узнавали одинаковые изображения лиц, что связано с детализацией восприятия, и не узнавали два изображения одного и того же лица (обозначаются как разные), обозначаемые нами как ошибки стереотипизации восприятия.
В результате оценки значимости различий показателей общего числа фиксаций взгляда по возрастным группам методом попарного сравнения (с использованием U-критерия Манна–Уитни, р ˂ 0,05) статистически значимых различий выявлено не было. Данный результат послужил основанием для объединения испытуемых трех возрастных групп в общую исследовательскую выборку.
При сравнительном анализе показателей числа ошибок при предъявлении схематичных монохромных и полноцветных изображений с использованием критерия Уилкоксона (р ˂ 0,05) статистически значимых различий выявлено не было (Т = 605; р = 0,763). Полученные результаты позволяют сделать вывод о том, что качество предъявляемого стимульного изображения (схематичное монохромное и полноцветное) не оказывает значимого влияния на эффективность решения простой когнитивной задачи (узнавание изображений лиц). Узнавание происходит по ключевым точкам изображения лица вне зависимости от того, монохромное схематичное оно или полноцветное. Точки фиксации взгляда сосредоточены на линии глаз, носа и рта.
Следующим этапом исследования была оценка числа фиксаций при предъявлении схематичных монохромных и реалистичных полноцветных изображений на всем объеме выборки без дифференциации по возрастным группам с учетом квадрантов. В результате исследования распределения фиксаций взгляда при восприятии схематичного монохромного изображения выявлено следующее распределение максимального числа фиксаций взгляда: в первом квадранте фиксации взгляда фокусируются при углах наклона изображения 24–96°; во втором квадранте фиксации взгляда преобладают при углах наклона 216–348°; в третьем квадранте фиксации взгляда сосредоточены при углах наклона центральной оси изображения 192–228°; в четвертом квадранте максимальное число фиксаций взгляда отмечено при углах наклона изображения 108–180° (рис. 4).
При оценке распределения фиксаций взгляда по квадрантам при предъявлении полноцветных изображений лиц получены аналогичные результаты. В первом квадранте фиксации взгляда сосредоточены при углах наклона центральной оси изображения лица 0–84°. Во втором квадранте фиксации взгляда сосредоточены при углах наклона 240–324°. В третьем квадранте наибольшее число фиксаций взгляда происходит при углах наклона изображения 192–276°. В четвертом квадранте фиксации взгляда преобладают при углах 96–168 ° (рис. 3).
В результате проведенного исследования получено экспериментальное подтверждение значимых различий в распределении фиксаций взгляда при решении простой когнитивной задачи при изменении пространственно-ориентационных (угла наклона центральной оси изображения лица) характеристик изображения лица (как схематичного монохромного, так и полноцветного) на распределение фиксаций взгляда при решении простой когнитивной задачи. Вне зависимости от угла наклона центральной оси изображения фиксации взгляда сфокусированы преимущественно в верхней левой части изображения лица, что проиллюстрировано на тепловых картах (рис. 5).
В качестве общей тенденции следует еще указать на неравномерность распределения фиксаций взгляда по квадрантам, а также множественное повторение траекторий движения. Точки фиксаций сосредоточены в области линии глаз изображения лица. При этом взгляд неоднократно возвращался к точкам фиксации. При восприятии как схематичного монохромного изображения лица, так и полноцветного изображения, скопление неоднократно повторяющихся фиксаций также отмечено в области левой скуловой части (четвертый квадрант) и области рта справа (третий квадрант) (рис. 6).
Специфической особенностью являются множественные фиксации взгляда в области носа справа (третий квадрант) при восприятии полноцветного изображения. При восприятии схематичного монохромного изображения фиксации в области носа отсутствуют полностью. Данная особенность обусловлена тем, что ориентационные характеристики изображения лица (особенности изображения формы и разреза глаз, формы и размера носа, форма и размер губ и пр.) определяют траекторию движения глаз и области фиксации взгляда при решении простой когнитивной задачи.
ОБСУЖДЕНИЕ РЕЗУЛЬТАТОВ
Процедура нормирования предполагает формирование нормативов, среди которых не выявлено половой специфики в параметрах глазодвигательных реакций; фактор использования средств коррекции зрения не оказывает значимого влияния.
На основании полученных результатов исследования были сформированы диапазоны нормативных значений числа фиксаций взгляда с учетом угла наклона центральной оси предъявляемого изображения лица, а также числа допускаемых ошибок (как показатель среднего числа фиксаций и стандартное отклонение с указанием доверительных интервалов). При этом необходимо отметить, что нормативные значения числа фиксаций представлены по всей выборке в целом без дифференциации на возрастные группы, а также без учета качества стимульного материала — схематичное монохромное или полноцветное реалистичное, так как в результате сравнительного анализа статистически значимых различий по данным параметрам не установлено (см. таблица).
На основании полученных экспериментальных данных диапазоны нормативных значений представлены только по возрастной группе 33–36 лет, так как только в данной возрастной группе число допущенных ошибок составляет более 75% от общего числа решаемых когнитивных задач (число допущенных ошибок, превышающее 75%, не является случайным, в то время как до 75% ошибок с большой долей вероятности являются случайными). При этом, нормативным является число ошибок, превышающее 75%, только при определенных углах наклона центральной оси изображения лица.
Таким образом, возрастной фактор становится значимым при решении простой когнитивной задачи на узнавание как схематичных монохромных, так и полноцветных изображений: по мере увеличения возраста респондента снижается показатель успешности распознавания изображения лиц. Сам формат предъявляемого изображения не является значимым при решении простой когнитивной задачи — узнавания изображений лиц. Повторение процедуры исследования не сказывается на получаемых результатах.
Полученные в ходе исследования результаты согласуются с результатами ранее проведенных исследований. Так, доказано, что эффективность узнавания не зависит от числа фиксаций при условии, что их должно быть не менее двух [20], что также подтверждено в нашем исследовании. Также нами подтвержден вывод о том, при изменении пространственно-ориентационных характеристик стимульного изображения (по углу наклона центральной оси изображения) меняется успешность узнавания, являющегося простой когнитивной задачей.
ВЫВОДЫ
В результате проведенного исследования достоверно установлено влияние ориентационных характеристик изображения на распределение фиксаций взгляда. Вне зависимости от угла наклона изображения и его характеристики (схематичное монохромное или полноцветное изображение) распределение фиксаций взгляда фокусируется в первом квадранте изображения. Данная особенность обусловлена культурно-историческими традициями чтения и письма в направлении слева направо и сверху вниз. Можно предположить, что у представителей других культурноисторических традиций распределение фиксаций взгляда будет иным: представители арабских народностей читают в направлении справа налево; следовательно, и распределение фиксаций будет преимущественно в правой верхней части изображения (второй квадрант). При этом формат предъявляемого изображения не влияет на распределение фиксаций взгляда. Выявлены углы наклона предъявляемого изображения, затрудняющие решение простой когнитивной задачи (сравнение и узнавание двух изображений). Максимальное число ошибок в узнавании изображений (схематичных монохромных и полноцветных) лиц зафиксировано при углах наклона изображения 72°, 216°, 312°, 336°. Узнавание полноцветных изображений также затруднено при угле наклона 24°, чего не наблюдается при узнавании схематичных монохромных изображений. Данная особенность обусловлена более сложной структурой полноцветного изображения в сравнении со схематичным монохромным. При рассматривании фотографий фиксации взгляда помимо линии глаз и губ отмечены также в области носа, лба и ушей. Данные детали изображения на фото являются критериями для сравнения; на схематичных монохромных изображениях данные детали являются недифференцируемыми. Практическая значимость полученных результатов заключается в том, что фиксация взгляда в верхней левой части изображения позволяет избегать ошибочной трактовки, основанной на интерпретации связи содержательных областей изображения и параметров окуломоторной активности.