Динамика распознавания микроэкспрессий лица в условиях кажущегося движения и зрительной маскировки

Анализ показывает, что все три экспериментальных условия и их сочетания значимо влияют на оценку экспрессий лица. Организация стимульной информации, модальность экспрессии и продолжительность ее экспозиции действительно определяют распознавание мимических выражений; влияние каждой из детерминант носит сложный, взаимоопосредованный характер.

Базовый уровень эффективности распознавания экспрессий в микроинтервалах времени зафиксирован при экспозиции изолированного лица и зависит от модальности эмоции. Точнее всего распознается экспрессия радости (0,97), а также спокойное (0,92) и удивленное (0,91) лицо, менее точно – печаль (0,88), сравнительно плохо – экспрессии отвращения (0,75), страха (0,65) и гнева (0,61). Разная степень аттрактивности базовых экспрессий согласуется с ранее полученными данными в условиях затрудненного восприятия эмоциональных выражений: при их зашумлении, повороте относительно наблюдателя или ограничении времени экспозиции (Барабанщиков, 2012). С введением содержательного контекста перцептогенез растягивается во времени, требуя более продолжительных экспозиций в 100 мс («радость», «удивление», «отвращение») и 200 мс («печаль», «страх», «гнев»); экспозиции в 50 мс соответствуют лишь начальные стадии перцептогенеза. Влияние стробоскопической экспозиции на точность распознавания эмоций носит избирательный характер, охватывая преимущественно экспрессии, имеющие низкую аттрактивность («гнев», «страх», «печаль»).

В отсутствие содержательного контекста длительность экспозиции (50, 100 или 200 мс) лица на эффективность распознавания не влияет (0,81). Наиболее точно оцениваются «радость» (0,97), «удивление» (0,91) и спокойное состояние (0,87), наименее точно – «страх» (0,65) и «гнев» (0,61). При маскировке и кажущемся движении лица с уменьшением времени экспозиции общий уровень распознавания снижается до 0,74. Влияние контекста зависит от «броскости» (аттрактивности) экспрессий: точность оценок «страха» падает до 0,49, «гнева» – до 0,48. Уровни оценок «удивления», «радости» и спокойного состояния в этих условиях совпадают с уровнем оценок изолированного лица.

Сказанное означает, что для завершения перцептогенеза базовых экспрессий в контрольной серии экспозиция в 50 мс вполне достаточна. Ранее сходный результат получен на экспрессиях большого числа натурщиков из базы KDEF (Calvo, Lundqvist, 2008). Ограничение времени экспозиции в данном исследовании также вело к снижению точности распознавания базовых эмоций, однако при экспозиции выражений радости и спокойного состояния эти различия были незначительны (при длительности экспозиции 50 мс «радость» распознается на максимально высоком уровне).

Результаты анализа «ошибочных» ответов позволяют описать обнаруженные феномены в терминах категориальных полей экспрессий (Барабанщиков, 2002, 2009) – систематических идентификаций той или иной экспрессии с рядом других эмоций, проявляющихся в данных условиях. Каждое категориальное поле включает ядро (наиболее частые «верные» ответы), периферию, представленную регулярными «ошибками», и фон (случайные ответы). Соотношение между компонентами динамично и зависит от модальности экспрессии, ее длительности и содержания контекста. Так, с уменьшением времени экспозиции использование кажущегося движения либо маскировки экспрессий значимо меняет структуру категориальных полей, причем в разных контекстах по-разному. Экспрессия страха чаще воспринимается как «удивление», «печаль» и «гнев» – как спокойное лицо. Роль мимических признаков экспрессий в формировании целостного образа эмоционального лица меняется. По существу, условия маскировки и кажущегося движения моделируют тот этап перцептогенеза, на котором признаки экспрессий лишь начинают дифференцироваться, создавая предпосылки конкретизации актуализируемого прототипа выражения лица.

Основной результат выполненного исследования заключается в том, что по сравнению со статичной экспозицией кажущееся движение не приводит к увеличению точности распознавания эмоций. Как и в случае реального движения, статичное изображение сильных экспрессий содержит всю информацию, достаточную для эффективной оценки выраженной эмоции. Влияние контекста на эффективность восприятия экспрессий зависит от их модальности. Для «печали», «гнева» и «страха» кажущаяся динамика лица снижает точность распознавания в большей степени, чем рандомизированное лицо, особенно при минимальном времени экспозиции. Негативное влияние маскировки ярче проявляется при экспозиции «удивления», «отвращения» и спокойного выражения лица. В итоге средние оценки экспрессий в условиях кажущегося движения и маскировки практически совпадают, указывая на функциональное сходство стимульных ситуаций. Это означает, что кажущееся движение лица включает момент маскировки, а прямая и обратная зрительная маскировка – возможность кажущихся изменений. С увеличением длительности экспозиции экспрессии до 200 мс негативное влияние и маскировки, и кажущегося изменения лица снимается.

2.2. Вербализация экспрессий, экспонируемых в разных контекстах

Пытаясь разобраться в механизме влияния стробоскопической стимуляции на восприятие эмоциональных выражений лица, мы провели еще один эксперимент на группе экспертов в области науки о лице. Нас интересовали способы ориентировки подготовленного наблюдателя в рассмотренных ситуациях и характер его ответов. Основной метод исследования – вербальные описания видимых сцен.

Метод свободных описаний

Исследование проводилось на том же оборудовании и с тем же стимульным материалом, которые использовались в первом эксперименте. Участники эксперимента: 7 человек (5 женщин, 2 мужчины; возраст – 27–54 года, медиана – 47 лет) с нормальным или скорректированным до нормального зрением, специалисты, изучающие восприятие лица.

Эксперимент 2 включал три серии с тем же содержанием контекста, что и в эксперименте 1. В отличие от процедуры первого эксперимента, тестовые изображения всегда предъявлялись на 50 мс; каждая из семи экспрессий, выраженная каждым из шести натурщиков, предъявлялась по одному разу (всего 42 пробы); порядок предъявления – случайный. Варианты ответов не предлагались. От наблюдателей требовалось в каждой отдельной пробе словами описать выражение лица натурщика, а также любые другие замеченные особенности изображения. Ответы записывались на диктофон. Тренировочная сессия не проводилась.

Полученные аудиозаписи расшифровывались и соотносились с каждым из экспериментальных условий. В вербальных описаниях, данных участниками исследования, выделялись следующие классы дескрипторов: 1) называние конкретной эмоции (например: «гнев», «горе» и др.) или общая оценка модальности («негативная эмоция»); 2) описание мимики в отдельных зонах лица – лба/бровей, глаз, носа, рта (например: «нахмуренные брови», «открытые глаза», «наморщенный нос», «растянутый рот»); 3) указания на движения головы (например: «кивок», «поворот головы слева направо»); 4) недифференцированное восприятие движения/изменения изображения в целом («мимолетное движение», «сдвиг изображения», «что-то изменилось»); 5) значительные затруднения в определении эмоции, приводящие к отказу давать ответ («непонятно, какая эмоция»). Помимо основных дескрипторов часто отмечался пол натурщика и особенности его внешности (например: «девушка, блондинка»).

Точность распознавания экспрессий оценивалась на основании содержания дескрипторов, указывающих на модальность эмоции. Верными считались те описания, в которых эмоция была названа однозначно и совпадала с состоянием, которое изображал натурщик. К этой же категории относились и синонимичные описания; так, для экспрессии гнева адекватными считались описания «гнев», «злость» и однокоренные слова; для «страха» – «страх» и «испуг»; для «радости» – «радость» и «улыбка»; для нейтрального лица – «нейтральное», «спокойное», «без эмоции»; для «печали» – «печаль», «грусть» и «горе»; для «удивления» и «отвращения» синонимы в категорию верных ответов не включались. Частично верными ответами считались неоднозначные описания, включавшие верный дескриптор, например: «либо гнев, либо горе» для экспрессии «гнева». «Ошибочными» ответами считались все иные описания эмоциональных состояний, а «отказами» – ответы, в которых называние эмоции отсутствовало.

Доминантность мимических признаков оценивалась по предпочтениям, отдаваемым в описаниях верхней (брови – лоб), средней (глаза – веки – основание носа) и нижней (рот – подбородок) частей лица либо его отдельных элементов. Примеры подобных высказываний: «поднятые брови», «наморщенный лоб», «увеличились глаза», «широко открытый рот», «напряжение вокруг носа».

Влияние кажущегося движения головы устанавливалось путем соотнесения предметных описаний воспринятого изменения расположения лица с точностью распознавания экспрессий либо с их доминантными признаками («наклон головы вперед, кажется, это был гнев»; «движение назад небольшое, изменение в области рта, даже зубы видел, вероятно, это отвращение»). В подобном ключе рассматривались описания изменений изображения при невозможности (затруднениях) раскрыть его содержание («было движение, непонятно какое; эмоции не было вообще»).

Анализ результатов включал сопоставление долей соответствующих дескрипторов в зависимости от модальности экспрессии и содержания контекста. Статистическая оценка значимости различий анализируемых параметров ввиду небольшого объема выборки не проводилась.

Вербализация экспрессий, предъявляемых в контекстах

Точность распознавания экспрессий. Полученные данные показали, что доля верных ответов зависит как от модальности экспрессии, так и от содержания контекста, в котором она экспонировалась (рисунок 2.5). Наибольшая доля адекватных описаний выявлена в контрольной серии – экспозиции лица на фоне чистого экрана (0,78). С введением маскировки точность распознавания снижается (0,59), а при использовании стробоскопической стимуляции становится предельно низкой (0,45). Уменьшение доли верных ответов происходит за счет увеличения количества отказов от описания эмоции (от их практического отсутствия в контрольной серии до 0,10 и 0,30 в условиях рандомизированной маски и кажущегося движения соответственно). Доли ошибочных и частично верных ответов в трех экспериментальных сериях находятся на одном уровне.

Наибольшая средняя точность распознавания получена при экспозиции «радости» (0,80), нейтрального лица (0,77) и «удивления» (0,68). Для экспрессий страха (0,48), печали (0,48) и гнева (0,40) она снижается на фоне увеличения доли ошибочных ответов. Соотношение уровней точности распознавания тестируемых эмоций в каждой из трех серий в целом сохраняется. Доли отказов и частично верных ответов с модальностью эмоции систематически не связаны. Соотношение верных, частично верных, ошибочных ответов и отказов при распознавании эмоций на лицах разных натурщиков практически не менялось.

Рис. 2.5. Точность распознаваний экспрессий в зависимости от их модальности и содержания контекста: серия 2.1 – кажущееся движение; серия 2.2 – маскировка; серия 2.3 – изолированное лицо

При анализе «ошибочных» и частично верных ответов выявлены следующие особенности. Экспрессия радости (0,09) и нейтральное лицо (0,10) в отдельных случаях смешиваются с «гневом», «отвращением» или «страхом». Экспрессия удивления ошибочно распознавалась как «страх», независимо от содержания контекста (0,13). Экспрессия отвращения при любом содержании контекста смешивается, прежде всего, с «гневом» (0,18). Для экспрессии гнева структура «ошибок» трансформируется: если при кажущемся движении или изолированном лице «гнев» воспринимается как «печаль» (0,11) либо «отвращение» (0,09), то при маскировке рандомизированным паттерном он смешивается с нейтральным лицом (0,24) и «отвращением» (0,12). «Страх», экспонируемый при кажущемся движении либо на изолированном лице, смешивается с «удивлением» (0,17), реже – с «гневом» (0,08) и «отвращением» (0,06); при введении маскировки среди «ошибочных» ответов доминируют «печаль» (0,14) и «удивление» (0,12). «Печаль» отождествляется с нейтральным лицом (0,19), причем при маскировке доля смешений возрастает до 0,36. Таким образом, при экспозиции лица на фоне чистого экрана и кажущегося движения структура «ошибочных» идентификаций экспрессий гнева, страха, печали сохраняется, в то время как маскировка лица ведет к ее трансформации.

Описания признаков экспрессий и движений головы. В процессе распознавания эмоциональных экспрессий наблюдатели указывали на отдельные доминантные особенности лица, характерные для демонстрируемой эмоции. Чаще всего описывалась зона губ и зубы (0,23). Различия в частоте упоминания рта зависели от модальности эмоции и содержания контекста. Например, для «радости» и «удивления» в условиях кажущегося движения область рта упоминалась с частотой 0,6; в условиях изолированного лица – 0,45 и 0,38 соответственно; при маскировке частота упоминаний рта снижалась до 0,19 и 0,17. При распознавании «страха» и «отвращения» рот натурщика описывался как в условиях кажущегося движения (0,14 и 0,40 соответственно), так и изолированного лица (0,33 и 0,21); для «гнева» и «печали» рот упоминался только в условиях изолированного лица (0,29 и 0,17).

Реже описывалась зона глаз. Для «удивления» и «страха» в условиях кажущегося движения – 0,12 для обеих экспрессий; в отсутствие контекста – 0,26 и 0,31 соответственно. Для «радости» и «отвращения» область глаз упоминалась только при экспозиции изолированного лица (0,12). При распознавании «гнева» и «печали» глаза не упоминались; при демонстрации изолированного лица внимание наблюдателей направлялось в область лба/бровей (0,21 и 0,14, соответственно), смещаясь в условиях кажущегося движения на движения головы натурщика. Мимические признаки в области носа систематически упоминались только при экспозиции «отвращения» в отсутствие контекста (0,21).

«Лицевые жесты», или видимые смещения лица, сопровождаемые движениями головы, описывались только в условиях стробоскопической стимуляции и только для экспрессий гнева (0,48 – для «жестов», 0,14 – для движения), страха (0,12 для обоих классов дескрипторов) и печали (0,36 и 0,14, соответственно). Для «гнева» характерным жестом было «движение головы вперед», «наклон вперед» или «кивок». Для «страха» – «движение назад», «напряжение в шее». При экспозиции «печали» наблюдатели описывали «поворот головы», «движение назад» или «кивок вперед».

При экспозиции спокойного лица мимика не описывалась. Сдвиг изображения, используемый во время стробоскопической экспозиции, замечался (0,43).

Трудности категоризации,

...

9 10 11

Премиум

(0 оценок)