Общая характеристика процедуры семантического наполнения понятий
Процедура семантического наполнения понятий (ПСН), направленная на извлечение семантического ядра, состоит из трех последовательных этапов.
Первый, собственно экспериментальный этап заключается в получении разнообразного вербального материала по моделируемому понятию.
На втором этапе этот вербальный материал сводится к инварианту, сформулированному в словах естественного языка – но с тенденцией к обеднению словаря и с предпочтением по возможности семантических примитивов по Вежбицкой. Семантический инвариант, извлеченный из разнообразных произвольных высказываний, содержащих анализируемое понятие, представляет собой семантическое ядро этого понятия. Однако в руках разных исследователей словесные формулировки инварианта могут существенно различаться, что противоречит поставленной «картографической» задаче. Для унификации формулировок и, соответственно, минимализации интерпретативной произвольности, вводится третий этап.
На третьем этапе произвольно сформулированный инвариант помещается в оболочку метаязыка, созданного непосредственно для решения поставленной задачи. Для этого произвольные слова, в которых был сформулирован инвариант на втором этапе ПСН, определяются как «сырые слова» (по аналогии с «сырыми баллами») и переписываются в оболочке метаязыка. Сам метаязык создавался рекурсивно в ходе ПСН по системным алгоритмам, которые будут описаны ниже.
Перейдем к подробному описанию каждого из трех этапов ПСН.
Поэтапное описание процедуры семантического наполнения понятий
Первый этап. Получение вербального материала. Способы получения и обработки вербального материала
На первом этапе от группы испытуемых – носителей языка необходимо было получить вербальный материал, содержащий контексты с исследуемым понятием, подлежащим формализации. Задачей было получение максимально конкретных ответов. В зависимости от семантической сложности понятия применялась одна из следующих инструкций.
Наиболее простым и подходящим для «группового» использования был способ, при котором испытуемым просто предлагали составить 10–15 предложений со словом, обозначающем соответствующее понятие. Чтобы избежать преобладания в ответах абстрактных слов, не имеющих конкретного десигнанта, испытуемых просили объяснить смысл исследуемого понятия для маленького ребенка. После подобной просьбы они обычно переходили от общих и расплывчатых высказываний к простым и конкретным, сопровождая свои объяснения наивными жизненными примерами. Эта модель показала свою высокую эффективность при работе с предикатами, причем предпочтительнее оказалось предъявлять исследуемый предикат в виде личной формы глагола, чем в виде другой части речи. Например, при получении вербального материала для понятия Любовь испытуемые выполняли задание быстрее и использовали больше конкретной лексики, когда задание сформулировалось так: «Напишите 10 предложений по следующей схеме: меня любит (…), потому что (…)». Другая модель: «Напишите 10 предложений по следующей схеме: любовь – это когда (…)» – работала медленнее и с большим количеством абстрактной лексики.
Однако для исследования некоторых понятий, слишком очевидных интуитивно, чтобы поддаваться каким-либо вербальным объяснениям, описанные варианты инструкции оказывались неэффективными. В попытке объяснить такие понятия испытуемый начинал беспомощно делать жесты руками, сопровождая их несвязными междометиями. В случае подобного отказа в действие вступала индивидуальная инструкция: испытуемому предлагался ряд ситуаций, из которых его просили выбрать те, что могут служить примером понятия. Затем следовало останавиться на отвергнутых и обсудить, как нужно достроить эти отвергнутые ситуации, чтобы они тоже подошли под определяемое понятие.
В результате первого этапа каждому исследуемому понятию оказывалось поставленным в соответствие множество множеств контекстов-узусов: каждый испытуемый создает свое множество узусов, а множество всех откликов всех участвовавших в эксперименте людей представляет собой множество множеств. Таким образом, вербальный материал, полученный от экспериментальной группы, можно было интерпретировать как глоссарий. Глоссарий – это особый тип словаря. В отличие от толкового, он не предлагает истолкований слова и, в отличие от двуязычного, не дает перевода слова на другой язык. Вместо этого в нем приводятся различные употребления (узусы) одного и того же слова в различных контекстах (ср., наир., словарь Срезневского)
Полученный материал отличается от материала традиционного глоссария своим удобством для последующей формальной обработки: каждое отдельное множество откликов имплицитно отражает систему взглядов, представлений, эмоционального опыта одного конкретного человека, содержит систему свойственных именно ему смысловых оппозиций, а множество множеств уже не связано с индивидуальностью конкретного испытуемого.
Экспериментальная корректность первого этапа ПСН
Здесь следует специально остановиться на проблеме экспериментальной корректности.
Какова минимальная величина экспериментальной группы? Каковы должны быть характеристики контрольной группы? Как оценить вероятность артефактов?
И наконец, как осуществлялся отбор испытуемых в экспериментальную группу и какова была контрольная группа?
Суть процедуры ПСН, при которой высказывания испытуемых «суммируются», состояла в том, что из них извлекались общие для любого носителя русского языка значения. Напротив того, сугубо индивидуальные или случайные значения, которые могли бы встретиться в высказываниях некоторых испытуемых (реально такая ситуация возникала редко), не учитывались. Инвариант в сырых словах формировался только из повторов. Исходя из этого, можно грубо оценить погрешность: при увеличении количества испытуемых в экспериментальной группе возрастала вероятность, что значения, отвергнутые как индивидуальные, будут повторены кем-либо из испытуемых, после чего их следует ввести в инвариант; наоборот, при уменьшении количества испытуемых может возрастать количество индивидуальных, отвергаемых значений и уменьшаться количество инвариантных, общих значений. Другими словами, инвариантное значение, извлеченное из ответов 100 испытуемых, оказывалось несколько богаче (то есть включало в себя больше значений), чем то, что было выведено из ответов пяти. Таким образом, при увеличении экспериментальной группы к множеству тех значений, которые обнаружились при работе с пятью испытуемыми, добавлялись иногда еще несколько значений, но ни одно значение из тех, которые были получены в небольшой группе, не отменялось и теоретически не могло отмениться. Поэтому работа с небольшой экспериментальной группой создавала лишь риск снизить степень подробности, но риск принять несуществующие значения за существующие не возникал.
Содержательная часть ПСН определила и специфику отбора испытуемых в экспериментальную группу: отбор испытуемых для задач по семантическому наполнению понятия (ПСН) отсутствовал, поскольку отсутствует «частная собственность на язык» (Вежбицкая), гарантируя понимание слова любым носителем языка – в противном случае понимание между людьми было бы невозможно и каждый человек был бы заперт «в тюрьме собственного языка».
Оптимальное число участников также связано с содержанием процедуры, хотя и было уточнено эмпирически. Для экспериментальной группы было сочтено достаточным 5—10 носителей языка; их пол, возраст и индивидуальные личностные и ситуативные особенности никак не оказывали влияния на результаты и были нерелевантны в отношении проводимого исследования.
Минимальным числом участников экспериментальной группы можно в пределе считать одного носителя языка. В этом случае инвариант окажется беднее, чем при большем числе испытуемых, но, как уже было указано выше, останется полноценным инвариантом. Ни одно из извлеченных для него значений не может быть отменено в случае увеличения экспериментальной группы, хотя дополнительные значения могут быть добавлены. Речь, таким образом, идет всего лишь о большей или меньшей подробности инварианта. Эмпирически удалось установить, что отклики 10 и 100 испытуемых практически совпадают по степени подробности, в то время как отклик одного испытуемого может оказаться в среднем на 3 значения беднее.
Артефакты при применении ПСН не могут возникнуть. При любом произвольном числе испытуемых в экспериментальной группе не возникнут ситуации, когда несуществующее будет проинтерпретировано как существующее: любые семантические повторы отражают некоторое существующее в языке событие. Однако даже если предположить осознанный сговор нескольких испытуемых, следствием которого становятся их намеренно «неправильные» ответы (психолингвистический вариант декартовского «злого даймона»), то последствия такого сговора лишь создадут тупиковое ответвление инварианта, которое далее не будет возникать в других спонтанных высказываниях. Напротив, вероятность утрат реально существующих значений велика, не поддается количественной оценке и сохраняется при любом произвольном увеличении числа испытуемых в группе.
В психолингвистическом эксперименте описываемого типа принципиально снимается необходимость контрольной группы, поскольку в ракурсе поставленной задачи (сугубо редукционистской в своем главном условии) любой носитель языка никак и ничем не отличается от любого другого носителя языка: все индивидуальные лингвистические (стилистические, прагматические и идиолектные) различия, как и психологические особенности, подлежат осознанному и последовательному «стиранию». В принципе, контрольной группой могли бы стать такие носители русского языка, которые бы, говоря абсолютно непонятно для экспериментальной группы, тем не менее были бы понятны друг для друга. Но в этом умозрительном случае речь шла бы о носителях другого, чем русский, языка.
По завершении первого этапа ПСН – получения достаточного вербального материала – следовал переход ко второму этапу.
Второй этап ПСН. Выделение из вербального материала инварианта/инвариантов с формулированием его/их в сырых словах
На втором этапе множество множеств откликов-узусов подлежало обработке. Из каждого множества откликов выделялся инвариант: то общее, что содержалось во всех высказываниях одного испытуемого. Затем из множества полученных инвариантов вновь выделялся инвариант. Подобная «двойная дистилляция» позволила нейтрализовать случайные клише, социально-одобряемые ответы и пр., уменьшая до минимума уровень информационного шума.
Извлечение инварианта проводилось по обычной технологии работы с глоссарием. Из вербального материала выбирались семантические повторы. Повторы суммировались, и инвариант формулировался в «сырых словах», то есть на естественном языке, но с тенденцией к бедности словаря. Результатом второго этапа было получение инварианта понятия в «сырых словах».
Первый этап ПСН был сугубо эмпирическим, а второй, как легко убедиться, опирался почти исключительно на «здравый смысл» исследователя, и вследствие этого оценить строгость и однозначность его результатов было сложно. Собственно, имелось всего два пути для изменения статуса этих результатов с интерпретативного на строгий. Один из них, достаточно традиционный, – это использование для верификации экспертной группы, консолидированное мнение которой подтверждало бы или опровергало полученную на втором этапе интерпретацию. Нами этот путь был отвергнут как недостаточно точный: отбор экспертов в группу при подобном подходе остается на совести самого отбирающего и создает возможность получения желаемого отклика. Нами был избран второй путь, также достаточно традиционный в лингвистике и в области искусственного интеллекта, но сохраняющий статус «экзотического» в психологических исследованиях. Этот путь – гораздо более трудоемкий, но безупречный с теоретической точки зрения – предполагает переформулирование результатов более или менее произвольной интерпретации на метаязык, специально созданный под поставленную задачу. Такое собственно математическое решение требует существенных дополнительных усилий, поскольку, в отличие от других математических методов, например, от элементарных статистических, не позволяет воспользоваться готовыми формулами, а требует математизации заранее не известных и, возможно, не описанных до сих пор структур.
Третий этап. Формализация инварианта в оболочке метаязыка. Метаязык как способ корректного представления инварианта. Общее описание
На третьем этапе высказывания в сырых словах подлежали формализации. С этой целью был разработан формальный метаязык.
Третий, метаязыковой этап процедуры семантического наполнения понятий подразумевал изменение словесных высказываний на естественном языке на высказывания, «сконструированные» некоторым особым образом.
С помощью каких слов следовало их конструировать? Исходя из поставленной цели, они должны по каким-то причинам удовлетворять нас больше, чем предшествующие им высказывания участников эксперимента: и испытуемых, и экспериментаторов.
Общие функциональные характеристики метаязыка
Язык описания, или метаязык, – это логический инструмент, используемый для защиты системы утверждений от произвольности и неопределенной множественности интерпретаций. Количественные математические подходы, являясь почти идеальным в своей универсальности метаязыком, обеспечивают формальную строгость и жестко ограничивают множественность интерпретаций в самых разных областях исследования – от физики и до статистики. Однако в качественных исследованиях, например, в теории игр, в биологии, в формальной семантике, количественные математические подходы часто оказываются слишком грубыми и потому малоэффективными. В этих случаях успешно используются не количественные, а качественные метаязыки, обладающие меньшей универсальностью, чем «количественная математика», и разрабатываемые специально «под задачу». Именно к этому типу – к качественным метаязыкам – должен был принадлежать метаязык ПСН, разработанный под конкретную задачу.
Эвристический материал «пуговичного эксперимента» как множество объектов, подлежащих формализации
В качестве объекта формализации были выбраны ключевые элементы экзистенциальной интерпретации «пуговичного эксперимента»: Пространство, Время, Идентичность, Смерть, Свобода. Детальное описание эксперимента содержится в [Н-Г, 2014], здесь же остановимся на нем коротко.
Участнику эксперимента предлагался набор из 9 пуговиц разной величины, цвета и фактуры, выложенных на лист бумаги на столе. Инструкция сводилась к тому, чтобы участник эксперимента «показал, как с ними можно играть». В ходе эксперимента все без исключения испытуемые, как дети, так и взрослые, действовали по одной схеме: (1) они выбирали среди пуговиц одну, которая обозначалась как «исключительная»; (2) эта пуговица некоторое время взаимодействовала с другими, причем другие пуговицы по ходу игры определялись как одушевленные (фигуры), или неодушевленные (вещи), или сбрасывались за пределы листа как «ненужные»; (3) в какой-то момент появлялась «Черная Пуговица», олицетворявшая зло (злой дядька, медведь и пр.),
О проекте
О подписке