Читать нас в Telegram
Иллюстрация: Ксения Здоровец

Интроспекция и неформальные опросы в лингвистических экспериментах

Экспериментальная лингвистика как область науки зародилась во второй половине прошлого столетия. До того, как эксперименты получили широкое распространение, лингвисты-теоретики основывали свои суждения на интроспекции (то есть пытались представить, как они сказали бы сами). В лучшем случае желаемый тезис подкреплялся неформальным опросом нескольких носителей, зачастую коллег-лингвистов.

Интроспекция и неформальные опросы в современной науке не считаются надёжным источником данных. С распространением лингвистических экспериментов оказалось, что экспериментальные данные не всегда подтверждают утверждения из известных теоретических работ, основанные на интроспекции.

Что такое лингвистический эксперимент

Лингвистический эксперимент — это исследование, направленное на изучение языка и его использования. Он может включать в себя различные методы и техники, чтобы выяснить, как люди взаимодействуют с языком или языковыми элементами (звуками, словами, фразами) и каковы оптимальные варианты их употребления.

Экспериментальные методы пришли в лингвистику из психологии и социологии, и широко применяются в областях, смежных с этими науками: психолингвистике (в том числе в исследованиях детской речи и языковых расстройств) и социолингвистике (например, в исследовании про связь восприятия диалекта и отношения к его носителям). От них применение лингвистических экспериментов распространилось на синтаксис, прагматику и фонологию.

Как выглядит лингвистический эксперимент

Данные, которые лингвист получает в результате эксперимента, могут быть разными в зависимости от задач исследования. Так, с помощью экспериментов на оценку приемлемости собирают оценки предложений (словосочетаний, слов) — насколько грамотно они звучат по мнению участников:

Пример вопроса в эксперименте с оценкой приемлемости предложений. Перевод: «Он имеет себе новую машину. 1 — абсолютно неприемлемо, даже в разговорном контексте. 5 — абсолютно приемлемо». Источник: Here’s you a thesis (Yale University)

Лингвистов могут интересовать и другие типы данных, в том числе время реакции или результат выполнения задания — заполнение пропуска или передвижение предметов на экране. Вот пример задания из другого распространённого типа экспериментов:

Пример задания на принятие лексического решения. Перевод: «Является ли слово на экране реальным или выдуманным? Нажмите Z, если слово существует, и M, если нет». Источник: Visual lexical decision task (Experiment guide)

Несмотря на разнообразие лингвистических экспериментов, всех их объединяют общие принципы построения экспериментального дизайна. Именно они придают экспериментальным данным надёжность и делают возможным применение к ним статистических методов.

Независимые и зависимые переменные

В любом эксперименте есть независимые и зависимые переменные. Зависимые переменные — это характеристики наблюдаемого результата: оценки приемлемости, время реакции, результаты выполнения заданий. Независимые переменные (или факторы) — то, чем исследователь может манипулировать: например, тип синтаксической структуры предложения или фонологические характеристики псевдослова. Независимых переменных может быть несколько (но обычно не больше двух), а их характеристики определяют минимальное число заданий в эксперименте и их распределение между участниками.

Пример лингвистического эксперимента на синтаксическую многозначность

Чтобы продемонстрировать, как устроен лингвистический эксперимент, возьмём вариацию известного эксперимента на синтаксическую многозначность. В нём используются предложения вида Преступник застрелил служанку актрисы, которая стояла на балконе, которые могут быть поняты двумя способами: «служанка стояла на балконе» или «актриса стояла на балконе».

В синтаксисе это явление называется ранним или поздним закрытием (раннее — если придаточное предложение относится к первому существительному, позднее — если ко второму). Известно, что некоторые языки (например, итальянский, японский и польский) предпочитают раннее закрытие, а другие (норвежский, арабский, румынский и т. д.) — позднее. Закономерностей для этого распределения пока не выявлено.

Кроме того, на предпочтение могут влиять самые разные факторы. Проверим два из них: длину придаточного предложения и число имён существительных. Мы будем демонстрировать участникам предложения по очереди, а затем задавать вопрос: Кто стоял на балконе? Независимыми переменными в нашем эксперименте будут длина придаточного (короткое vs длинное) и число существительных (единственное vs множественное). Из четырёх комбинаций их значений получаются четыре условия:

УсловиеДлина придаточногоЧисло существительныхПредложение
1AКороткоеЕд. ч.Преступник застрелил служанку актрисы, которая стояла на балконе.
1BКороткоеМн. ч.Преступник застрелил служанок актрис, которые стояли на балконе.
1CДлинноеЕд. ч.Преступник застрелил служанку актрисы, которая стояла на балконе, несмотря на надвигающуюся грозу.
1DДлинноеМн. ч.Преступник застрелил служанок актрис, которые стояли на балконе, несмотря на надвигающуюся грозу.

Это первый экспериментальный блок. Дальнейшие блоки будут составлены из других предложений: например, в нашем эксперименте также может быть предложение 2B Профессор узнал отца студента, который жил в соседнем доме или 3D Девушка заметила тренеров гимнастов, которые ей нравились ещё с прошлого чемпионата.

Каждый испытуемый увидит только одно предложение из каждого блока — так у него не будет возможности, сравнив предложения из одного и того же блока, догадаться, какие именно параметры варьирования интересуют исследователей. При этом каждое из предложений должно быть использовано в эксперименте и предъявлено равному числу испытуемых.

Далее мы расскажем о нескольких инструментах программирования онлайн-экспериментов, которые используют лингвисты, а также об их особенностях и отличиях.

Пять инструментов для программирования дизайна лингвистических экспериментов

Во время пандемии особое распространение получили онлайн-эксперименты. У таких экспериментов есть ряд минусов: вне лаборатории невозможно создать одинаковые условия для всех испытуемых (освещение, тишина, отсутствие отвлекающих факторов). Зато набор участников в онлайн-эксперимент обычно происходит быстрее и эффективнее. Мы подобрали пять инструментов для создания лингвистических экспериментов в сети (без смс и регистраций).

Ibexfarm

Ibexfarm (Internet-Based Experiments) — одна из первых платформ для программирования лингвистических экспериментов, созданная в 2010 году синтаксистом Алексом Драммондом. Оригинальный сайт платформы прекратил работу в 2021 году, однако создатель выложил код в открытый доступ, после чего на базе других сайтов стали доступны её аналоги. Например, существует полная копия бывшей Ibexfarm на базе Университета Гумбольдта в Берлине.

Эксперимент полностью пишется в виде кода на JavaScript, при этом некоторые типы заданий уже заложены в готовые команды. Например, код для первого задания нашего эксперимента выглядел бы так. Элементы short и single соответствуют значениям независимых переменных. Команда DashedSentence выводит предложение на экран по одному слову (так называемое чтение с саморегуляцией скорости, которое может быть и самостоятельным экспериментальным заданием):

[[«short«, «single«], «DashedSentence«, {s: «Преступник застрелил служанку актрисы, которая стояла на балконе.«},

«Question«, {q: «Кто стоял на балконе?», as: [«Служанка«, «Актриса«]}]

С помощью различных команд можно задать распределение предложений по листам, их порядок, чередование тестовых и отвлекающих предложений и многое другое. Большим плюсом Ibexfarm является отображение во время прохождения любого эксперимента шкалы прогресса, позволяющей испытуемому видеть, какая часть эксперимента уже пройдена.

Из описанных здесь платформ Ibexfarm — единственная предназначена именно для лингвистических, и даже конкретнее, для синтаксических экспериментов. Остальные имеют более широкую специализацию и создавались также для экспериментальной психологии и других когнитивных наук.

PCIbex

Альтернативная версия IbexFarm с упрощённым интерфейсом и расширенным функционалом существует под названием PCIbex.

Интерфейс PCIbex Dashboard

Она поддерживает работу с изображениями и видео и предлагает возможность создания заданий на перемещение объектов по экрану, отслеживания движения мышки и сбора айтрекерных данных. Все платформы на основе IbexFarm полностью бесплатны, а использовать дополнительную платформу для размещения экспериментов онлайн не требуется: вы можете тут же сформировать ссылку, ведущую на прохождение эксперимента.

PsychoPy

Другой инструмент для создания экспериментов — программа PsychoPy (Py означает, что программа использует язык Python). PsychoPy имеет более интуитивный интерфейс, в котором вы видите свой эксперимент как последовательность блоков на оси времени:

Пример пользовательского интерфейса PsychoPy при создании эксперимента. Источник: PsychoPy Documentation

Так, в нижней части изображения выше вы видите последовательность частей всего эксперимента, а в верхней части — содержание одного из блоков этой последовательности. Часть характеристик эксперимента можно задать с помощью интерфейса, часть — через написание кода. Для работы в PsychoPy необходимо установить его на компьютер: у этой программы нет онлайн-интерфейса.

PsychoPy часто используется в лабораторных экспериментах: как видно на изображении, он совместим с айтрекерами и электроэнцефалографами. Несколько лет назад создатели PsychoPy выпустили собственную платформу для размещения экспериментов онлайн — Pavlovia, что упростило использование PsychoPy для онлайн-экспериментов. Pavlovia совместима и с экспериментами, созданными на других платформах, например, с платформой Lab.js.

Lab.js

Lab.js также имеет интуитивный пользовательский интерфейс, где написание кода для многих задач не требуется: вы просто вводите нужные данные в уже заготовленные поля. В зависимости от сложности слайда его можно создать через встроенные шаблоны или с помощью HTML-разметки.

Разница между Lab.js и IbexFarm в том, что они автоматизируют разные вещи: так, Ibexfarm «знает» концепцию экспериментов с суждениями о приемлемости, и достаточно дать ему команду AcceptabilityJudgment, а в шапке кода прописать желаемое количество делений шкалы.

В Lab.js же всю шкалу приходится программировать вручную. Зато в Lab.js удобнее устроен ввод стимулов: их можно хранить в виде таблицы, приписав к ним значения соответствующих параметров. Например, так могут выглядеть первые четыре предложения одного из вариантов нашего эксперимента:

Пример предложений в Lab.js

Тогда задание достаточно прописать один раз, обратившись к содержанию предложения через ${this.parameters.Sentence}, а к вариантам ответа — через ${this.parameters.Early} и ${this.parameters.Late}.

Для рандомизации, ограничения по времени выполнения задания, указания правильного ответа на вопрос (если он есть) код писать не нужно — это можно сделать прямо в интерфейсе. Готовый эксперимент можно сохранить в формате .json и запускать локально: тогда результаты в виде таблицы будут сохраняться на ваш компьютер. Если вы хотите запустить эксперимент онлайн, нужно встроить его либо на платформы типа Pavlovia, либо с помощью инструмента JATOS на собственный облачный сервер — способов запуска онлайн довольно много.

Gorilla

Gorilla одновременно напоминает оба предыдущих инструмента. Это онлайн-платформа, которая соединяет собственный интуитивный интерфейс и элементы написания кода на Python. Как и в PsychoPy, части эксперимента отображаются в виде блоков на оси времени, правда, не слева направо, а сверху вниз. Это можно увидеть в коротком видеовступлении к использованию платформы:

Gorilla Introduction Video (Category naming task). Источник: Gorilla Support

В видео вы могли заметить, что стимулы эксперимента также организованы в виде таблицы, как и в примере для Lab.js выше. В Gorilla не приходится создавать таблицу в интерфейсе самой платформы: её можно сделать в Excel и просто загрузить на платформу файл. Это делает работу со стимулами ещё удобнее, особенно если речь идёт об изображениях и аудио.

В отличие от Lab.js, в Gorilla можно сделать ссылку на прохождение эксперимента без обращения к дополнительным инструментам. Сам эксперимент можно создать и протестировать бесплатно, но за доступ к данным участников придётся заплатить.

Где брать испытуемых для экспериментов?

Самые известные в мире платформы такого рода — это Amazon Mechanical Turk, Prolific и Sona Systems. В рунете их аналогом является Яндекс.Толока. Да, на Толоке можно найти и лингвистические эксперименты! У многих платформ для создания экспериментов, например, у PCIbex и Lab.js, существуют и собственные инструкции по размещению созданных экспериментов на разных онлайн-платформах, и советы по набору испытуемых.

На таких платформах пользователи участвуют не только в экспериментах, но и в опросах, и в выполнении простых заданий. Участники через платформу получают небольшой гонорар.

Другие полезные инструменты

Мы опустили подробное описание программ, по функционалу похожих на уже перечисленные: OpenSesame, Labvanced, Linger, WebExp и некоторых других.

Для организации стимулов существует отдельный инструмент Mix and Match от Кэмбриджского университета. Платформа Worldlikeness (игра слов: метод эксперимента с оценкой приемлемости несуществующих слов часто называют word-likeness task) заявляет себя как инструмент типологической психолингвистики, создания базы данных для разных языков мира. На платформе исследователи могут создавать собственные эксперименты с псевдословами, а участники-волонтёры — проходить их, формируя базу знаний о том, что допустимо, а что нет в разных языках мира.

Функционал программ, представленных в основной части этого текста, частично повторяет друг друга. Поэтому, во-первых, исследователю не обязательно владеть ими всеми, а во-вторых, работе с новой программой достаточно просто обучиться. Тем не менее, полезно знать их различия, чтобы понимать, какая программа лучше всего подойдёт для создания желаемого лингвистического эксперимента.

Источники

  1. Кибрик А. Е. Введение в науку о языке. М.: Буки Веди, 2019. 672 с.
  2. Федорова О. В., Янович И. С. Об одном типе синтаксической многозначности, или Кто стоял на балконе. М.: Наука, 2004.
  3. Giles H. Evaluative reactions to accents. Educ. Rev. 22:211-27, 1990.
  4. Lab.js documentation [Электронный ресурс] // URL: https://labjs.readthedocs.io/en/latest/ (дата обращения: 28.02.2024).
  5. LingLab documentation [Электронный ресурс] // URL: https://linglab.gitbook.io/linglab-documentation/ (дата обращения: 28.02.2024).
  6. PCIbex documentation [Электронный ресурс] // URL: https://doc.pcibex.net/ (дата обращения: 28.02.2024).
  7. Research Software & Tools [Электронный ресурс] // URL: https://experimentalfieldlinguistics.wordpress.com/links/software/ (дата обращения: 28.02.2024).
  8. YouTube@GorillaPsys [Электронный ресурс] // URL: https://www.youtube.com/@GorillaPsyc (дата обращения: 28.02.2024).