Михаил Даниэль — лингвист и социолингвист, многие годы занимающийся изучением языков Дагестана. Мы поговорили с ним об академической и социальной программе сохранения языков, об использовании цифровых инструментов современными лингвистами и о том, чем социолингвистическая экспедиция отличается от лингвистической.
О малых языках и о том, что им угрожает
Малый язык — это нечёткое, мутное понятие. Более осмыслен термин угрожаемый язык, или по-английски — endangered language. Для разных регионов, для разных типов языковых экологий (по-русски часто говорят «языковая ситуация») угрожаемым или неугрожаемым считается язык с разным количеством носителей. Есть вполне устойчивые языки, которые прекрасно выживают с несколькими сотнями, иногда даже десятками носителей, а есть угрожаемые языки, у которых носителей тысячи и сотни тысяч. Об этом хорошо пишут в учебнике по социолингвистике Николай Борисович Вахтин и Евгений Васильевич Головко (Вахтин Н. Б., Головко Е. В. Социолингвистика и социология языка. СПб: Изд-во Европейского университета в Санкт-Петербурге, 2004. 336 с. — прим. ред.).
Интересней понять, что такое угрожаемый язык, откуда исходит для него угроза и можно ли её нейтрализовать
Что значит, что язык находится в стабильном, устойчивом состоянии, то есть в таком состоянии, когда за его выживание можно не беспокоиться? Можно было бы представить, чисто гипотетически, что число людей, говорящих на языке, растёт. Но я не знаю угрожаемых языков России, у которых количество носителей увеличивается. Я не уверен, что в России есть даже и крупные языки с такой динамикой (кроме русского). Может вырасти, скажем, количество людей, называющих себя аварцами, но этот рост происходит за счёт населения городов, а в городах этнический язык очень быстро — иногда уже в первом поколении — утрачивается. Дагестанские дети, родившиеся в Махачкале, чаще всего почти не говорят на языке своих родителей, даже если те выросли в селе. Основным симптомом утраты языка является именно прекращение его передачи от родителей к детям. В благоприятной ситуации состояние этнического языка может быть стабильным, но в тех регионах, в которых работаю я, оно не улучшается.
При этом, мне кажется, надо различать устойчивую и неустойчивую стабильность. Про ситуацию в Дагестане мы довольно долго думали именно как о неустойчиво стабильной. Мы понимали, что выживание дагестанских языков зависит от того, в какую сторону качнётся динамика миграции между городами и сёлами Дагестана. В сёлах языки Дагестана хорошо сохраняются, а в городах быстро теряются. И мы думали так: пока этим языкам ничего не угрожает. Если люди не начнут массово уезжать из деревни, то будет оставаться хоть сколько-нибудь людей, активно говорящих на этих языках. С другой стороны, были все признаки того, что миграция с гор на равнину может в любой момент принять массовый характер. То есть мы видели именно такое неустойчивое равновесие: качни немножко, щёлкни — и всё начнёт падать. Так и случилось в результате, хотя и неожиданным для нас образом: сейчас мы видим, что даже в сёлах дети переходят на русский язык, что лет десять или пятнадцать назад нам казалось совершенно невозможным. У дагестанцев есть такой распространённый анекдот: мы присылаем детей из города к сельским детям на каникулы, чтобы они выучили родной язык, а в результате они учат сверстников говорить по-русски. Этот анекдот разошёлся по Дагестану как популярная народная оценка языковой витальности и угрожаемости.
У дагестанцев есть такой распространённый анекдот: мы присылаем детей из города к сельским детям на каникулы, чтобы они выучили родной язык, а в результате они учат сверстников говорить по-русски
До самого последнего времени я редко встречал сельские сообщества, которые были бы озабочены проблемой сохранения своего языка. Первый раз я столкнулся с таким отношением в Карате — это районный центр, главное село Ахвахского района. Сейчас я вижу, что такого же рода идеи очень сильно распространились в соседнем селении Тукита. Люди начинают понимать, что язык может потеряться, только когда видят, что он уже начинает теряться, когда потеря подошла довольно близко. Если дети начинают на улицах говорить между собой по-русски, это трудно обратимый процесс. У нас есть очень близкий друг, носительница алюторского языка, и я вижу, что у них с сестрой болит душа за их язык. Они очень сильно переживают, но при этом они уже даже между собой не общаются на алюторском языке, они говорят по-русски, и непонятно, что могло бы спасти этот язык. Очень не хочется говорить эти слова, но кажется, алюторский уже прошёл точку невозврата.
Давайте я кратко суммирую вышесказанное. В очень хорошей ситуации так называемые малые языки России сохраняются в местах исконного проживания — например, в тех сёлах Дагестана, где отток населения в города не носит катастрофического характера. Но в последнее время даже и в этих сёлах, по крайней мере в тех зонах, которыми я занимался, русский язык у детей начинает понемногу вытеснять малые языки. Увеличение численности этнической группы возможно, но при этом оно происходит без сохранения этнического языка. Люди расселяются, их становится больше, они ощущают себя членами того или иного сельского сообщества, сохраняют с ним связи, обязательно приезжают на свадьбы и на похороны — но язык тем не менее утрачивается. А обеспокоенность состоянием языка в сообществе обычно возникает только тогда, когда признаки утраты языка уже слишком хорошо видны.
Сохранение языка: социальное и академическое измерение
Для начала оговорюсь: я совсем не специалист по ревитализации языков и языковой политике. То, что я могу сказать по этому поводу, будет исходить из каких-то моих общих, возможно, довольно стереотипных представлений об активизме, о государстве и об их взаимной ортогональности. Государство пытается что-то делать сверху, активизм пытается делать что-то снизу, и чаще всего государство с большим подозрением к этому относится. Моя работа чисто научная и не связана с сохранением языка напрямую: она не направлена на то, чтобы поддерживать языковое сообщество в состоянии устойчивого равновесия и предохранять его от утраты языка.
Задача сохранения языка гораздо сложнее, чем многие другие социальные задачи, которые стоят перед государством. Я считаю, что выстроить демократическое государство в некотором смысле проще, чем сохранить язык или языки, потому что навязать гражданам демократические ценности — если у государства внезапно возникнет такое желание — проще, чем навязать членам языкового сообщества желание использовать этнический язык. Например, многие мои друзья, горожане родом из дагестанских сельских сообществ, искренне переживают за свои языки — но они живут в городе, а не в селе и заставить себя говорить со своими детьми на этнических языках всё равно не могут. Даже если бы государство предпринимало какие-то очень мудрые шаги и тратило на сохранение языков массу денег, в эпоху неизбежной глобализации дело сохранения языков всё равно было бы очень непростым.
Выстроить демократическое государство в некотором смысле проще, чем сохранить язык
Желание сохранить свой язык может возникнуть как реакция на неправильное, неадекватное действие государства, а вот может ли государство этот процесс возглавить? Все усилия по преподаванию родного языка в школе, по моим представлениям, малоэффективны (не решаюсь сказать бесполезны). Я не говорю про крупные языки типа татарского или чувашского, я не знаю, что с ними происходит, но для языков сельского Дагестана, или Таймыра, или Камчатки преподавание в школе, как мне кажется, — мёртвому припарки. И уж точно — когда это единственные меры, которые принимаются государством. Это хорошо и приятно, когда вдруг выясняется, что государство выделило какие-то ставки на людей, которые пытаются заниматься с детьми их этническим языком (просто потому, что приятно, когда государство вдруг хотя бы правильными вопросами начинает задаваться) — но степень полезности этих усилий для меня сомнительна.
В Дагестане некоторые директора школ рассказывали мне, что им сверху предложили выбрать один из двух вариантов программы. В одном варианте было больше часов на аварский язык. Тем не менее родители вместе с директором устроили собрание и решили: «Нет, мы хотим ту программу, где меньше аварского языка и больше русского, потому что русский язык сейчас гораздо важнее социально». А ведь аварскому языку многие жители Северного Дагестана приписывают большую ценность, чем родному, этническому языку.
В тех сельских общинах, где взрослые озабочены проблемой сохранения языка, надо ещё озаботить и детей. Потому что дети больше ориентированы на внешний мир, на какие-то современные вещи, для которых нужен русский язык, а сельский язык бесполезен. Я помню одного такого пятилетнего хипстера, который навсегда прилип к сотовому телефону, а родители вздыхали, что он говорит только по-русски. Пугающее было зрелище: мало того, что родителям приходится говорить с сыном на неродном языке, он ещё почему-то подносил телефон к самым глазам. Было действительно такое ощущение, что весь мир для него ограничился интернет-контентом. Может ли в такой ситуации помочь несколько часов преподавания языка в школе? Что делать с детьми? Есть ли хоть у кого-то ответ на этот вопрос?
Для сохранения многих угрожаемых языков преподавание в школе, по моему мнению, — это мёртвому припарки
До сих пор я говорил про то, что идея сохранения языка — это идея построить такую языковую ситуацию или так повлиять на неё, чтобы количество носителей не сокращалось. А для этого необходимо, чтобы языки передавались детям. Я уже говорил выше, что основной симптом сохранности или угрожаемости языка — это именно степень его передачи детям от родителей. Пока язык передаётся, можно считать, что ситуация стабильна. Когда он перестаёт передаваться, боюсь, уже слишком поздно что-то делать.
А вот с точки зрения лингвиста, сохранение языка — это сохранение хотя бы информации о нём. Для учёного сохранение языка — это в некотором смысле энтомологическая задача. Мы должны успеть сохранить то, что есть, зафиксировать, заморозить, засушить, заспиртовать — не пытаясь сохранить язык в его живой форме. Лингвист может составить словарь, записать тексты, попытаться собрать как можно больше материалов по грамматике — но это такой препараторский подход: «В формалин и на полку».
В этом смысле сохранить язык точно возможно (и необходимо), и все носители вне зависимости от возраста могут такому сохранению поспособствовать. Если человек понимает, что его язык уходит, он сам будет стремиться его зафиксировать, записать как можно больше слов — надо только дать ему такую техническую возможность. Немножко труднее объяснять людям, что целые тексты тоже важны, и этим текстам не обязательно иметь эстетическую или историческую ценность.
Сейчас я как раз взаимодействую с таким языковым сообществом — с людьми, которые говорят на одноаульном языке, языке одного села. Носители устроили WhatsApp-группу, в которой люди все вместе собирают лексические данные, записывают их. Там два активных человека, которые занимаются лексикографической работой, а остальные очень увлечённо участвуют в сборе лексического материала. Есть и специальные приложения, ориентированные на то, чтобы помочь носителям в этом благородном деле.
Мы должны успеть сохранить то, что есть
Таким образом, задачу сохранения языка можно понимать двояко. С одной стороны — это попытка создания условий для существования языка в неизменном виде, чтобы он продолжал использоваться для коммуникации: пусть ограничено, пусть немногими. Как рулить этой ситуацией — я не знаю, я не эксперт и испытываю некоторый скепсис. А с другой — это сохранение языка как научного, а не социального объекта. Сбор словарных данных, по возможности более подробное описание грамматики, качественная техническая фиксация фонетики. Над этим работает отдельная отрасль лингвистики, language documentation — языковое документирование. Я очень симпатизирую людям, которые занимаются первой, социальной программой, я понимаю их мотивацию, но сам я скорее занимаюсь второй, академической программой.
О языковом разнообразии Дагестана
До середины XX века языки в сельских районах Дагестана сохранялись, ситуация была не только стабильной, но даже в некотором смысле улучшалась. С улучшением медицины в горах сокращается детская смертность, и мы видим, что в первой половине века число сельских жителей растёт. При этом до самых последних лет мы могли считать так: сколько жителей в селе — столько как минимум носителей языка. По крайней мере в тех горных сёлах, в которые мы ездили, было монолингвальное сообщество, внутри которого происходило общение только на родном языке. Другие языки использовались только с соседями. Можно сделать вывод, что между концом XIX века и серединой XX века число носителей дагестанских языков выросло.
Дальше, начиная с сороковых-пятидесятых годов, в горах начинает появляться русский язык. Это ключевой момент. Через некоторое время жители сёл очень хорошо (правда, с некоторыми особенностями: фонетическими, грамматическими и так далее), так же свободно, как мы с вами, могут изъясняться на русском. При этом в двадцатом веке русский язык ещё не начал вытеснять этнические языки. Этнический язык — язык села — существовал сам по себе, а русский язык был ограничен школой, администрацией и внешними отношениями. Но вот что важно: со временем русский язык полностью заместил традиционное многоязычие.
Надо пояснить, что я имею в виду под традиционным многоязычием. Есть недавно введённый специальный термин, целое новое направление исследований — small-scale multilingualism, многоязычие малых сообществ. В Дагестане языки можно считать по-разному — их гораздо больше четырнадцати письменных, явно больше сорока (ср. 36 в этом достаточно авторитетном источнике — прим. М. А.), возможно, около шестидесяти, всё зависит от того, что считать разными языками, а что — диалектами одного языка. Среди них есть совсем маленькие языки, на которых говорят в одном селе, есть языки покрупнее, на котором говорят в четырёх-шести сёлах, а есть несколько крупных языков, с числом носителей от ста до семисот тысяч говорящих. Но Дагестан был многоязычным регионом не только в том смысле, что в Дагестане много разных языков. Важно, что кроме родного языка каждый или почти каждый сельский житель знал крупный язык той территории, к которой относилось его село: скажем, на севере Дагестана это был аварский — и иногда знал более мелкие языки своих непосредственных соседей. Иногда случалось, что люди знали дальние языки, скажем, грузинский или азербайджанский, потому что ходили туда на отхожий промысел.
Вот это мы и называем многоязычием малых сообществ, которое было традиционно характерно для горного Дагестана. И все эти сложные и очень интересные для исследования модели многоязычия стали уходить в прошлое с середины XX века, когда в качестве лингва франка (лингвистический термин, обозначающий язык, не являющийся родным ни для одной из коммуницирующих сторон — прим. ред.) стал выступать русский язык.
Задолго до того, как русский язык поставил под угрозу существования местные языки, он заместил в Дагестане традиционное для горских сообществ многоязычие
В этом смысле важно сформулировать следующее: бывают не только угрожаемые языки как таковые (например, мой ребёнок больше не говорит на том языке, с которым родился я, с которым я вырос, а говорит по-русски). Это одна ситуация. Но есть и другие процессы, на первый взгляд менее пугающие: мой ребёнок больше не говорит на тех других неродных языках, на которых говорил я. Я говорю по-мегебски и ещё говорю по-лакски и по-аварски, на языках моих соседей, а мой ребёнок уже только по-мегебски и ещё по-русски, по-аварски уже кое-как (в очень многих сёлах в качестве «родного» языка преподают не язык села, а другой крупный язык Дагестана; в Мегебе — это аварский — прим. М. А.), а по-лакски вообще не знает ни слова. С точки зрения носителей, это всё-таки менее сильный удар. А вот для учёных это серьёзная потеря, потому что ситуация многоязычия — это объект изучения, из которого мы можем очень много узнать об эволюции человеческого языка.
Есть основания полагать, что в истории человечества до начала экспансии крупных языков многоязычие малых сообществ было очень характерно для многих регионов. То есть ситуация, которую мы пытаемся реконструировать для Дагестана по состоянию до 40-х годов, — это языковая история человечества в живом виде.
То, что мы сейчас пытаемся реконструировать для традиционного Дагестана по состоянию до 40-х годов, — это языковая история человечества в живом виде
Исследования многоязычия и социально-исторические реконструкции лежат в основе проекта Multidagestan, атласа многоязычия в Дагестане, который был задуман Ниной Добрушиной. Я думаю, что в нулевые годы у нас начал происходить сдвиг интересов от описания собственно и только самого языка села к социальному контексту, в котором он существует. Квинтэссенцию этой новой программы дагестановедения можно сформулировать так: угрожаемыми являются не только родные языки горцев, но и характерные для них модели многоязычия. А для лингвистов не только первое, но и второе — очень важные источники научной информации.
Наше европейское представление о многоязычии довольно ограниченное: многоязычными считаются высокообразованные люди, интеллектуалы с особыми способностями. В Дагестане, конечно, есть и люди с высшим образованием, и интеллектуалы — но при этом двумя-тремя местными языками традиционно могли владеть все, вне зависимости от образования и способностей. И это впечатляет.
Я бы так объяснил важность проекта Multidagestan. Во-первых, это очень важный источник информации про традиционные способы существования языка, не только в Дагестане, но и во всём мире. Во-вторых — это репозиторий информации о том, что стремительно уходит в прошлое и в самом Дагестане.
Надо ещё сказать, что для меня с проектом Multidagestan связаны и какие-то вненаучные, личные сюжеты. Этот проект сделал возможными и даже необходимыми путешествия по республике. Мы столкнулись с задачей, для которой нужно было как можно шире покрыть социальное разнообразие Дагестана. В результате мы стали такими лягушками-путешественницами, которые объездили весь Дагестан и побывали уже чуть ли не в большем, страшно сказать, количестве сёл, чем Александр Евгеньевич Кибрик, наш учитель, который всю свою жизнь посвятил Дагестану, но никогда не занимался социолингвистикой. Такие экспедиции — очень привлекательная форма научной деятельности.
О социолингвистических экспедициях
Организационно социолингвистическая экспедиция отличается от просто лингвистических экспедиций тем, что она может быть очень короткой, но требует широкого охвата. У нас это студенческая команда: человек 5–6 студентов и руководитель. Мы расходимся по всему селу, заходим во все дома и расспрашиваем людей, какие языки они знают, какие языки знали их родители и дедушки с бабушками. Как я уже говорил, модели традиционного многоязычия стали рассыпаться примерно с 40-х годов, и люди, родившиеся после этого времени, могут сами не владеть языками, но зато неплохо помнят, на каких языках говорили старшие родственники. Поэтому мы спрашиваем у наших респондентов не только про них самих, но и про их уже умерших родственников. Это всегда эмоционально значимо, люди с охотой про это говорят.
Итак, в социолингвистической экспедиции нужен большой охват членов языкового сообщества. Это важное отличие от обычной лингвистической экспедиции, в которой мы занимаемся исследованием и документированием сельского языка или диалекта. Есть довольно много лингвистов, которые работают всего с одним носителем. На самом деле, это не очень хорошая практика — всегда лучше работать с несколькими, с двумя-четырьмя носителями — но для социолингвиста такой подход уже совершенно неприемлем. Социолингвист должен получить картину вариативности, разницы между людьми, определяемой социальными параметрами (например, возрастом или полом). Если лингвист делает описание грамматики языка, лексики, ему нужно уловить хотя бы основу — и это возможно с малым количеством носителей. А социолингвисту для того, чтобы получить репрезентативные данные, нужно охватить больше людей, и в этом смысле социолингвист больше похож на социолога.
Короткий визит, относительно короткое интервью, которое обычно заканчивается довольно длительным обедом, но за полчаса можно уложиться. Потом переходишь в следующий дом и задаёшь те же самые вопросы. Главное — не подать виду, что ты спрашиваешь то же самое, потому что носитель может обидеться и сказать: «Ты же все эти вопросы уже задавал моей сестре, она мне только что звонила, рассказывала, как ты к ней приходил». Респонденты — не автоматы, которые отвечают на вопросы, у них есть своё отношение к своему времени, к ходу интервью. Люди внимательно слушают, что вы у них спрашиваете, строят предположения о том, что вы от них хотите, и пытаются сами для себя понять, зачем это нужно, осмысленно ли это. Однажды наш с Ниной (Добрушиной — прим. ред.) маленький сын во время интервью зашёл в дом и говорит: «Слушай, мам, ты же все эти же вопросы только что задавала вот в том соседнем доме, откуда мы пришли». Мы страшно смутились, потому что наш метод оказался дезавуирован.
Об общении с респондентами
Нужно сказать, что Дагестан — удивительная страна. Мифы о дагестанском гостеприимстве — вовсе не мифы. Из тех многих десятков сёл, где мы побывали, у нас какие-то проблемы возникали всего в одном-двух. В остальных местах нас встречали с распростёртыми объятиями. Это гостеприимство интегрировано в социальную структуру горного Дагестана: если не помогать гостю, то в трудной ситуации, в дороге, в чужом селе и тебе никто не поможет, ты просто погибнешь — в Дагестане всегда были очень тяжёлые условия существования. Поэтому все двери открыты, люди очень рады, что к ним пришли гости, они этим гордятся.
Многие люди говорят об этом так: мой дедушка всегда выходил вечером на годекан (место в селе, где собираются для общения взрослые мужчины в нерабочее время — прим. ред.), и, если там был одинокий приезжий, он говорил: «Ты чей гость?» — если ничей, тогда вёл его к себе, и это было для него счастье. Сельчане рады, им любопытно, им интересно встретиться, интересно пообщаться с людьми, приехавшими издалека. Им интересно, когда люди приехали из Москвы или даже из Махачкалы: «Каким ветром вас сюда занесло, рассказывайте?»
Гостеприимство интегрировано в социальную структуру горного Дагестана: если ты не поможешь другому, тогда и тебе никто не поможет
Проблемы иногда возникают с записью на диктофон: иногда носители не очень хорошо относятся к этой идее — побаиваются. Я их не буду упрекать, потому что чёрт знает, что мы потом с этими записями будем делать, кто их будет слушать и зачем. Откуда им знать? Когда тексты появляются в интернете, в открытом доступе, это вызывает в селе неоднозначную реакцию. Это вам не в Москве кого-то записать, это село: если вы слышите голос человека, который говорит на языке, на котором говорит тысяча человек, — огромные шансы, что этот голос будет узнан и будет обсуждаться: правильно ли, хорошо ли сказал, без ошибок ли сказал, не сказал ли то, чего не следовало говорить чужим людям.
Обычно в сёлах людей не очень впечатляет, что мы хотим что-то узнать про их язык. Есть, конечно, исключения, и в последнее время их больше: вот сообщество в WhatsApp, про которое я упоминал, прямо горит тем, чтобы задокументировать язык. Но чаще всего в Дагестане люди думают так: «Ну, каждый чудачествует по-своему. Вот приехали, значит, записать язык. Зачем вам это нужно?» «Ну вот такой интересный язык, мы сейчас будем заниматься его грамматикой». «Ну ладно, занимайтесь, давай чай выпьем и заодно можете поспрашивать». А потом человек устаёт, ему надоедает, и он говорит: «Всё, я пошел косить, мне пора». Кролик неожиданно вспомнил, что у него совершенно неотложное дело.
К диктофону относятся с опаской, и я могу это понять
Дагестанцы — это люди, к которым очень привязываешься. Если ты с ними общаешься, даже час, то уходить не хочется хотя бы потому, что они просто очень приветливые, эмоциональные и открытые. А если уж много раз приезжаешь в одно место, возникают какие-то такие дружбы, которые могут быть крепче, чем со школьных лет.
О специфике Восточноармянского национального корпуса
Вы попросили меня рассказать о создании Восточноармянского национального корпуса — ВАНК. Этот рассказ, конечно, никак не связан с предыдущими сюжетами, но зато замечательно вписывается в цифровую тематику «Системного Блока». Тем более про Национальный корпус русского языка все знают, а про наш корпус даже среди DH знает мало народу, хотя он во многом не хуже, а в некоторых аспектах даже лучше, чем НКРЯ.
Всё началось с того, что мы встретились с удивительным человеком, который стал спонсором этого проекта, и не только давал на него деньги, но и буквально за месяц или за два вошёл в нашу тему, участвовал во всех технических и лингвистических обсуждениях. Он был, с одной стороны, спонсором, с другой стороны, топ-менеджером этого проекта, а с третьей — участником и научным руководителем, соруководителем вместе с Владимиром Александровичем Плунгяном. Раскрывать имя я не считаю возможным, потому что он сам явно этого избегает. Так что первое отличие ВАНК от НКРЯ в том, что этот проект был сделан на частные деньги.
Если сравнивать с НКРЯ, у ВАНК похожая структура и похожие поисковые возможности. Но наличие гибкого финансирования и умного менеджмента позволяли делать разные интересные подпроекты. В какой-то момент мы взяли и оцифровали довольно много газетных текстов, получилось хорошее, равномерное покрытие языка армянской публицистики с самого её начала, со второй половины, с конца XIX века и нулевыми годами через весь советский период. Этим далеко не каждый корпус может похвастаться. Получилось сделать хороший Устный корпус устного языка Еревана, в основном образца начала 2010-х. То есть, с одной стороны, всё похоже: устный корпус, публицистический корпус, литературный корпус, поэтический корпус. С другой стороны — в некотором смысле даже более мощное и более сбалансированное представление, чем в НКРЯ, где всё-таки литературных текстов гораздо больше, а устного корпуса гораздо меньше. Хорошо получилось!
Функционал наш программист делал с нуля и в некоторый момент он был даже лучше, чем у НКРЯ. Сейчас у НКРЯ новая жизнь, новый функционал, там всё-всё очень живо и бурлит уже несопоставимо. Национальный корпус армянского языка был заморожен в начале десятых годов и не развивался с тех пор, а НКРЯ развивается. Единственное существенное отличие сейчас в том, что Национальный корпус русского языка, насколько я знаю, доступен только для знающих русский: ты смотришь на предложение и не можешь без словаря понять, что оно значит. А в ВАНК мы сразу ввели такой функционал, что у нас не только грамматическая информация про словоформы давалась, но и английский перевод лексемы. И я, не зная армянского языка, могу со словарём сесть и медленно прочитать какой-то текст. Конечно, это не такой посещаемый ресурс, как НКРЯ, но он имеет свою устойчивую аудиторию. Мне кажется, что Восточноармянским национальным корпусом больше пользуются исследователи, чем простые носители языка. К сожалению, он недостаточно хорошо известен публике. Впрочем, статистики по типам пользователей у нас нет.
Что нужно для создания корпуса, кроме денег? Нужна корпусная идеология и понимание структуры языка. Даже не обязательно знание языка как такового, но кто-то, знающий язык, конечно, должен быть в команде. И как раз наш спонсор, коллега и друг — он армянин, он понимал, что происходит. Если мы не понимали, не могли интерпретировать ошибку, то он мог это сделать. Ещё у нас была одна наша коллега младшая, тоже армянка, которая была одним из лингвистических менеджеров проекта. Вообще нас было довольно мало, шесть человек. При эффективном менеджменте даже команда из шести человек может сделать довольно большой корпус.
О цифровых методах при документировании языков
Нужно различать результаты документирования языков в цифровом пространстве, цифровые ресурсы, с одной стороны, и, с другой стороны, инструменты, которые это документирование могут облегчить. Теоретически можно ещё поставить вопрос, какие цифровые инструменты могут быть полезны именно для сохранения языка как такового, то есть для описанной выше «социальной» программы. Очень простые на самом деле вещи дают радость носителям малых языков, хотя я не знаю, насколько это помогает их сохранению: онлайн-словари, приложения для мобильных телефонов, куда человек заглядывает и видит слова своего языка. Я понимаю, что это может порадовать, но не знаю, насколько это поможет сохранить язык детям. Очень хочется надеяться, что я пессимист.
Что может сделать лингвист в цифровом пространстве? Первое — записать тексты на языке, обязательно со звуком. Неправильно думать, что если мы даже очень точно запишем язык в текстовом виде, то мы сохраним полностью всю информацию про этот язык. Очень много информации содержится в звуковой форме. Сейчас считается, что и в видеоформате нужно тоже записывать для фиксирования таких уже метаязыковых, паралингвистических вещей — жестикуляции, например, которую сегодня тоже активно изучают как часть коммуникативного поведения.
Второе — это корпус языка. Это возможно делать и для крупных, и для малых языков, потому что корпуса позволяют исследовать язык в условиях, приближенных к реальности. Когда я был студентом, мы все были приучены исследовать язык методом анкетирования: даёшь предложение, получаешь перевод и дальше пытаешься выяснять какие-то грамматические закономерности. Но есть настолько редкие вещи, что они только в большом корпусе могут встретиться и про которые даже не подумаешь спросить. Чем глубже исследования языка, тем важнее становится корпус.
Что могут цифровые методы предлагать полевому лингвисту, который занимается языковой документацией? Самому лингвисту для такой работы необходимо огромное упорство, но уж если оно есть, тогда дайте нам хотя бы методы, которые позволят упростить процесс и сэкономить время. Основной упор сейчас делается на автоматизацию обработки устных текстов. Про распознавание такого качества, как есть для крупных языков, мне кажется, речь пока особо не идёт (возможно, это не совсем так — прим. М. А.). Но есть проект DoReCo, недавно запущенный, который позволяет проводить фонетические исследования на большом языковом материале.
Ещё один инструмент, который полезен для языкового документирования, — это разные корпус-менеджеры для малых языков, которые позволяют представить эти тексты в формате, удобном для грамматических исследований. Такой формат называется «морфологическим глоссированием», или interlinear morphological glossing, где каждое слово не просто переведено, но ещё и разбито на морфологические сегменты, и каждому морфологическому сегменту приписана его функция. Одно из самых распространённых приложений этого рода называется FieldWorks: оно помогает частично автоматизировать морфологический анализ текста на языке, которым вы занимаетесь. Но это приложение довольно громоздкое, часто сбоит и не сделано для MacOS. Сделали бы вы нам, ребята, «упрощённый FieldWorks» — давно ждём!
Дальше уже идут вопросы скорее чисто академические. Это тоже довольно интересно: например, как можно применять статистику к анализу языковых данных — но это уже не про документирование, сохранение, малые языки, а просто про анализ языковых данных. Можно сказать, что такого рода модели можно применять как к малым языкам, так и к русскому языку. Малые языки особенны лишь тем, что по ним мало данных, и это накладывает некоторые ограничения на то, какие инструменты можно применять и какие выводы удаётся сделать.
О лингвистах и войне
Вы спрашиваете, что изменилось в науке с началом войны в Украине. Мне сложно говорить на эту тему от лица российских лингвистов, потому что мы довольно быстро уехали — в первые дни после начала войны. И я чувствую себя очень свободным в высказываниях, потому что мне ничего не угрожает. Могу ли я сейчас говорить от лица тех, кто остался в России? Очевидно, нет.
Мне кажется, что возможности участия в глобальной науке заметно сократились: стало труднее получить визу, чтобы поехать на конференцию. Появились ограничения на взаимодействие западных университетов с российскими, разные в разных странах: в Германии самые сильные, во Франции послабее, в Италии совсем слабые. Прекратилась подписка на международные библиотечные ресурсы. Со временем могут вообще появиться опасения относительно контактов с западными учёными: посмотрите на то, что происходит в hard sciences в связи со шпионскими процессами. Но мне кажется, что проблема моих коллег в России находится не в сфере их академических перспектив. Советская лингвистика была герметичной, но при этом важной наукой.
Я не в том положении, чтобы позволить себе морализаторствовать. Ограничусь поэтому следующим. С моей точки зрения, проблема российской науки лежит не в академической, а в этической плоскости. Для тех, кто относится к этой войне так, как я (а таких среди моих коллег, по ощущениям, большинство), трудно со всем этим сосуществовать. Трудно и выступать против войны, трудно и не делать этого. Первое — поведение самоубийственное, второе — саморазрушающее. Поэтому я считаю, что уехав, мы сделали самый простой, самый лёгкий выбор (конечно, важно ещё, что у нас была такая возможность, она есть не у всех). Я понимаю, что у российской науки есть чисто академические трудности, которые не нужно недооценивать. Но мне кажется, что если бы я остался в России, то мне было бы гораздо труднее в морально-этическом плане, чем в академическом. В академическом я бы как-нибудь просуществовал.
Расшифровка: Ксения Жакова, Елизавета Коноплева