Игорь Мельчук — лингвист, создатель лингвистической модели «Смысл ↔ Текст», разработчик первой в СССР системы французско-русского машинного перевода, появившейся в середине 1950-х гг. «Системный Блокъ» поговорил с Игорем Мельчуком о том, что сегодня происходит в лингвистике, почему появление машинного перевода в СССР можно считать чудом и как создание универсального научного языка стало для учёного главной задачей жизни.
О машинном переводе в 1954 году
В создание первых алгоритмов машинного перевода я был вовлечён совершенно случайным образом. Я совершенно традиционно учился на испанском отделении филологического факультета МГУ: изучал испанский язык, испанскую литературу и культуру. И в какой-то момент, в январе или феврале 1954 года, я встретил своего приятеля Дмитрия Урнова, который потом стал известным литературоведом и шекспироведом. Он был из богатой семьи и мог себе позволить в Москве в 1954 году заниматься конным спортом, который очень любил. И вот Манеж, 5–6 часов вечера, темно, мокрый снег. Я бегу к метро и налетаю на Диму Урнова в шикарной кожаной куртке, пахнущей приятным конским навозом и конским теплом. Он говорит: «Игорь, а ты-то мне как раз и нужен». Я очень удивился, я ему никогда особенно не бывал нужен.
Игорь Мельчук, около 1956 г. (Фото из архива А. Зализняка)
Оказывается, у него была подружка, красивая такая полуитальянка по имени Наташа Рикко, аспирантка-математичка. И какой-то её странный профессор захотел сделать машинный перевод с французского языка. А они, эти математички, знали французский язык, но плоховато. Они попросили Диму найти какого-нибудь бойкого студента, который хорошо говорит по-французски. Я знал французский, поэтому согласился. Первый раз в жизни слышал такое сочетание слов: «машинный перевод». Меня это просто проняло до кишков. Машинный перевод? Какая машина? Машина — это грузовик, а тут вдруг перевод.
Машинный перевод? Какая машина? Машина — это грузовик
Через пару дней Дима действительно отвёл меня на квартиру к Наташе Рикко. Я там встретил трёх погодок-аспиранток. От них я услышал, что примерно месяц назад американцы с помощью электронно-вычислительной машины, называемой ЭВМ (по-английски computer, а по-русски ещё и слова такого не было), перевели 300 русских фраз на английский. У меня вообще глаза полезли на лоб. Представляете? Это как если бы вам сегодня рассказывали, что два человека слетали на Марс, купили там арбуз, перелетели на Юпитер и вернулись на Землю. Это выглядело так же абсурдно.
Я похлопал ушами, сказал, что безумно интересно, но я ничего не понимаю. Они говорят, хорошо, пойдём к профессору Ляпунову (Алексей Ляпунов, советский математик, один из основоположников кибернетики — прим. ред.), он объяснит лучше. И мы пошли к нему, я влюбился, окосел и на всю жизнь превратился в поклонника этой новой религии, которая в изложении Ляпунова была очень простой. Надо всё, что ты знаешь, говорить так, чтобы было понятно машине. Машина ведь тупая, догадываться ни о чём не может. Она понимает только логические выкладки, примитивное логическое исчисление.
Машина ведь тупая, догадываться ни о чём не может
Одна из основных проблем машинного перевода заключается в том, что некоторые слова английского языка имеют дикое количество русских переводов. К примеру у глагола get чуть ли не 400 возможных переводов в русском языке. Если ты get по морде, то это одно. А если ты get повышение зарплаты, то это другое. Тогдашние машинные программы были очень примитивны, и чтобы найти нужный перевод этого get, надо было перебрать около 400 контекстов.
Передо мной и моим близким другом и выдающимся коллегой Александром Жолковским (сейчас он профессор в Университете Южной Калифорнии) стояла лингвистическая задача: как это дело упростить. И вскоре мне пришла в голову гениальная идея: если взять какое-нибудь английское слово, допустим, прилагательное heavy, то его перевод будет полностью зависеть от того, какое рядом с ним английское слово. Если heavy weight (а weight перевести легко — это «вес»), то достаточно к слову «вес» добавить, что по-русски он называется большим или чрезмерным. То есть не надо заниматься переводами отдельных слов. Достаточно в русском словаре написать всё, что надо, потом в английском словаре написать всё, что надо, а переводить только те слова, которые переводить легко. Weight переводится легко.
Сегодня машина переводит блестяще, но ничего нового о лингвистике мы от неё не узнаем
Сейчас, спустя 60 лет, эту проблему решили совершенно другим путём. Не научным, но совершенно блестяще. Сегодняшний машинный перевод с помощью искусственного интеллекта вызывает восхищение, но к науке о языке это никакого отношения не имеет. Машина переводит блестяще, но ничего нового о лингвистике мы от неё не узнаем.
Алексей Ляпунов, около 1965 г. (Фото из архива Института прикладной математики имени М. В. Келдыша РАН)
О модели «Смысл ↔ Текст» и нетрадиционной лингвистике
Я нахально скажу, что модель «Смысл ↔ Текст» дала лингвистике всё. Ведь что такое язык? Грубо говоря, это что-то, что позволяет нам выражать свои мысли. Кто-то может сказать, что язык — это средство коммуникации. Конечно, но коммуникация требует как минимум двух человек. Один человек выражает свою мысль, а другой её воспринимает. Вот любовь в одиночку невозможна, а язык в одиночку очень даже возможен. Я вот всё время сижу и один сам с собой прекрасно разговариваю.
Значит, язык — это способ выражения мысли. С этим все согласны и всегда были, начиная с товарища Аристотеля в четвёртом веке до нашей эры. А может, и ещё раньше: какой-нибудь шумерский товарищ, который переводил с шумерского на ассирийский за две тысячи лет до нашей эры, наверное, тоже так думал. «Я перевожу, чтобы мои шумерские мысли выразить на этом ассирийском языке». Следовательно, никакой другой лингвистики, кроме лингвистики «Смысл ↔ Текст», нет и быть не может.
Никакой другой лингвистики, кроме лингвистики «Смысл ↔ Текст», нет и быть не может
То, чем я занимаюсь, ни в коей мере не является традиционной лингвистикой. Это совершенно нетрадиционное нечто, которое как бы вытекает из традиционного. Является ли современная физика традиционной? И да, и нет. Это что-то совершенно другое. Но если присмотреться, то это обобщение того, что было раньше, с новыми механизмами, применимыми и к тому, что было раньше, и к тому, чего раньше не было.
Я продолжаю развивать то, что было раньше. На том пути, который был раньше. Не думаю, что я занимаюсь чем-то особенным. Это просто лингвистика. Есть, конечно, и прикладная лингвистика, и полевая лингвистика, и психолингвистика, но это всё другое. А я занимаюсь просто лингвистикой. То есть как описать язык. Один, или группу, или все сразу.
Например, последняя моя статья, вышедшая в России, была про слово «возьми». В контексте «А он возьми и брось в меня ночной горшок». Что это за «возьми»? В лучшем словаре русского языка, который мне известен (это активный словарь Апресяна и его компании), этого «возьми» нет. Оно считается формой глагола «взять». И считается, что эта форма не от «взять» в смысле «я взял футляр от очков», а от «я взял и заявил». Но это неправильно, потому что «я взял и заявил» или «а я возьму и скажу» не значит то же самое, что «а он возьми и упади». Это совершенно разное и употребляется совершенно по-разному.
Юрий Апресян и Игорь Мельчук, около 1973 г. (Фото из архива Л. Касаткина)
Вообще я типичный кабинетный учёный. Меня интересует знать, а не уметь сделать что-то практическое. Я практически абсолютно меньше нуля. Люблю читать результаты, но не люблю сам делать. Очень люблю бифштекс, но абсолютно не люблю готовить.
Я типичный кабинетный учёный. Меня интересует знать, а не просто уметь сделать что-то практическое
О нейропсихологии и перспективах нейролингвистики
Когда я ещё жил в России, я довольно долго общался с замечательным нейропсихологом Лурией (Александр Лурия, советский психолог и врач-невролог, один из основателей нейропсихологии — прим. ред.). Он пригласил меня с ним работать и вскоре свёл со своей ученицей Рябовой (Татьяна Ахутина, урождённая Рябова, российский психолог, специалист в области нейропсихологии и психолингвистики — прим. ред.). Очень умная женщина. Она меня водила в больницы, где можно было общаться с разными случаями афазии, разрушений и так далее.
И я понял две вещи. Первое: я слишком чувствительный. Когда меня привели к умирающей от опухоли мозга женщине, я ни о чём думать не мог. Я хлопал глазами, ушами, я видел её перекошенное болью лицо, и выяснять у неё, как она склоняет существительные, не мог абсолютно. И понял, что работать с афатиками не смогу. Это требует особого склада психики.
Когда меня привели к умирающей от опухоли мозга женщине, выяснять у неё, как она склоняет существительные, я не мог
Второе: мне в это время было уже сильно за 40. И я понял, что это такое сложное дело, что для того, чтобы ему научиться, надо потратить лет пятнадцать. А их у меня уже нет. И я отошёл в сторону, понимая, что овладеть этим никак не смогу. Если бы я не уехал из России, я, может быть, продолжал бы сотрудничать с Рябовой и, возможно, это дало бы хорошие результаты. Да, я верю, что такие нейронаучные проникновения в реальный мозг помогут создать настоящую модель языка. Это меня интересует необычайно.
Я верю, что нейронаучные проникновения в реальный мозг помогут создать настоящую модель языка
О главной научной задаче жизни
В языке нет никаких реальных вещей, которые можно схватить. Когда вы говорите, допустим, «именительный падеж», надо очень чётко понимать, что это значит. Потому что именительный падеж в грузинском — совершенно не то же самое, что именительный падеж в русском. Именительный падеж в грузинском — это падеж прямого дополнения.
Меня интересует создание такой понятийной системы, которая была бы близка к понятийной системе математики. Если математик с острова Фиджи говорит «прерывная функция», то математик из Норвегии понимает его тютелька в тютельку. А когда умный лингвист вроде Хаспельмата (Мартин Хаспельмат, немецкий лингвист, один из ведущих европейских специалистов по лингвистической типологии — прим. ред.) говорит «именительный падеж», то даже я уже не понимаю, что он имеет в виду. Он может иметь в виду 25 совершенно разных вещей.
Игорь Мельчук на лекции в Коллеж де Франс (Париж, Франция), начало 2000-х гг. (Фото из архива И. Мельчука)
Поэтому я примерно 60 лет назад поставил себе задачу: создать такую терминологию и такую систему понятий, которая позволяла бы говорить о языках нормально. То есть если я говорю «именительный падеж» — это всегда означает одно и то же. Та форма, в которой существительное записано в словаре. И ничто другое. Вопрос построения научного языка, который был бы универсальным, — главная задача моей жизни. Я всю жизнь этим занимаюсь и буду заниматься, пока живу.
Вопрос построения научного языка, который был бы универсальным, — главная задача моей жизни
Об эмиграции из СССР и особенностях жизни в Канаде
Это было даже не решение. Я просто начал чувствовать, что сойду с ума. Что не могу в этой стране больше жить. А быть диссидентом, как большинство моих коллег, я не хотел. Я не люблю диссидентство, не люблю политической деятельности, не умею публично выступать и ненавижу это. Поэтому я твёрдо решил, что должен уехать. Не уехать я не мог, иначе бы я был в тюрьме. Эмиграция стала для меня просто спасением жизни.
Не уехать я не мог, иначе бы я был в тюрьме
Эмиграция продлила мою жизнь, бесспорно. Мне 92 года, и я жив. Там я давно был бы мёртв, совершенно гарантированно. Здесь я расцвёл, и всё слава богу. Хотя, конечно, второй родины я не обрёл. И московские переулки, где я провёл детство и юность, я до сих пор помню. Здесь очень удобно, здесь замечательно. Я этой стране благодарен. Она мне дала всё. Если надо, я бы за неё пошёл воевать и умер бы охотно. Но это не родина.
Но что делать? Не я выбирал. Я родился в России случайно. Мог бы родиться где-нибудь ещё. Россия стала такой чудовищной страной, что я с ней оказался несовместим. Поэтому и уехал в Канаду. И мне здесь очень хорошо. Мне тут же дали полное место, полное профессорство. Все условия, какие можно было человеку создать, создали.
Если надо, за Канаду я бы пошёл воевать и умер бы охотно. Но это не родина
Единственное, что здесь (не только в Канаде, но и в Северной Америке) не бывает того, что называется школой. Здесь невозможно создать коллектив людей, где по традиции передаются какие-то идеи. По крайней мере, в университетской среде. И в принципе люди здесь живут очень разобщённо. То, что мы называли в России дружбой, здесь вещь очень редкая. В лучшем случае это дружба на расстоянии. Вот если ты будешь умирать, человек действительно ляжет костьми, чтобы тебя спасти. Но для этого надо начать умирать. А иначе ты в его жизни не присутствуешь.
Каждый сам за себя. Не только в отношениях между друзьями, но и в отношениях между родителями и детьми. Тут всё гораздо суше, жёстче и компьютерней. Может, это правильно, я это не осуждаю. Может, это будущее человечества. Но мне это трудно. Я бы хотел по-другому.
То, что мы называли в России дружбой, здесь вещь очень редкая
В Канаде у меня близких друзей не завелось. Те, кого я считаю друзьями, это либо русские, либо французы, либо испанцы, либо немцы. А в Америке завести друзей у меня не получилось. При том, что я человек очень дружелюбный и активный. У меня полно друзей, с которыми я переписываюсь. Мы встречались, пока я мог, но это совсем не то. А вот так, чтобы сесть, глядя друг на друга, поднять по рюмочке и помолчать пятнадцать минут вместе, — нет, здесь такого не бывает.
О влиянии репрессий на советскую лингвистику
Сталинские репрессии коснулись лингвистики совершенно чудовищным образом. Я, не напрягая память, вспоминаю Поливанова (Евгений Поливанов, советский лингвист, востоковед, автор первого в мировой науке описания фонологии японского языка — прим. ред.) и Дурново (Николай Дурново, советский лингвист, диалектолог, член-корреспондент Академии наук СССР — прим. ред.). Два гиганта, которые были расстреляны в возрасте 50 лет.
И дальше просто можно перечислять большое количество замечательнейших лингвистов, физически убитых просто. А сколько людей было отправлено в лагеря? Как, например, Крейнович (Ерухим Крейнович, советский лингвист, этнограф — прим. ред.), специалист по юкагирскому языку. Он отсидел пятнадцать лет. И так далее, и так далее.
Сталинские репрессии коснулись лингвистики чудовищным образом
Был, например, такой лингвист Сандро Кодзасов. В 1938 году, за пару месяцев до его рождения, его отца Василия Кодзасова (осетина, видного инженера и коммунистического энтузиаста) арестовали и повезли на Колыму. Он сумел выбросить из окна эшелона спичечную коробку с коротенькой записочкой, адресованную его жене. В которой написал: «Меня мучили, заставили подписать какие-то лживые протоколы. Сделай всё возможное, иди в ЦК партии, меня там знают».
Жена, которая его безумно любила, схватила эту записку, пробилась в ЦК партии и кому-то её вручила. Мол, как это может быть, разберитесь. Ей пообещали, что разберутся. Ну и, конечно, ничем это дело не кончилось. Уже в 50-е годы, после смерти Сталина, Сандро получил сведения, что отец умер в лагере на Колыме такого-то числа.
Вот такой милой страной был Советский Союз. В 35-м году Сталин, укокошив примерно 2,5 миллиона человек, произнёс своё знаменитое «Жить стало лучше, жить стало веселее». Он был очень остроумным человеком, надо сказать. Правда, остро́ты его были жуткими. Это же он сказал: «Есть человек, есть проблема. Нет человека, нет проблемы». Так поступили и с Навальным.
И, наконец, марризм (псевдонаучная концепция происхождения, развития и «классовой сущности» языка; с конца 1920-х до 1950 года поддерживалась в СССР на государственном уровне — прим. ред.). Это был первый кошмарный удар по советской науке. Совершенно бредовый сифилитик (здесь имеется в виду Николай Марр, филолог, востоковед, вице-президент Академии наук СССР — прим. ред.) наплодил свою науку. Пятнадцать лет ничего другого не было. Затем появился товарищ Сталин, который создал орловско-курские диалекты в своём безумном мозгу. И следующие пятнадцать лет тоже ничего не было. Но потом вдруг произошёл действительно невероятный всплеск. Мне кажется, это получилось отчасти благодаря машинному переводу.
Почему? Потому что машинный перевод поддерживали военные. Ляпунов, который начал это движение, работал на армию. Его вычислительный комплекс занимался расчётом траекторий советских баллистических ракет «Москва-Монреаль», «Москва-Вашингтон», «Москва-Бостон» и так далее. Благодаря этому люди получили возможность преподавать то, что называлось структурной лингвистикой, аж в университете.
Благодаря расчётам траекторий баллистических ракет люди получили возможность преподавать то, что называлось структурной лингвистикой
Ведь в Советском Союзе генетиков всех постреляли и посадили, как и космологов (космология — раздел астрономии, изучающий свойства и эволюцию Вселенной, — прим. ред.). Даже физику хотели закрыть, объявив её идеалистической. А Берия не дал, сказал: «Нам это нужно». Так и с лингвистами получилось. Ведь если бы не это, я бы никогда в жизни не стал лингвистом и был бы преподавателем французского языка, и всё. Потому что то, что мне нравилось, противоречило тому, что было вокруг меня.
Расшифровка: Анна Баранова