Юрий Дереникович Апресян — основатель Московской семантической школы, соавтор высокоформализованного «Толково-комбинаторного словаря», один из первых исследователей машинного перевода в отечественной лингвистике. Начав заниматься машинным переводом еще в 1950-е вместе с И. А. Мельчуком в рамках теории «Смысл ↔ Текст», Апресян вернулся к этой задаче в 1972 году, когда ему пришлось заняться разработкой советского автоматического переводчика в институте «Информэлектро». В 1985 году он перешёл в ИППИ РАН, где создал лабораторию компьютерной лингвистики, в которой разрабатывался лингвистический процессор ЭТАП. Эта разработка была использована для разметки Синтаксического подкорпуса НКРЯ.
В память о Ю. Д. Апресяне мы публикуем подборку наших статей, посвящённых прошлому и настоящему машинного перевода и точных методов в лингвистике.
Машинный перевод: как он появился и как работает
Впервые идея использовать компьютер для перевода текстов с одного естественного языка на другой была предложена ещё в 1949 году. От короткого набора правил до продвинутых нейросетей: 70 лет истории развития машинного перевода за 15 минут.
Что такое кросс-языковая морфология и зачем она нужна
Машинный перевод и другая компьютерно-лингвистическая магия работают тогда, когда есть много данных для обучения нейросетей. Но что делать, если язык редкий и данных почти нет? Тут может помочь перенос на малоресурсный язык лингвистических моделей, построенных на данных большого родственного языка. Рассказываем про построение кросс-языковых NLP-моделей.
Зачем нужен Национальный корпус русского языка
Зачем нужен НКРЯ? В статье рассказано о самых разных исследованиях на основе корпуса: от сложностей перевода на другой язык культурных реалий на примере книг Набокова до возникновения фразы «ибо нефиг» и особенностей применения частного и местного падежей в современном языке.
От древнерусского до корпуса блогов: как изменился Национальный корпус русского языка после редизайна
В этом году Национальному корпусу исполнилось 20 лет. Все эти годы НКРЯ менялся не только внешне, но и внутренне: добавлялись новые функции и новые подкорпусы. Сейчас с помощью НКРЯ можно изучать детскую литературу, блоги, берестяные грамоты и многое другое, анализировать статистику употребления слов и коллокаций, строить графики и искать похожие слова.
Как лингвистика стала близкой подругой математики и информатики?
Лингвистика привлекла внимание математиков и инженеров после Второй мировой войны. Этому способствовали достижения структурной лингвистики начала XX века (Фердинанд де Соссюр и его последователи), но ещё больше — появление первых компьютеров и холодная война. Заинтересованные идеей научить компьютер переводить текст и понимать его, кибернетики начали создавать формальные модели языка для компьютеров. В их работах заложена база для стохастических методов, которые играют ведущую роль в современной прикладной обработке языка. Рассказываем, как в середине XX века соединились лингвистика, математика и информатика.
Достигла ли своих целей разработка искусственного интеллекта?
В 1972 году (как раз когда Ю. Д. Апресян во второй раз вплотную занялся машинным переводом) учёные составили список из двенадцати задач, которые нужно решить для создания искусственного интеллекта в ближайшие десятилетия. В список входили автоматический перевод, самоуправляемые автомобили и даже автономные роботы-планетоходы. Мы попробовали оценить, что сделано, а что ещё нет.