Подборка статей о точных методах в лингвистике

Юрий Дереникович Апресян — основатель Московской семантической школы, соавтор высокоформализованного «Толково-комбинаторного словаря», один из первых исследователей машинного перевода в отечественной лингвистике. Начав заниматься машинным переводом еще в 1950-е вместе с И. А. Мельчуком в рамках теории «Смысл ↔ Текст», Апресян вернулся к этой задаче в 1972 году, когда ему пришлось заняться разработкой советского автоматического переводчика в институте «Информэлектро». В 1985 году он перешёл в ИППИ РАН, где создал лабораторию компьютерной лингвистики, в которой разрабатывался лингвистический процессор ЭТАП. Эта разработка была использована для разметки Синтаксического подкорпуса НКРЯ.

В память о Ю. Д. Апресяне мы публикуем подборку наших статей, посвящённых прошлому и настоящему машинного перевода и точных методов в лингвистике.

Машинный перевод: как он появился и как работает

Впервые идея использовать компьютер для перевода текстов с одного естественного языка на другой была предложена ещё в 1949 году. От короткого набора правил до продвинутых нейросетей: 70 лет истории развития машинного перевода за 15 минут.

Что такое кросс-языковая морфология и зачем она нужна

Машинный перевод и другая компьютерно-лингвистическая магия работают тогда, когда есть много данных для обучения нейросетей. Но что делать, если язык редкий и данных почти нет? Тут может помочь перенос на малоресурсный язык лингвистических моделей, построенных на данных большого родственного языка. Рассказываем про построение кросс-языковых NLP-моделей.

Зачем нужен Национальный корпус русского языка

Зачем нужен НКРЯ? В статье рассказано о самых разных исследованиях на основе корпуса: от сложностей перевода на другой язык культурных реалий на примере книг Набокова до возникновения фразы «ибо нефиг» и особенностей применения частного и местного падежей в современном языке.

От древнерусского до корпуса блогов: как изменился Национальный корпус русского языка после редизайна

В этом году Национальному корпусу исполнилось 20 лет. Все эти годы НКРЯ менялся не только внешне, но и внутренне: добавлялись новые функции и новые подкорпусы. Сейчас с помощью НКРЯ можно изучать детскую литературу, блоги, берестяные грамоты и многое другое, анализировать статистику употребления слов и коллокаций, строить графики и искать похожие слова.

Как лингвистика стала близкой подругой математики и информатики?

Лингвистика привлекла внимание математиков и инженеров после Второй мировой войны. Этому способствовали достижения структурной лингвистики начала XX века (Фердинанд де Соссюр и его последователи), но ещё больше — появление первых компьютеров и холодная война. Заинтересованные идеей научить компьютер переводить текст и понимать его, кибернетики начали создавать формальные модели языка для компьютеров. В их работах заложена база для стохастических методов, которые играют ведущую роль в современной прикладной обработке языка. Рассказываем, как в середине XX века соединились лингвистика, математика и информатика.

Достигла ли своих целей разработка искусственного интеллекта?

В 1972 году (как раз когда Ю. Д. Апресян во второй раз вплотную занялся машинным переводом) учёные составили список из двенадцати задач, которые нужно решить для создания искусственного интеллекта в ближайшие десятилетия. В список входили автоматический перевод, самоуправляемые автомобили и даже автономные роботы-планетоходы. Мы попробовали оценить, что сделано, а что ещё нет.

Автор: Системный Блокъ

Редактор: Системный Блокъ

Иллюстратор: Евгения Родикова

Теги:апресян, искусственный интеллект, кросс-языковая морфология, машинный перевод, национальный корпус русского языка

Подборка статей о точных методах в лингвистике

Машинный перевод: как он появился и как работает

Что такое кросс-языковая морфология и зачем она нужна

Зачем нужен Национальный корпус русского языка

От древнерусского до корпуса блогов: как изменился Национальный корпус русского языка после редизайна

Как лингвистика стала близкой подругой математики и информатики?

Достигла ли своих целей разработка искусственного интеллекта?

О проекте

Контакты

СОЦСЕТИ

Теги

Темы

Подборка статей о точных методах в лингвистике

Машинный перевод: как он появился и как работает

Что такое кросс-языковая морфология и зачем она нужна

Зачем нужен Национальный корпус русского языка

От древнерусского до корпуса блогов: как изменился Национальный корпус русского языка после редизайна

Как лингвистика стала близкой подругой математики и информатики?

Достигла ли своих целей разработка искусственного интеллекта?

Читать по теме:

Футурология, уныние и сексизм: цифровые исследования литературы XIX века

Искусство оцифровки: подборка интервью «Системного Блока»

О проекте

Контакты

СОЦСЕТИ

Теги

Темы