Читать нас в Telegram
Иллюстратор: Женя Родикова

Считается, что работа с переводами по большей части уже автоматизирована. Онлайн-переводчики помогают сделать черновую работу за тех, кто занимается этим профессионально. Обычным пользователям же предоставляется мгновенный доступ к тексту на другом языке, качество которого улучшается с каждым годом. Но существует еще один инструмент, который облегчает работу с переводами. 

Краткая история Reverso 

История сервиса началась в 1998 году. Его целью было предоставление машинного перевода с французского на немецкий язык. Через год сервис стал поддерживать перевод на английский и обратно. Сервис популярен среди различных организаций, им пользуется французская армия и даже Департамент культуры Франции.

В 2013 году был запущен сайт Reverso Context, который функционирует и на русском языке. Через три года, уже в 2016 году, компания Reverso включила в себя сервис Fleex, использующийся для изучения английского языка через фильмы с субтитрами. 

Сегодня веб-сайт включает более ста языковых пар с миллиардами переводов. Общее количество пользователей составляет около 60 миллионов человек.

Как это может пригодиться?

В отличие от других онлайн-переводчиков, Reverso Context показывает примеры слов в предложении. Это помогает увидеть, как слово используется грамматически, какими членами предложения окружается и в каком контексте чаще всего употребляется. Например, если ввести в Reverso само слово «перевод», сервис выдаст множество результатов, в которых было бы легко запутаться без контекста.

Из примеров сервиса становится понятно, где речь идет о переводе текста, а где — о денежных переводах. Другие онлайн-переводчики не предоставляют контекста для понимания разницы между, например, «translation» (перевод на другой язык) и «transfer» (перевод средств), что значительно усложняет поиск по конкретным словам.

Какие тексты используются в качестве источников? 

Как следует из названия, особенность ресурса состоит в том, что он переводит слова, ссылаясь не на словарные статьи, а на примеры использования в разных предложениях. Следовательно, набор данных должен быть всеобъемлющим, чтобы охватывать все варианты использования слов или выражений. Разработчики заявляют, что все примеры собраны из реальных текстов, поэтому в них могут быть разговорные фразы и грубые термины. 

В основном используются тексты из фильмов и книг. Например, компания Fleex, которая входит в состав Reverso, использовала фильмы и сериалы Netflix, видео из YouTube, а также пользовательские файлы. Помимо этого существуют данные и из правительственных документов, чтобы дать пользователю возможность ознакомиться с более формализованной лексикой. 

Функционал сервиса

Помимо перевода с указанием на контекст (который возможно посмотреть и в более полном варианте) есть возможность автоматического озвучивания слов и предложений. Кроме того, пользователь может узнать синонимы и значения слов. В дополнение к этому система предоставляет функцию адаптации перевода для определенной области, например, для сферы бизнеса. 

Для десяти языков представлена функция спряжения глаголов, а также создания персонального словаря. Пользователь может участвовать в расширении уже действующих словарей. Некоторые функции доступны при регистрации, однако базовый функционал работает и без учетной записи.

Приложение дает дополнительную возможность обучения языкам: оно включает карточки для запоминания, которые сгенерированы на основании слов в предложениях-примерах. 

Какие технологии используются для перевода? 

По заявлению разработчиков, система работает на основе искусственного интеллекта. Нейронный машинный перевод может использоваться на основных серверах компании, так и других серверах по желанию пользователя, если его возможности позволяют это делать. 

Reverso Context оперирует двумя подходами к машинному переводу. Оба эти подхода формируют так называемый гибридный перевод, совмещающий как правила, так и статистику. Объединение правил и статистики возможно двумя способами: можно интегрировать правила в статистическую модель либо внедрить статистический модуль в перевод, основанный на правилах. Конкретный выбор объединения обычно зависит от разработчика, и предпочтительный вариант не раскрывается пользователям.

Первый подход перевода осуществляется при помощи правил. Для этой системы необходим как можно более подробный словарь и очень подробная грамматика используемых языков. Чаще всего, а значит, и в данном случае, скорее всего, тоже, применяется трансферная система. Она в наибольшей степени подражает человеку-переводчику: анализирует исходное предложение, переводит его слова, выясняет их роли, а затем с помощью грамматики собирает новое предложение на требуемом языке. 

Второй подход носит название статистического машинного перевода. Он обходится без словаря и грамматики и работает только на основе методов машинного обучения. Для этого системе нужно иметь множество пар “ предложение + его перевод”.  Благодаря таким цепочкам систем возможно запомнить перевод пары или тройки слов вместе с их окружением. При переводе будет выбираться наиболее вариант, исходя из окружения, в котором встречалось то или иное слово, а также частота различных цепочек слов. 

Reverso Context доступен только на сайте?

Помимо сайта у сервиса есть приложение для Android или iOS, которое можно бесплатно установить на любое устройство. Программа выпущена в 2018 году и объединяет функции машинного перевода. 

В том случае, если предпочтительнее работать через сайт, можно установить расширение для перевода. Оно доступно для браузеров Firefox и Chrome.

Источники