Считается, что работа с переводами по большей части уже автоматизирована. Онлайн-переводчики помогают сделать черновую работу за тех, кто занимается этим профессионально. Обычным пользователям же предоставляется мгновенный доступ к тексту на другом языке, качество которого улучшается с каждым годом. Но существует еще один инструмент, который облегчает работу с переводами.
Краткая история Reverso
История сервиса началась в 1998 году. Его целью было предоставление машинного перевода с французского на немецкий язык. Через год сервис стал поддерживать перевод на английский и обратно. Сервис популярен среди различных организаций, им пользуется французская армия и даже Департамент культуры Франции.
В 2013 году был запущен сайт Reverso Context, который функционирует и на русском языке. Через три года, уже в 2016 году, компания Reverso включила в себя сервис Fleex, использующийся для изучения английского языка через фильмы с субтитрами.
Сегодня веб-сайт включает более ста языковых пар с миллиардами переводов. Общее количество пользователей составляет около 60 миллионов человек.
Как это может пригодиться?
В отличие от других онлайн-переводчиков, Reverso Context показывает примеры слов в предложении. Это помогает увидеть, как слово используется грамматически, какими членами предложения окружается и в каком контексте чаще всего употребляется. Например, если ввести в Reverso само слово «перевод», сервис выдаст множество результатов, в которых было бы легко запутаться без контекста.
Из примеров сервиса становится понятно, где речь идет о переводе текста, а где — о денежных переводах. Другие онлайн-переводчики не предоставляют контекста для понимания разницы между, например, «translation» (перевод на другой язык) и «transfer» (перевод средств), что значительно усложняет поиск по конкретным словам.
Какие тексты используются в качестве источников?
Как следует из названия, особенность ресурса состоит в том, что он переводит слова, ссылаясь не на словарные статьи, а на примеры использования в разных предложениях. Следовательно, набор данных должен быть всеобъемлющим, чтобы охватывать все варианты использования слов или выражений. Разработчики заявляют, что все примеры собраны из реальных текстов, поэтому в них могут быть разговорные фразы и грубые термины.
В основном используются тексты из фильмов и книг. Например, компания Fleex, которая входит в состав Reverso, использовала фильмы и сериалы Netflix, видео из YouTube, а также пользовательские файлы. Помимо этого существуют данные и из правительственных документов, чтобы дать пользователю возможность ознакомиться с более формализованной лексикой.
Функционал сервиса
Помимо перевода с указанием на контекст (который возможно посмотреть и в более полном варианте) есть возможность автоматического озвучивания слов и предложений. Кроме того, пользователь может узнать синонимы и значения слов. В дополнение к этому система предоставляет функцию адаптации перевода для определенной области, например, для сферы бизнеса.
Для десяти языков представлена функция спряжения глаголов, а также создания персонального словаря. Пользователь может участвовать в расширении уже действующих словарей. Некоторые функции доступны при регистрации, однако базовый функционал работает и без учетной записи.
Приложение дает дополнительную возможность обучения языкам: оно включает карточки для запоминания, которые сгенерированы на основании слов в предложениях-примерах.
Какие технологии используются для перевода?
По заявлению разработчиков, система работает на основе искусственного интеллекта. Нейронный машинный перевод может использоваться на основных серверах компании, так и других серверах по желанию пользователя, если его возможности позволяют это делать.
Reverso Context оперирует двумя подходами к машинному переводу. Оба эти подхода формируют так называемый гибридный перевод, совмещающий как правила, так и статистику. Объединение правил и статистики возможно двумя способами: можно интегрировать правила в статистическую модель либо внедрить статистический модуль в перевод, основанный на правилах. Конкретный выбор объединения обычно зависит от разработчика, и предпочтительный вариант не раскрывается пользователям.
Первый подход перевода осуществляется при помощи правил. Для этой системы необходим как можно более подробный словарь и очень подробная грамматика используемых языков. Чаще всего, а значит, и в данном случае, скорее всего, тоже, применяется трансферная система. Она в наибольшей степени подражает человеку-переводчику: анализирует исходное предложение, переводит его слова, выясняет их роли, а затем с помощью грамматики собирает новое предложение на требуемом языке.
Второй подход носит название статистического машинного перевода. Он обходится без словаря и грамматики и работает только на основе методов машинного обучения. Для этого системе нужно иметь множество пар “ предложение + его перевод”. Благодаря таким цепочкам систем возможно запомнить перевод пары или тройки слов вместе с их окружением. При переводе будет выбираться наиболее вариант, исходя из окружения, в котором встречалось то или иное слово, а также частота различных цепочек слов.
Reverso Context доступен только на сайте?
Помимо сайта у сервиса есть приложение для Android или iOS, которое можно бесплатно установить на любое устройство. Программа выпущена в 2018 году и объединяет функции машинного перевода.
В том случае, если предпочтительнее работать через сайт, можно установить расширение для перевода. Оно доступно для браузеров Firefox и Chrome.