CAT-системы — системы автоматизированного перевода, которые в народе называют «кошками», — значительно упрощают для специалиста процесс перевода документа. CAT-система делит текст на сегменты (предложения) и представляет их в удобном интерфейсе для перевода. Исходный текст сегмента и его перевод сохраняются как единица перевода (translation unit) в базе данных — памяти переводов (translation memory). Так их можно использовать в дальнейшем при работе с тем же текстом или в других заказах. Кроме того, система ищет перевод терминов по базам и автоматически подставляет результат.

Помимо основных функций — памяти переводов, автоматической проверки качества перевода, машинного перевода — в CAT-системах можно подсчитывать слова, сегменты и единицы, анализировать текст, проверять правописание. Переводчик может управлять терминами, добавлять собственные словари и базы терминов.

CAT-инструменты — почему это круто?

Процесс перевода документа включает следующие этапы:

  • верстка (распознавание + форматирование);
  • перевод;
  • редактирование (постредактирование, если речь о машинном переводе);
  • корректура;
  • правка формата.

CAT-системы позволяют большую часть процесса выполнять в одной среде. Проектный менеджер загружает сверстанный документ в систему, определяет для него настройки, подключает вспомогательные материалы, устанавливает сроки и направляет исполнителям. Внутри системы документ можно делить между несколькими переводчиками, скрывать фрагменты, не требующие перевода, или подключать сразу к процессу редактора или корректора. Менеджеру остается только поправить формат: система сохраняет формат исходного файла, а объем переведенного текста может не соответствовать объему оригинала (частое явление для пары EN-RU).

Создание нового проекта в SmartCAT: можно добавить память переводов, справочные файлы и подключить машинный перевод. Скриншот с сайта smartcat.ai выполнен автором.

CAT-инструменты экономят время и деньги. Переводчику не приходится искать термины, уже сохраненные в базе и утвержденные заказчиком. Части документа, совпадающие с сегментами из памяти переводов, переводятся автоматически (100% совпадения можно подтверждать сразу же). Это позволяет сохранять единство терминологии и стиля в текстах одного заказчика.

Чем пользоваться?

Последнее время популярность набирают облачные системы перевода, например SmartCAT, Memsource и MateCat. Они позволяют менеджеру ещё на стадии запуска проекта подключать к нему необходимые глоссарии и базы, контролировать соблюдение сроков.

SmartCAT делит исходный текст на сегменты и размещает их в отдельных клетках, предлагая пользователю ввести перевод в пустую клетку справа. Виден прогресс-бар с подсчетом слов, инструменты. Справа сегмент, сохраненный в базе. Скриншот с сайта smartcat.ai выполнен автором. В качестве примера использован текст рассказа ‘The corpse bird’, Ron Rash.

Не менее распространено и ПО для переводчиков — например, SDL Trados или memoQ. Такие программы работают на популярных операционных системах, поддерживают много языков и самые разные файловые форматы, благодаря чему они совместимы друг с другом.

«Кошки» заодно с ИИ?

Об искусственном интеллекте упоминают чаще всего в контексте нейронного машинного перевода, но теперь он добрался и до CAT-инструментов. Встроенная система нейронного перевода с памятью переводов и базами терминов — это минимум того, что может предложить переводчикам искусственный интеллект. В своих публикациях разработчики SDL избегают термина «постредактирование» (post-editing) в отношении переводов их нейросети, предпочитая называть это «проверкой» (reviewing): они уверены, что такое определение больше подходит для того уровня качества, какой демонстрирует их система (для пары RU-EN точность, по их словам, составляет 95%).

Memsource, и экономия средств

А разработчики Memsource активно внедряют ИИ в процесс не только перевода, но и управления проектами. Система берет на себя рутинные задачи, не допускающие вариаций. Так, с помощью функции оценки качества машинного перевода (MTQE) можно искать автоматически переведенные сегменты, которые не требуют постредактирования. Другая функция выявляет непереводимое содержимое сегментов (символы, цифры).

В Memsource считают, что с помощью искусственного интеллекта можно достичь максимальной автоматизации процесса перевода — именно к этому стремятся все крупные бюро переводов. В будущем ИИ будет анализировать исходный текст, подбирать подходящие вспомогательные материалы и ресурсы (памяти переводов, базы терминов, системы машинного перевода) и искать переводчиков и редакторов с соответствующим опытом. CAT-системы сами будут рассчитывать сроки, отслеживать прогресс и отправлять уведомления в случае, если что-то пойдет не так.

Всё же искусственный интеллект не всемогущ. В Memsource пока не доверяют ИИ проверку текста перед отправкой заказчику: система не способна найти ошибки, если они не встречались в материале, на котором ее обучали.

SmartCAT, и забота о сотрудниках

Другой подход к возможностям ИИ — у разработчиков SmartCAT. Они планируют использовать искусственный интеллект, чтобы сделать работу рядового переводчика эффективнее и приятнее: лингвисты будут получать заказы, соответствующие их опыту, и им не придется больше расставлять теги, править числовые форматы или подтверждать сегменты, не требующие перевода. Выставлять счета и отслеживать оплату (привет фрилансерам!) станет проще. На подобные мелочи уходит до 30% рабочего времени переводчика, которые можно было бы потратить на качественный перевод и новые задачи.

CAT-системы уже сейчас высвобождают переводчику время для более сложных и интересных задач. А если все пойдет по плану, то в ближайшем будущем искусственному интеллекту предстоит с помощью «кошек» взять на себя все то, что отвлекает нас, переводчиков, от творчества.