CAT-системы — системы автоматизированного перевода, которые в народе называют «кошками», — значительно упрощают для специалиста процесс перевода документа. CAT-система делит текст на сегменты (предложения) и представляет их в удобном интерфейсе для перевода. Исходный текст сегмента и его перевод сохраняются как единица перевода (translation unit) в базе данных — памяти переводов (translation memory). Так их можно использовать в дальнейшем при работе с тем же текстом или в других заказах. Кроме того, система ищет перевод терминов по базам и автоматически подставляет результат.
Помимо основных функций — памяти переводов, автоматической проверки качества перевода, машинного перевода — в CAT-системах можно подсчитывать слова, сегменты и единицы, анализировать текст, проверять правописание. Переводчик может управлять терминами, добавлять собственные словари и базы терминов.
CAT-инструменты — почему это круто?
Процесс перевода документа включает следующие этапы:
- верстка (распознавание + форматирование);
- перевод;
- редактирование (постредактирование, если речь о машинном переводе);
- корректура;
- правка формата.
CAT-системы позволяют большую часть процесса выполнять в одной среде. Проектный менеджер загружает сверстанный документ в систему, определяет для него настройки, подключает вспомогательные материалы, устанавливает сроки и направляет исполнителям. Внутри системы документ можно делить между несколькими переводчиками, скрывать фрагменты, не требующие перевода, или подключать сразу к процессу редактора или корректора. Менеджеру остается только поправить формат: система сохраняет формат исходного файла, а объем переведенного текста может не соответствовать объему оригинала (частое явление для пары EN-RU).
CAT-инструменты экономят время и деньги. Переводчику не приходится искать термины, уже сохраненные в базе и утвержденные заказчиком. Части документа, совпадающие с сегментами из памяти переводов, переводятся автоматически (100% совпадения можно подтверждать сразу же). Это позволяет сохранять единство терминологии и стиля в текстах одного заказчика.
Чем пользоваться?
Последнее время популярность набирают облачные системы перевода, например SmartCAT, Memsource и MateCat. Они позволяют менеджеру ещё на стадии запуска проекта подключать к нему необходимые глоссарии и базы, контролировать соблюдение сроков.
Не менее распространено и ПО для переводчиков — например, SDL Trados или memoQ. Такие программы работают на популярных операционных системах, поддерживают много языков и самые разные файловые форматы, благодаря чему они совместимы друг с другом.
«Кошки» заодно с ИИ?
Об искусственном интеллекте упоминают чаще всего в контексте нейронного машинного перевода, но теперь он добрался и до CAT-инструментов. Встроенная система нейронного перевода с памятью переводов и базами терминов — это минимум того, что может предложить переводчикам искусственный интеллект. В своих публикациях разработчики SDL избегают термина «постредактирование» (post-editing) в отношении переводов их нейросети, предпочитая называть это «проверкой» (reviewing): они уверены, что такое определение больше подходит для того уровня качества, какой демонстрирует их система (для пары RU-EN точность, по их словам, составляет 95%).
Memsource, и экономия средств
А разработчики Memsource активно внедряют ИИ в процесс не только перевода, но и управления проектами. Система берет на себя рутинные задачи, не допускающие вариаций. Так, с помощью функции оценки качества машинного перевода (MTQE) можно искать автоматически переведенные сегменты, которые не требуют постредактирования. Другая функция выявляет непереводимое содержимое сегментов (символы, цифры).
В Memsource считают, что с помощью искусственного интеллекта можно достичь максимальной автоматизации процесса перевода — именно к этому стремятся все крупные бюро переводов. В будущем ИИ будет анализировать исходный текст, подбирать подходящие вспомогательные материалы и ресурсы (памяти переводов, базы терминов, системы машинного перевода) и искать переводчиков и редакторов с соответствующим опытом. CAT-системы сами будут рассчитывать сроки, отслеживать прогресс и отправлять уведомления в случае, если что-то пойдет не так.
Всё же искусственный интеллект не всемогущ. В Memsource пока не доверяют ИИ проверку текста перед отправкой заказчику: система не способна найти ошибки, если они не встречались в материале, на котором ее обучали.
SmartCAT, и забота о сотрудниках
Другой подход к возможностям ИИ — у разработчиков SmartCAT. Они планируют использовать искусственный интеллект, чтобы сделать работу рядового переводчика эффективнее и приятнее: лингвисты будут получать заказы, соответствующие их опыту, и им не придется больше расставлять теги, править числовые форматы или подтверждать сегменты, не требующие перевода. Выставлять счета и отслеживать оплату (привет фрилансерам!) станет проще. На подобные мелочи уходит до 30% рабочего времени переводчика, которые можно было бы потратить на качественный перевод и новые задачи.
CAT-системы уже сейчас высвобождают переводчику время для более сложных и интересных задач. А если все пойдет по плану, то в ближайшем будущем искусственному интеллекту предстоит с помощью «кошек» взять на себя все то, что отвлекает нас, переводчиков, от творчества.