На протяжении последних десятилетий «общим местом» для многих аналитиков была констатация факта, что именно либеральная демократия является единственным вариантом для движения по пути развития и прогресса. Причем одним из условий существования подобной модели считалось отсутствие цензуры. Однако появление цифровых технологий поставило и такую точку зрения под сомнение. Технологии искусственного интеллекта (ИИ) позволяют исследовать, понимать и контролировать граждан гораздо эффективнее, чем когда-либо ранее.
Китайский Большой Брат
Как заявляет американский аналитик Росс Андерсен: «Государство, обладающее достаточной вычислительной мощностью, могло бы ввести в правительственную базу данных каждый всплеск нейронной активности гражданина» [1]. А такое положение дел предоставляет поистине гигантские возможности для цензурирования получаемой информации, в том числе и с использованием узконаправленного подхода, когда «обходные» пути для получения информации блокируются ИИ.
При этом Китай, пожалуй, является одним из наиболее удобных мест для проведения эксперимента по применению технических средств цензурирования и контроля населения. В стране насчитывается более миллиарда смартфонов, все они битком набиты сложными датчиками. Каждый из них регистрирует запросы поисковых систем, посещенные веб-сайты и мобильные платежи. Предустановленные китайскими компаниями-производителями компоненты и приложения позволяют правительственным структурам осуществлять деятельность по контролю за передаваемой и получаемой информацией. Как указывает Я.В. Лексютина: «В Китае создан один из самых жёстких режимов фильтрации информации в Интернете: по признаку политического контента (например, выражение мнений, противоречащих официальной позиции, освещение вопросов прав человека, свободы слова, прав национальных меньшинств, религиозных движений) Китай занимает лидирующие позиции в мире наряду с Вьетнамом, Сирией, Эфиопией, Ираном; по признаку «конфликт и безопасность» (контроль контента, относящегося к военным конфликтам, пограничным спорам, сепаратистским движениям, военным группам) – с Южной Кореей» [2].
Китай превратил искусственный интеллект и большие данные в важнейшую часть государственной безопасности и ключевой компонент реализации «Китайской мечты о национальном возрождении» [3]. Это также означает, что Китай находится на переднем крае наработки новых форм цифрового взаимодействия государства, бизнеса и общества. Но подобные процессы не могут происходить без противоречий, а их, в свою очередь, требуется замаскировать, в том числе используя средства цифровой цензуры.
Население КНР сегодня чрезвычайно зависит от Интернет-среды. И здесь нельзя не уделить внимание тому факту, что именно образованные городские жители склонны проводить все больше времени в Интернете. Эта социальная категория в КНР считается такой целевой группой, которая предрасположена к получению информации из внекитайских, а иногда и антикитайских источников, а потому нуждается в особом внимании государственных структур безопасности, в том числе и в области цензуры.
Цензура против национальных меньшинств
Использование систем цензурирования с ИИ помогает в контроле за одной из основных опасностей для самого существования китайского государства – радикализма национальных меньшинств (например, уйгуров). Он не только угрожает внутренней политической стабильности, но и нередко перерастает в антиправительственную деятельность и даже терроризм.
Недаром в самых известных китайских стартапах в области ИИ, в разной степени связанных с наработкой систем контроля за населением (таких как Sense Time, Cloud Walk, Megvii, Hikvision, iFlytek, Meiya Pico-Xi) «тестовым населением» для отработки новых технологий является мусульманское меньшинство Синьцзяна (известное своим антикитайским настроем). Так, уже сегодня, по свидетельству Росса Андерсена, уйгуров, населяющих провинцию Синьцзян, полиция заставила установить особые приложения на свои новые телефоны [4]. Приложения используют алгоритмы для поиска «идеологических вирусов» днем и ночью. Эти приложения могут сканировать журналы чатов на наличие стихов Корана и искать арабскую письменность в мемах и других графических файлах. Со временем подобные технологии могут распространиться и на весь Китай. Как указывает американский аналитик Тимоти Гроуз: «Синьцзян предоставляет лишь испытательный полигон, с которого технологии контроля с помощью ИИ будут затем опробованы в гораздо более широких масштабах» [5].
«Искусственный интеллект нового поколения»
Ключевым документом китайской стратегии развития и использования ИИ как во внутренней, так и в международной сфере является план развития «Искусственного интеллекта нового поколения», утвержденный Государственным советом КНР в июле 2017 года. В плане выложены ключевые показатели для индустрии ИИ КНР, выделяется, что искусственный интеллект стал приоритетом национального стратегического уровня, подчеркиваются главные области его применения: создание открытой и кооперативной инновационной системы в области ИИ; развитие высокотехнологичной и высокоэффективной интеллектуальной экономики; построение безопасного и удобного интеллектуального общества; укрепление военно-гражданской интеграции в области ИИ; создание повсеместной, безопасной и эффективной системы интеллектуальной инфраструктуры нового поколения крупных проектов, связанных с ИИ [6]. При этом, как подчеркивается в обширном исследовании Авиационного университета ВВС США: «План предусматривает установление более всеобъемлющих правил ИИ и этических норм»[7]. А это, в свою очередь, делает необходимым разработку новых правил участия ИИ в цензурировании.
В Китае для реализации этих стратегических приоритетов существует немало интеллектуальных и технологических центров, занимающихся разработкой и реализацией проектов в области системы цензурирования с помощью ИИ. Тем более, что упомянутый ранее государственный план прямо предусматривает формирование кластеров инновационных баз ИИ, особенно сосредоточенных вокруг Государственных ключевых лабораторий (в том числе действующих на крупных предприятиях), в Национальных инженерных лабораториях, а также на производственных площадках и в бизнес-инкубаторах.
Так, к северо-западу от «Запретного города» в Пекине, за пределами Третьего транспортного кольца, находится кампус Национальных лабораторий Китайской академии наук. Недалеко от его центра находится «Институт автоматики», изящное серебристо-голубое здание, окруженное усеянными камерами столбами. Институт является базовым научно-исследовательским учреждением по раскрытию фундаментальных тайн искусственного интеллекта. Спектр разрабатываемых в этом учреждении технологий чрезвычайно широк: от анализа видеоматериалов, собранных камерами, для выявления угроз безопасности того или иного рода, до контроля информационных потоков, получаемых конкретным человеком или организацией. И конечно, традиционно для КНР, одной из областей разработки является использование технических достижений для цензуры.
Послабления и ужесточения
Сегодня китайские специалисты достигли немалых высот в построении действующей системы цифровой цензуры с помощью технологий ИИ. Так, правительственная цензура социальных сетей, новостей и веб-сайтов напрямую влияет на большие объемы текста, блокируя доступ пользователей, удаляя отдельные сообщения. Проект «Золотой щит», известный как «Великий китайский брандмауэр», является центром правительственной онлайн-цензуры. Его методы включают регулирование пропускной способности, фильтрацию ключевых слов и блокировку доступа к определенным сайтам. При этом если ранее на территории материкового Китая были заблокированы все языковые версии Википедии, то сегодня (2021 г.) в поиск Google Scholar возвращено более 2000 результатов по «предварительно подготовленным вложениям слов из Википедии» [8]. Но и они должны пройти цензурную проверку материала с помощью ИИ в реальном времени.
Особенно заметно применение технологий цензурирования с помощью ИИ при написании статей для китайской альтернативы Википедии – энциклопедия Байду. Здесь применяются цифровые алгоритмы анализа фраз китайского языка, что позволяет замечать проявление запрещенной цензурой КНР информации не только прямо, но и с помощью различных эвфемизмов и подтекста.
Сегодня китайские достижения становится невозможно отрицать. Традиционные машинные цензоры, которые для этого полагаются в основном на ключевые слова, изо всех сил пытаются достичь точности в 70%. И даже технологии искусственного интеллекта, которые нуждаются в длительном обучении людьми, в последние годы увеличили этот показатель лишь до 80%. Однако команда из Шэньянского университета Лигун Китайской академии наук заявляет, что «разработанный ими подход может действовать в отрыве от машинного обучения с участием людей и при этом является более эффективным по сравнению с другими используемыми технологиями, достигнув точности распознания подцензурной информации более 91%» [9].
При этом, весьма традиционно для Китая, что его исследователи для повышения эффективности своих разработок не стесняются использовать достижения других разработчиков. Так, в случае с системой цензурирования Шэньянского университета, разработчики совместили возможности ИИ и языковую модель Google от 2017 года известную как BERT, созданную, чтобы помочь поисковой системе лучше понимать поисковые запросы пользователей. Изначально BERT может читать слово в разных контекстах, но не может понимать текст длиной более 512 знаков. Но новейший китайский цензор разбивает длинный текст на сегменты, что позволяет BERT читать более короткие части и использует инструменты ИИ для объединения результатов и их оценки с использованием самого современного словаря.
Цензура против YouTube
Кроме того, в КНР ИИ в последние годы начинает использоваться для анализа аудио- и видеоматериалов. Видео на языках, отличных от китайского, должны либо быть предварительно одобрены традиционной цезурой, либо иметь китайские субтитры (что естественно облегчает проверку). Иначе они с большой вероятностью будут запрещены для просмотра, поскольку пока китайские системы цензурирования еще недостаточно эффективно работают с иностранными языками. Подобные примеры цензуры хорошо показывает исследователь и документалист Эндрю Джонстон [10].
Китай стремится использовать даже ошибки в системе таких «враждебных» цифровых платформ как Google и YouTube. Например, широкое обсуждение получил случай, когда YouTube стал фактическим исполнителем китайских правил цензуры в мировом интернете [11].
ИИ и фейки о коронавирусе
Наконец, в последние два года китайская информационная цензура стала действенным инструментом в борьбе с распространением нежелательной информации о COVID-19, позволившей, в том числе, наряду с медицинскими и противоэпидемическими мероприятиями, стать КНР одной из наиболее успешных стран в борьбе с пандемией. И сегодня многим людям, как в самом Китае, так и других странах мира кажется, что пандемия COVID-19 предоставила доказательство правильности концепции, продемонстрированной в области использования цифровых технологий цензуры властями КНР. При этом технология с «китайским оттенком» работает довольно эффективно, а контроль и наблюдение в чрезвычайной ситуации не только возможен, но и необходим.
Таким образом, современные усилия государственных структур Китая и ученых этой страны позволяют говорить, что искусственный интеллект готов в очередной раз изменить мир. С интеллектуальными машинами, обеспечивающими высокий уровень когнитивных процессов, таких как мышление, восприятие, обучение, решение проблем и принятие решений, в сочетании с достижениями в области сбора и агрегации данных, аналитикой и гигантскими вычислительными мощностями задействованными на просеивание всей поступающей в цифровую среду информации, ИИ представляет возможности, не только по дополнению традиционного человеческого интеллекта, облегчению труда человека и обогащению его образа жизни, но по выводу на новый уровень системы цензуры, слежения и контроля за населением.
Источники
[1] Andersen Ross. The Panopticon Is Already Here [Electronic resource] // The Atlantic. — URL: https://www.theatlantic.com/magazine/archive/2020/09/china-ai-surveillance/614197/ (date of request 21.07.2021)
[2] Лексютина Я.В. Политика китайского руководства в вопросах контроля и регулирования Интернета // Общество и государство в Китае. 2015. №1. — С. 203.
[3] см. например, Yizhou (Joe) Xu. Programmatic Dreams: Technographic Inquiry into Censorship of Chinese Chatbots // Social Media + Society, Vol. 10. 2018 . — Р. 1.
[4] Andersen Ross. The Panopticon Is Already Here [Electronic resource] // The Atlantic. — URL: https://www.theatlantic.com/magazine/archive/2020/09/china-ai-surveillance/614197/ (date of request 21.07.2021)
[5] Samuel Sigal. China Is Going to Outrageous Lengths to Surveil Its Own Citizens [Electronic resource] // The Atlantic. — URL: https://www.theatlantic.com/international/archive/2018/08/china-surveillance-technology-muslims/567443/ (date of request 21.07.2021)
[6] Plan for the Development of New Generation Artificial Intelligence State Council // Guo Fa 2017. No. 35. — http://chinainnovationfunding.eu/dt_testimonials/state-councils-plan-for-the-development-of-new-generation-artificial-intelligence/ (date of request 21.07.2021)
[7] Artificial Intelligence, China, Russia, and the Global Order : Technological, Political, Global, and Creative Perspectives / Editor: Nicholas D. Wright. — Maxwell Air Force Base, Alabama. Air University Press, 2019. — Р. 69.
[8] Yang Eddie and Roberts Margaret E. Censorship of Online Encyclopedias: Implications for NLP Models. // In Conference on Fairness, Accountability, and Transparency (FAccT ’21), March 3–10, 2021, Virtual Event, Canada.ACM, — New York, NY, USA, 2021. — Р. 538.
[9] Chen Stephen. Chinese researchers say they’ve developed an AI text censor that is 91 per cent accurate [Electronic resource] // South China Morning Post. — URL: https://www.scmp.com/news/china/science/article/3129414/chinese-researchers-say-theyve-developed-ai-text-censor-91-cent (date of request 21.07.2021)
[10] см. например, Johnston Andrew. Information is Treachery [Electronic resource] // The Swamp. — URL: https://vocal.media/theSwamp/information-is-treachery (date of request 21.07.2021)
[11] см. например, Vincent James. YouTube brings back more human moderators after AI systems over-censor [Electronic resource] // The Swamp. — URL: https://vocal.media/theSwamp/information-is-treachery (date of request 21.07.2021)