Нейросеть-предатель: алгоритм обучили выявлять тексты-подделки

Нейросети научились неплохо подражать человеку в написании текста. Но теперь есть симметричный ответ: системы обнаружения текста, порожденного нейросетями. Запасаемся попкорном и следим за битвой брони и снаряда в искусственном интеллекте

Как я перестал беспокоиться и полюбил СССР: операция Барбаросса на карте США

Карта времен Второй Мировой войны показала американцам масштабы военных действий и помогла ленд-лизу

Зачем нужна карта метафор?

На литературе в школе нас учили, что метафора — это что-то такое из стихов Пушкина. Помните, как учительница затирала про «образное сравнение»? Но на самом деле метафорами пронизан весь наш язык (даже эта фраза), и их исследование может многое сказать о том, как мы говорим и мыслим. А зачем нужна цифровая карта метафор?

Чем пахнут города?

Урбанисты добрались до запахов городов и составили интерактивную карту

Чем фрейдовский банан отличается от огурца: большие данные в психологии

Что можно узнать о пользователях интернета, зачем психологам истории поиска в Гугле и почему утверждение «все врут» больше не работает

Перенос стиля нейросетями: Дрейк, Летов, Оксимирон

Авторский стиль тяжело определить формально — это целый комплекс деталей, которые заметны человеческому глазу, но могут ускользнуть от компьютера. Указать на характерный выбор слов, конструкций, моделей легко, но как рассказать алгоритму про метафоры или научить его распознавать другие тонкие материи?

Разделяй и определяй, или Кто автор «Сна в красном тереме»

Как метод Дельты Бёрроуза и тематическое моделирование помогают решить проблему атрибуции текста

Отдай работу роботу

В случае увольнения люди охотнее согласятся уступить рабочее место машине, но не человеку

Я/МЫ НКРЯ: что происходит с национальным корпусом

…зачем в этом разбираться и почему мы волнуемся за НКРЯ

Соцсети русской драмы, часть I: основы сетевого анализа

Сегодня модно исследовать художественную литературу методами анализа социальных сетей. Мы начинаем серию постов по сетевому анализу русской драматургии. В первом посте мы расскажем, как сетевой анализ позволяет посчитать «влиятельность» литературного героя

CAT-системы и будущее перевода

Все любят котиков… особенно переводчики. Рассказываем о CAT-системах: чем и как сегодня переводят

Компьютерные языки музыки, часть II

Мы продолжаем цикл постов о компьютерных языках, используемых для передачи музыки. Сегодня рассказываем о принципиальных отличиях музыки от других видов данных и об особенностях компьютерной разметки, используемой для отображения музыкальных данных

Пусти пожить болельщика: чемпионат в Москве и рынок Airbnb

Как мегасобытия вроде Чемпионата мира влияют на рынок краткосрочной аренды жилья в Москве? Разбираемся с помощью статистики Airbnb и визуализации этих данных на карте столицы

Музей оцифрованный: как выжить в век промышленного производства медианарративов

Как сделать музей по-настоящему цифровым, какие существуют инструменты для создания интерактивного пространства и что предстоит изменить в российском музейном деле

Красота и божественная слава: статистический анализ Корана

Исследование священных текстов с помощью методов автоматической обработки языка и статистики — то, с чего начались современные Digital Humanities. Сегодня статистика применяется для анализа священных тексты разных религиозных традиций, в том числе исламской. Публикуем перевод недавней работы, где анализируется соотношение божественных черт в Коране

Начало всего виртуального сущего

Виртуальная реальность — еще одно измерение человеческой культуры, появившееся благодаря цифровым технологиям. Компьютерные игры в масштабных 3D-вселенных, виртуальные выставки, обучающий VR с его возможностью получения «удаленного» опыта… Как все это осмысляют гуманитарии?

Чат-бот подбирает парфюм

Как подобрать духи, если не смыслишь в парфюмерии, и чем пахнет Digital Humanities

Картинка вместо тысячи слов: 10 визуализаций, нужных каждому ученому

Археологам часто приходится подолгу исследовать густые джунгли или бескрайние леса. Но вот они находят руины древних построек, и наступает Момент Истины: становятся доступными новые знания. Анализировать информацию ничуть не легче, чем искать древние артефакты. Грамотная визуализация помогает по-новому взглянуть на данные, выдвинуть гипотезу или вывести проект на новый уровень

Бабочки, сканеры и льнянка-мутант: как оцифровка гербариев помогает ботаникам по всему миру

Цифровыми библиотеками и цифровыми музеями уже никого не удивишь — но как насчет цифровых гербариев? Огромные коллекции растений уже доступны в сети — и это важно не только для ученых, но и для всех, интересующихся живой природой. Как поучаствовать в биологическом краудсорсинге, зачем нужен новый «Ковчег» и кому сегодня может понадобиться лютик из середины ХХ века?

Биты или манускрипт: кто выживет в борьбе со временем?

Так ли просто сохранять цифровые объекты? Как это делают сейчас? Чем озадачены ученые всего мира? Немного простых ответов на сложные вопросы современности

Оцифровать Французскую революцию: Парламентские архивы

Оцифровка документов Французской революции — процесс, корни которого уходят в XIX век. Как, кто и зачем делает источники доступнее: разбираемся на примере Парламентских архивов

Знакомый почерк: цифровые технологии для юристов

Любой текст, написанный от руки, имеет много особенностей: форма, размер и расположение букв, даже сила, с которой ручка отпечаталась на бумаге. Усталость пишущего, количество доступного места — это тоже влияет на почерк. Эти и другие признаки выделяют юристы, когда проводят почерковедческую экспертизу. Главная задача экспертизы — установление автора рукописи. Можно ли использовать для этого цифровые технологии?

Тест Тьюринга для киберпоэтов

Как обычный «слепой тест» по отделению машинной поэзии от той, что написана людьми, приводит ученых к философскому спору об относительности понятия «человека» в искусстве

Кошки-мышки с системой: как власти в Гонконге используют технологии, чтобы найти протестующих, а протестующие — чтобы спрятаться от властей

Хотите как в Гонконге? Уже третий месяц специальный административный район Китая выглядит одновременно как поле битвы за демократию и полигон для испытания новейших технологий поиска и утаивания информации. Что происходит, почему в XXI веке можно обойтись без пламенных революционеров, ведущих за собой толпу, и зачем протестующим лазерные указки?

Очумелые ручки: ученые из MIT придумали умную перчатку

Исследователи из Массачусетского университета разрабатывают сенсорную перчатку, с помощью которой можно идентифицировать и обрабатывать тактильную информацию. А ее себестоимость составляет всего 10 долларов

Теперь с перламутровыми пуговицами: как алгоритмы работают в модной индустрии

Мода, с одной стороны, довольно консервативна — сложно придумать альтернативу рубашке, джинсам и платью, а с другой — крайне продвинута: новые ткани, новые способы их обработки и новые модели появляются каждые несколько месяцев. Если ли в этой индустрии место для цифровых технологий? Оказывается, да

«Слово о полку Игореве» как улика. Памяти А.А. Зализняка. Часть II

Почему «Слово о полку Игореве» не смогли бы создать инопланетяне или нейросеть, и при чем тут берестяные грамоты?

VR в образовании: от Древнего Египта до высадки на Луну

Дополненная, виртуальная и смешанная реальность в образовании — давно не фантастика. С каждым годом AR, VR и XR завоевывают новые позиции в школах, университетах и музеях. «Системный Блокъ» перевел статью эксперта Стива Бембери о лучших образовательных VR-новинках прошлого года

Учат в школе… Чему?

Чему учат в современной началке? Могут ли современные количественные методы помочь в поиске объективных ответов на методические вопросы? Специально ко Дню Знаний мы проанализировали более 20 тыс. заданий в учебниках по русскому языку 1-4 классов и постарались разобраться, чему же чаще всего учат в начальной школе

Накануне войны: что можно увидеть в сети родства монархов Европы 1914 года

Как соотносятся семейные связи европейских монархов начала XX века с их вероисповеданием? Сказалось ли родство на выборе стороны в Первой мировой? Историк Михаил Щегольков построил сеть монархических родственных связей в Европе 1914 года — и рассказал «Системному Блоку», что в ней можно разглядеть

Что случилось с самыми унылыми стихотворениями XIX века

Элегия — ключевой поэтический жанр «‎золотого века» русской поэзии. Что можно узнать о нем, используя количественные методы, такие как подсчет статистики словоупотреблений, тематическое моделирование, регрессионный анализ длины стихотворений? Рассказывает филолог Тоня Мартыненко (Тартуский университет)

«Объединить классических филологов и специалистов по цифре»

Какие возможности даёт историческому лингвисту программирование? Об этом в интервью Системному Блоку рассказал Йоханн-Маттис Лист — исследователь в области исторической лингвистики и разработчик цифровых методов для сравнительного анализа языков

Word2Vec: покажи мне свой контекст, и я скажу, кто ты

Разбираемся, как компьютеры понимают смысл наших текстов

Как технологии помогают жителям менять свои города

Если вы не архитектор и не урбанист, то построить город вы можете только в своих мечтах, Майнкрафт или СимСити. Или всё-таки нет?

Порно с большими данными

Эпоха порнофильмов на родительских кассетах осталась в прошлом. На смену видеопроигрывателям пришли порнотьюбы. И теперь вся порноиндустрия думает только об одном — о пользовательских данных

Нейросеть расшифровала древние надписи

Исследователи из MIT и Google Brain объединились для создания алгоритма, который имеет шанс повторить подвиг Майкла Вентриса — он в 1950-е годы расшифровал одну из древних форм критского письма. Пока что нейросеть научилась читать угаритский, копируя типичные действия ученых-дешифровщиков

Вся наша жизнь — интернет, а мы в нём вещи

Вы когда-нибудь задумывались, откуда вам приходит спам? Вполне возможно, что от холодильника (умного, само собой). Все больше вещей вокруг нас имеют доступ к самой разной информации, в том числе и личной. Даже у утюга могут быть уши, а то и «рот», которым он расскажет всё о вас другому утюгу из Китая, ведь они связаны. Но как?

Спутник в небе, нейросеть на земле

Что может увидеть компьютер на космических снимках?

Данные нас связали: где и как применяют статью 20.2 КоАП РФ

«Системный Блокъ» открывает серию материалов по анализу применения статьи 20.2 КоАП — той самой, которую сегодня массово используют против задержанных на митингах и шествиях. В первом посте рассказываем о том, какие данные по 20.2 собрал правозащитный проект ОВД-Инфо и как мы нашли в этих данных два нестандартных случая применения статьи

Алгорейв: как код превращается в музыкальный перформанс

Молодое движение в мире электронной музыки — алгорейв. Что это и как раскачать публику, написав пару строк кода?

Как провести корпусное исследование? Помогите!

Рассказываем, что такое mystem и antconc, для чего они нужны, и как ими пользоваться

Cибирские пожары из космоса

Увидеть лесной пожар своими глазами — не отходя от компьютера

Художники дружат: почему знаменитости знамениты

В нашей жизни все решают связи. Хорошие, крепкие связи с друзьями, коллегами, менеджерами, бывшими, рекламщиками, бывшими рекламщиками… Согласно исследованию, именно они определяют, станет ли художник успешным

Translate-баттл: могут ли онлайн-переводчики передавать стиль текста?

«Мой мозг застрял в черепе», «He was introduced to the wells», «филиал исследований» и другие приключения онлайн-перевода

ИИ-гроссмейстер в нелогичном реальном мире

Как искусственный интеллект, господствующий на игровом поле, может помочь в решении биомедицинских задач и научатся ли машины думать как человек

Странные языки

Чем английский необычнее венгерского? Лингвисты вычислили странность 239 языков мира и составили рейтинг

8 главных прорывов в нейросетевом NLP

Как компьютерная лингвистика подсела на нейронные сети и диплернинг, какие подходы сегодня в тренде и почему они так хороши

Сможет ли компьютер распознавать ложь: ИИ против fake-news

Распознавание лжи в текстах методами компьютерной лингвистики и машинного обучения – сравнительно новое направление в науке. Разбираемся, как это работает и чего ждать от этих разработок в будущем

Искусственный интеллект против гриппа

Мы уже привыкли, что ИИ способен управлять беспилотниками, рисовать картины и даже разговаривать с крысами — но вот разработка австралийского университета Флиндерса позволяет оценить перспективы ИИ в фармацевтике и здравоохранении

Что такое кросс-языковая морфология и зачем она нужна

Машинный перевод и другая компьютерно-лингвистическая магия работают тогда, когда есть много данных для обучения нейросетей. Но что делать, если язык редкий и данных почти нет? Рассказываем про хитрый способ выкрутиться с помощью лингвистики

О чем говорят крысы

В серии книг о Плоском мире писателя Терри Пратчетта был персонаж Смерть крыс, в словаре которого было всего одно слово «ПИСК» (разумеется, капителью, он же Смерть!). Живые крысы используют куда более продвинутый язык — они краснеют ушами, шевелят носом и принимают определенные позы, но сегодня поговорим о звуках, которые крысы издают — и это куда богаче одного ПИСК

Это фиаско, мистер Переводчик!

Mr.Translator, переводчик на основе искусственного интеллекта, провально отработал на международном форуме. И это уже не первый случай, когда реальное качество системы оказалось совсем не таким, какое обещали оптимисты-разработчики. Будущее машинного перевода под угрозой?

Под зонтиком Digital Humanities

Ученый и писатель Роман Лейбов о том, что делать с корпусом, учить ли гуманитарию математику и чем заниматься в Рунете, если ты его пионер

Языки музыки. Часть 1

Мы запланировали цикл постов о компьютерных языках разметки, используемых для нотации музыкальных произведений. Сегодня вводная часть — о том, почему запись музыки — это нетривиальная задача, способная расширить возможности компьютерных наук

Эпидемия ИИ-искусства

Теперь рисовать могут не только люди: рассказываем об ИИ, создающем потусторонние портреты

Дружелюбные города

Какие места располагают к связям с незнакомцами?

Как понять, о чем текст, не читая его?

Что такое тематическое моделирование и как оно работает

Великий, могучий и понятный… Или нет?

Что такое простой и понятный русский язык? Хотелось бы, чтобы разобрался компьютер. Пока он лучше справляется с английским, но можно его научить

Интерфейс как посредник

Чем является интерфейс для цифрового гуманитария? Всегда ли он должен быть простым? Должен ли ученый понимать, что происходит «там под капотом»? Разбираемся с помощью акторно-сетевой теории

Компьютерная лингвистика? Нет, вычислительная!

Почему переводить computational linguistics как «компьютерная лингвистика» — плохая идея

Нейронные сети в машинном переводе: статус-кво

Что сейчас происходит в нейронном машинном переводе и каково состояние дел в отрасли? Публикуем рассказ ведущего разработчика систем машинного обучения