Фото автора

Евгения Родикова

Художник

Увлекаюсь живописью, иллюстрацией, дизайном одежды. Люблю котиков

Иллюстратор статей

Стилометрия кинодиалогов: шесть жанров в поисках автора

Статья Яна Рыбицкого и Агаты Холобут The Stylometry of Film Dialogue: Pros and Pitfalls показывает связь между жанровыми особенностями кино и лексикой диалогов: с помощью стилометрии и сентимент-анализа авторы исследуют 178 фильмов из разных эпох. Рассказываем, что же у них получилось

Фонограммархив для науки: Светлана Подрезова о коллекции аудиозаписей Пушкинского Дома и работе с источниками

Как связаны имена Блока и Гумилёва с историей крупнейшей коллекции этнографических аудиозаписей? Когда исполнители перестали бояться раструба фонографа? Что происходит, если идеология вмешивается в научный процесс? Как происходит цифровизация аудио, записанного некогда на восковые валики? Об этом в интервью «Системному Блоку» рассказала Светлана Подрезова, заведующая Фонограммархивом Пушкинского Дома (ИРЛИ РАН).

Cultural heritage in action: лучшие практики сохранения и популяризации культурного наследия в Европе

Проект Cultural heritage in action собирает хорошие решения по работе с культурным наследием в Европе и открывает доступ к получившемуся каталогу.

Искусственный интеллект vs. феномен Владимира Набокова

Владимир Набоков известен тем, что писал и на русском, и на английском. Сможет ли компьютер распознать его оригинальный стиль? Этот вопрос исследовал цифровой филолог Борис Орехов. О том, как стилометрия при помощи статистики справляется с филологическими задачами – в материале «Системного Блока».

Язык и точка невозврата: интервью с лингвистом Михаилом Даниэлем о сохранении языков и языковом разнообразии 

Малыми языками интересуются одновременно и учёные, и языковые активисты, и (иногда) государство. «Системный Блокъ» подготовил интервью с Михаилом Даниэлем — исследователем малых языков, социолингвистом и участником проектов ВАНК и Multidagestan. Мы обсудили, каким языкам грозит вымирание.

Преодолевая тишину: что такое Sound Studies и как создаются звуковые карты

«Любой обманчив звук», — пел Александр Васильев. И как же он прав! Всё, что мы слышим каждый день — от надоедливых уведомлений до сигнала светофоров, – содержит целый пласт коллективных и индивидуальных значений, редко совпадающих друг с другом. Воспринимаемый обычно как фон, звук на самом деле формирует отношение к месту и влияет на воспоминания о событиях. Изучением этого и занимаются Sound Studies.

Научный журналист должен быть аутсайдером: Ольга Добровидова о научной коммуникации и научной журналистике

Научный и экологический журналист Ольга Добровидова — о разнице между научными журналистами и научными коммуникаторами, о конфликте интересов между научным сообществом и общественным благом, а также о том, как вырос запрос на медицинскую журналистику.

От аналогового к цифровому: как происходит оцифровка в архивах, музеях и библиотеках

Современный мир захлестнула цифровизация. Это не обошло стороной, в том числе, и институции культурного наследия, которые начали массово переводить свои коллекции в цифровой формат. Рассказываем, что и зачем оцифровывают библиотеки, музеи, архивы, а также каким образом культурное наследие обрабатывается компьютерной техникой.

Домашнее и партнерское насилие в России: сколько у него жертв и как им помочь

Проблема домашнего насилия — одна из наиболее острых социальных проблем в современной России. А вопрос о достоверной статистике по этой теме — один из самых болезненных. Разбираемся в том, кто становится авторами насилия, кто от него страдает и куда обращаться.

Магнитометрия: что это такое и как её используют в археологии 

Не секрет, что археологические раскопки нередко влекут за собой гибель памятника. Давняя мечта археологов — изучать памятники, не разрушая их. Сохранить культурный слой помогают устройства, которые «просветили» бы земную толщу. Они появились в середине XX века. Рассказываем о том, как применяется в археологии магнитометр и что такое магнитометрическая разведка.

Поиграем в прошлое: как исторические видеоигры влияют на современность

Исторические игры регулярно попадают в десятку самых продаваемых видеоигр в разных странах, а опирающаяся на всемирную историю Assassin's Creed — одна из самых продаваемых франшиз видеоигр всех времен. Разбираемся, как видеоигры транслируют историю и почему интерес к ним не угасает.

24000 оцифрованных старых открыток: проекту «Пишу тебе» два года

В июне 2021 года команда «Системного блока» презентовала проект открытого цифрового архива отправленных почтовых открыток. Имя этого проекта — «Пишу тебе». Два года спустя мы хотим рассказать про интересные открытки, которые мы собрали, и обозначить планы на будущее.

Нужный, живой, веселый, пьяный, хороший: цифровой анализ текстов песен «Короля и Шута»

Наверняка вы когда-нибудь слышали о группе «Король и Шут». Даже, если вы не преданный фанат, то мы почти уверены, что, узнав строки «Разбежавшись, прыгну со скалы», вы подхватите мотив и подпоете: «Вот я был, и вот меня не стало». К тому же, недавний релиз сериала о группе снова оживил интерес слушателя к творчеству самых известных панков России. «Системный блокъ», вдохновившись сериалом, решил не только переслушать старые хиты, но и количественными методами изучить творчество «Короля и Шута».

Как работают языковые модели

Что такое языковая модель? Что общего между клавиатурой вашего телефона и GPT? Почему языковые модели умеют не только моделировать язык? Можно ли предсказать точность модели до её обучения? Отвечаем на все эти вопросы в нашем материале.

Как провести стилометрический эксперимент с помощью stylo?

Системный Блокъ уже рассказывал о том, что такое стилометрия, и о многих стилометрических исследованиях. Читайте подробный гайд, как самому провести такой эксперимент — с помощью stylo, библиотеки языка R и самого популярного инструмента для стилометрии.

Цифровая реконструкция: как воссоздали портрет Черчилля для сериала «Корона» 

Некоторые утраченные картины сохранились лишь на фотографиям плохого качества. Сейчас благодаря 3D-сканерам и технологиям международное объединение художников и инженеров восстанавливает погибшие шедевры. Чтобы разобраться в цифровой реставрации картин, познакомимся с деятельностью мастерской из Мадрида и узнаем историю воссоздания портрета Черчилля.

Что такое цифровое наследство?

Разбираемся, что такое цифровое имущество и как подготовить свои цифровые активы к передаче по наследству.

«Открытые данные против мракобесия и пренебрежения реальностью»: интервью с Кириллом Маслинским 

Кирилл Маслинский — цифровой филолог, руководитель Лаборатории цифровых исследований литературы и фольклора в Пушкинском Доме, создатель Детского корпуса и Репозитория открытых данных по русской литературе и фольклору. «Системный Блокъ» узнал у Кирилла, что можно найти в тысячах оцифрованных детских книг, когда в детской литературе было допустимо употреблять слово «какашка», зачем филологам репозиторий открытых данных и может ли этот репозиторий как-то помочь в борьбе с мракобесием и войнами.

Русско-китайский корпус НКРЯ, или как превратить ботвинью в гаспачо

Параллельный корпус — это коллекция текстов, где для каждого текста хранятся его переводы на другой язык (или языки). Параллельные корпуса позволяют узнать, какие приемы и стратегии использовал переводчик для передачи слов, у которых нет эквивалентов в другом языке. В этой статье мы расскажем про русско-китайский параллельный корпус в составе Национального корпуса русского языка.

Как дообучить языковую модель писать в стиле Достоевского

Как обучить нейросеть на своих данных? Какие бывают параметры обучения/генерации, и на что они влияют? Как оптимизировать процесс обучения, если нет видеокарты? Отвечаем на все эти вопросы в нашем туториале по файн-тюнингу ruGPT3 на текстах Достоевского.

От древнерусского до корпуса блогов: как изменился Национальный корпус русского языка после редизайна 

Национальный корпус русского языка (НКРЯ) — важнейший инструмент любого исследователя, который занимается русским языком, русской литературой и вообще русской словесной культурой. Изменения в работе НКРЯ были заметны ещё в 2019 году: тогда лингвисты высказали опасения о возможном закрытии сервиса. К счастью, проблемы оказались временными, и НКРЯ не только не прекратил свою работу, но и заметно изменился и расширился. Самым заметным обновлением стал новый дизайн сайта, но есть и много глубоких содержательных перемен. Об основных обновлениях в корпусе, очевидных и не очень — в нашем сегодняшнем материале.

Хактивизм: кто и как ведет борьбу в киберпространстве

Сайт Госуслуг «упал» после объявления в России мобилизации. Rutube обрушился 9 мая 2022 года и не работал три дня. Некоторые российские радиостанции и телеканалы в феврале 2023 года сообщали о несуществующей воздушной тревоге. За этими и другими подобными событиями стоят так называемые хактивисты. Что ими движет? Как их действия влияют на мир? Кто они: герои или преступники? Разбираемся в истории хактивизма в нашем материале.

Что такое transfer learning в обучении нейросетей

Как нейросеть, обученная под одну задачу, решает другую? Может ли она использовать свой «предыдущий опыт»? Почему это важно и почему корпорации спешат внедрить эту технологию? Рассказываем о популярном методе «переноса знаний» в машинном обучении на примерах языков, ягод и Достоевского.

«И пусть все читают “Одумайтесь”»: Анастасия Бонч-Осмоловская о цифровом Толстом и пересборке DH после 24 февраля

Анастасия Бонч-Осмоловская ― лингвист, филолог, цифровая исследовательница, идейная вдохновительница и душа российских Digital Humanities. «Системный Блокъ» поговорил с Анастасией о работе над цифровым изданием 90-томника Л.Н.Толстого и пересборке российского DH-сообщества после 24 февраля 2022.

Голос Холокоста в «Пишу тебе»: как мы получили открытку из гетто

«Пишу тебе» всегда призывает наших читателей и волонтеров делиться открытками из семейного архива. История, которой мы хотим сегодня поделиться, началась с комментария под постом: «У меня есть не очень красивая открытка, отправленная в мае 41 года из варшавского гетто в Смоленск моему прадеду его матерью и сестрой».

«Путешествие с открыткой»: прогулка по главной купеческой улице Нижнего Новгорода

Сегодня «Путешествие с открыткой» проходит на главной купеческой улице Нижнего Новгорода — улице Рождественской. Нижний Новгород более ста лет назад — это крупнейший торговый центр Российской импери. Здесь ежегодно проводилась знаменитая Нижегородская ярмарка, собиравшая купцов со всей России и из-за рубежа. В советское время Рождественская улица превратилась в «Маяковку», но в 90-е годы вернула прежнее название, сохранив в нетронутом виде практически всю дореволюционную застройку.

«Путешествие с открыткой» от «Пишу тебе»: паровая мельница на берегу Оки

На этой почтовой открытке изображена известная в Нижнем Новгороде мельница купца Башкирова и пристань на р. Оке рядом с ней. Более ста лет назад здесь активно развивался мукомольный промысел, а сегодня место вновь приобретает значимость из-за реновации. Начинаем «Путешествие с открыткой» на набережной р. Оки в Нижнем Новгороде.

Собери их всех: как record linkage помогает обогащать большие биографические данные

Сейчас историки всё чаще уделяют внимание не столько выдающимся деятелям прошлого, сколько целым группам людей, жившим в ту или иную эпоху. Это неудивительно — ведь с появлением больших исторических баз данных стало проще анализировать множество биографий одновременно. Автоматизировать обработку данных об одних и тех же людях в разных базах помогает сопоставление данных, или record linkage.

С приветом из Англии: у мультиязычных языковых моделей обнаружился «английский акцент» 

Если вы выучили иностранный язык во взрослом возрасте, вполне вероятно, вы говорите на нем не так же бегло, как носитель языка. Оказывается, подобная проблема встречается и у мультиязычных моделей: если в обучающей выборке для них преобладает английский, текст на других языках они будут генерировать «с английским акцентом». Объясняем, почему так происходит и что можно с этим сделать.

Еврейская культура в музеях РФ и США: в чем разница и как ее объяснить

Музейные коллекции пополняются очень разными способами: в разное время туда попадали и военные трофеи, и частные покупки коллекционеров. Ну а сами музеи существуют не в вакууме, и конечно на отбор экспонатов влияет политика, идеология, государственное и общественное устройство. Разбираемся в том, каким искажениям подвержены цифровые музейные коллекции, на примере еврейской культуры.

Как писатели XIX века предсказали мессенджеры, интернет на Марсе и нейросети

Научная фантастика в русской литературе имеет давнюю историю. Писатели XIX и первой половины XX века предсказали многое: от телевидения до космических полетов. А насколько хорошо они предвидели современные информационные технологии? Удивительно, но современники Пушкина и Толстого смогли предсказать мессенджеры, генеративные нейросети, 3D-кино и что-то вроде интернета на Марсе.

Виртуальные кладбища: от кладбищ геймеров до кладбищ домашних животных

Разбираемся, какие есть виды виртуальных кладбищ и почему некоторые виды приобретают отклоняющиеся формы.

«Персоналистские диктатуры чаще начинают войны»: Эрика Франц об автократиях, Украине и поводах для оптимизма

Системный Блокъ поговорил с политологом Эрикой Франц о недемократических режимах, диктаторах и возможностях перехода к демократии. Спойлер: наши шансы на демократический транзит невысоки, но они есть.

Что такое генеральная совокупность и выборка?

Наша жизнь полна разных событий, и иногда на их основе нам хочется сделать какой-то определенный вывод или отыскать закономерность в происходящем. Всем известная фраза «Все мужики козлы» — один из таких случаев. У человека, который говорит эту фразу, скорее всего, имеется неудачный опыт общения с определенной группой лиц мужского пола (в статистике это называют экспериментами), и на основе этого неудачного опыта был сделан такой вывод. Почему это утверждение в корне неверное с точки зрения статистики? Когда можно делать выводы, основываясь на неполных данных, а когда нет? В этой статье постараемся ответить на эти вопросы.

Цифровое и классическое искусство: точки соприкосновения

Что общего у нейросети и Рафаэля? Разбираемся, почему цифровое и классическое искусство не так далеки друг от друга, как мы привыкли думать.

Спасая наследие: как активисты сохраняют культуру Украины

Культурное наследие — еще одна жертва военного конфликта. Уничтожение культуры разрушает историю народа. Активисты проекта по спасению культурного наследия Украины SUCHO продолжают сохранять историю и культуру украинского народа, перенося уникальные данные в цифру.

«Говорить о войне небесполезно»: Динара Гагарина о Digital Humanities в России после 24 февраля

Динара Гагарина — основательница магистратуры по цифровым методам в гуманитарных науках в Пермском филиале НИУ ВШЭ, а также один из главных популяризаторов Digital Humanities в России. В октябре из-за антивоенных постов Динару Гагарину отстранили от руководства магистратурой, а саму магистратуру попытались закрыть. В этом интервью мы обсудили с Динарой, как ей удалось отстоять магистратуру, удастся ли властям милитаризация образования и что будет с Digital Humanities в России после 24 февраля 2022.

Что говорит о персонажах «Войны и мира» их речь

Из уроков литературы мы помним долгие обсуждения монологов героев в «Войне и мире» Льва Толстого. Но что, если взглянуть на прямую речь персонажей под другим углом? Рассказываем, как цифровые методы анализа прямой речи персонажей помогают узнать, кто из героев ближе всех к светскому обществу, у кого самая «живая» и самая «сухая» речь, и в чем драматическое различие между речью Наташи Ростовой и Андрея Болконского.

«Пузырь фильтров» знает о вас всё: что это такое и как он формирует медиапотребление

За последние месяцы русскоязычная аудитория СМИ и соцсетей резко поделилась на два лагеря ― на тех, кто поддерживает СВО и тех, кто выступает против. Люди получают и воспроизводят совершенно разную информацию о боевых действиях в Украине. Одна из причин ― «пузырь фильтров» . Рассказываем, что такое эффект пузыря и как его можно «проткнуть»

Юдифь vs Саломея: какой библейский сюжет всему голова?

Две библейские героини — неприступная Юдифь и обольстительница Саломея — очень непохожи друг на друга. Но в истории каждой из них фигурирует голова погубленного мужчины. Поэтому в живописи их изображали удивительно похоже. C помощью викиданных мы выяснили, какая из двух героинь пользуется большей популярностью, и попытались понять почему.

Капитализм слежки: как нас продают корпорациям, государству и хакерам

Нам говорят: «Мы используем файлы cookies для вашего удобства» — но просил ли я об этом удобстве? Мы ставим галочку «Я согласен на обработку персональных данных» — а если не согласен? Нас уверяют: «Мы не продаем персональные данные третьим лицам» — а как проверить? Разбираемся, почему в Интернете нас везде просят на что-то согласиться и что на самом деле за этим стоит.

Шизофрения, эпилепсия, сломанные руки: что гуглили россияне после объявления мобилизации в России

Как сломать руку, каковы симптомы психических болезней, есть ли списки мобилизованных… «Системный Блокъ» продолжает изучать, что искали россияне в поисковиках после объявления частичной мобилизации.

Эволюция приемов в кино: фильмы с нарушенной хронологией

Людьми часто движет любопытство. Мы хотим узнать, чем кончится история, были ли мы правы, что же автор всё-таки имел в виду, и так далее. Поэтому мы ходим на квесты, участвуем в викторинах и… смотрим фильмы, где ничего не понятно, но всё очень интересно. А некоторым учёным интересно, почему это интересно нам — об этом и будет наша статья.

Что такое векторные представления слов?

Если спросить, какое слово ближе к слову «король»: «правитель» или «рабочий», почти все ответят, что «правитель», конечно же, ближе. Это кажется очевидным почти всякому человеку, но как можно объяснить это компьютеру? Сегодня это легко решается представлением значений слов с помощью векторов. Векторные представления слов позволяют хранить семантику слов в понятном для компьютера виде.

Что такое гражданская наука и как участвовать в контроле воздуха

Можно ли принимать участие в экологических проектах, не будучи экологом? Можно! Ведь существует гражданская наука. Рассказываем, как каждый из нас может внести вклад в мониторинг чистоты воздуха.

Chekhov Digital: как Чехов писал письма жене и куда течет время в его текстах

Знали ли вы, что слово «время» в произведениях А. П. Чехова имеет определенные схемы употребления, повторяющиеся от тома к тому? Могли ли подумать о том, что письма к любимой супруге Ольге Леонардовне драматург писал как к чужому человеку? Как связаны стили Чехова-писателя и Чехова-личности? Ответы на эти вопросы читайте в продолжении статьи о семантическом издании Chekhov Digital.

Что такое морфологический анализ

Слово «морфологический» может быть знакомо вам с уроков русского языка в школе — иногда там дают задания на морфологический разбор слов. В них нужно выписать слово и его часть речи, а также различные грамматические характеристики: род, число, падеж у существительного, спряжение, вид, время у глагола, разряд у местоимения. Такой разбор является одним из этапов компьютерной обработки текста, и современные методы позволяют делать его автоматически.

Цифровой Чехов: как устроено семантическое издание и где искать 4500 писем Чехова

Каждый филолог желает знать, что такое семантическое издание. В этой статье мы расскажем вам об одном из них. В нем можно исследовать социальные сети Чехова и посмотреть, кого писатель упоминал в своей обширной переписке.

Мобилизация после репрессий. Как Большой террор повлиял на участников ВОВ

Даже если государственный террор не воздействует на человека напрямую, он влияет на формирование его представлений о государстве и отношение к нему. Нашел ли Большой террор отражение в действиях солдат на фронтах Великой Отечественной? Ответ поможет найти анализ данных. Спойлер: статистика показывает, что солдаты из «более репрессивных» регионов чаще подвергались уголовному преследованию в годы войны и реже сдавались в плен. В исследовании использованы данные «Международного Мемориала», получившего 7 октября 2022 года Нобелевскую премию мира.

Большие языковые модели умеют рассуждать

Модель психики «Думай медленно… решай быстро» оказалась верна не только для людей, но и для больших нейросетей. Вслед за интуитивными навыками они приобретают и аналитические. Рассказываем, как языковые модели решают математические и логические задачи, если немного «подумают».

Куда бежать, если больше нельзя в Россию: к 100-летию «философского парохода»

29 сентября 2022 года исполняется сто лет «философскому пароходу» — массовой высылке большевиками интеллигенции, не принявшей революцию. Сегодня годовщина выглядит актуально как никогда: из России уже полгода вылетают «философские самолеты», а в последние дни на границах РФ можно встретить и «философский самокат». Размышляя о судьбах страны, мы решили вспомнить, как сложились пути эмигрантов сто лет назад, наложив их жизненные траектории на электронную карту.

Что такое дерево решений

Поговорим о деревьях решений – простом и популярном методе машинного обучения.

Статистика империи инков: студент дешифровал узлы кипу — ими вели перепись населения

Студент Гарварда сравнил документ переписи населения Испании и шесть шнурков кипу. Благодаря этому своеобразную письменность империи инков, состоящую из сплетений и узлов, можно прочитать. Рассказываем, как студент совершил открытие во время весенних каникул.

«Отмена русской культуры»: что показывает статистика цифровых следов?

С февраля 2022 года в новостях и разговорах можно услышать про «отмену русской культуры» в рамках «культуры отмены». Что это такое, можно ли отменить культуру и как любопытство пользователей интернета может помочь в этом разобраться? «Системный Блокъ» посчитал упоминания в СМИ и проанализировал поисковые запросы.

Что такое глубинное обучение?

Как связаны глубинное обучение и машинное обучение? На что влияет «глубина» нейронной сети? Рассказываем о важнейшей области машинного обучения.

«Город без данных — город-призрак»: Алексей Новиков о том, как Big Data меняет представление о планировке и застройке

Алексей Новиков — кандидат географических наук, глава и соучредитель компании Habidatum, специализирующейся на аналитике городских данных. «Системный Блокъ» поговорил с ним о том, что такое «цифровой двойник» города, чем советские города похожи на SimCity, и какие возможности открываются в градостроительстве благодаря большим данным.

Камера на сотню: как развивается видеонаблюдение в Москве

Москва входит в топ-30 городов по покрытию камерами. Цифровизация наблюдения уменьшает риск преступности, но при этом и помогает государству выследить любого гражданина.

Что такое кластеризация?

Разберём, что такое кластеризация, поговорим об известных ее методах и расскажем, зачем она используется в реальных задачах

Бёрдвотчинг: что это за птица такая?

Лето почти закончилось, а вы все еще не отличаете сатанинского козодоя от башенного стрижа? А может, вам хотелось стать орнитологом, когда вырастете? Системный Блокъ рассказывает, как, вооружившись мобильными приложениями, с пользой провести выходные.

Терабайты пропаганды: где лежит телеархив 2022 года

Специалисты по веб-архивации собрали более 46 тысяч телепередач в одном проекте для исследования медиаобраза «спецоперации»