Фото автора

Евгения Родикова

Художник

Увлекаюсь живописью, иллюстрацией, дизайном одежды. Люблю котиков

Иллюстратор статей

«Фабрика публикаций»: стать ученым за деньги

Социологи обнаружили в сети организацию, в которой можно купить соавторство в научной статье. Более 400 материалов с купленным авторством были опубликованы в крупнейших журналах

Нейросеть и человек написали книгу

Команда проекта полгода обучала нейросеть ruGPT-3 на рассказах писателя Павла Пепперштейна, чтобы добиться наиболее «естественного» языка

Что такое линейная регрессия?

Рассказываем об одной из классических моделей машинного обучения – линейной регрессии

Google AI Research представила новую языковую модель PaLM

Новая модель содержит 540 миллиардов параметров, за счет чего способна объяснять шутки и угадывать фильмы по эмодзи.

Цифровой коллекции открыток «Пишу тебе» — 1 год!

Рассказываем, что нам удалось собрать за этот год

Что такое мешок слов

Рассказываем, что такое мешок слов и как он может помочь в задачах автоматической обработки текста

Куда едут украинские беженцы: изучаем данные

Более 7 миллионов человек покинули Украину за три месяца боевых действий. Смотрим на данные самого масштабного миграционного кризиса с середины XX века

Нейросети помогают историкам восстановить древние тексты

Модель Ithaca позволила повысить точность реставрационных работ почти в три раза: с 25% до 72%

Двойной учет: как Минюст ведет списки иностранных агентов

Моргенштерн, Юрий Дудь, Екатерина Шульман, Face, Алексей Венедиктов…. Каждую неделю мы слышим о пополнении реестра «иноагентов» новыми именами. Но как устроен этот реестр и для чего в нем целых четыре списка? Мы подготовили для вас разбор системы учета «иноагентов» с понятной инфографикой.

Запрещенные в России социальные сети

Instagram и Facebook* этой весной стали запрещенными, YouTube все чаще грозятся закрыть, а Минцифры составило список отечественных аналогов Zoom и Twitter. Мы спросили экспертов Роскомсвободы, стоит ли нам ждать полностью суверенного Рунета, и разбираемся, что вообще произошло с социальными сетями и интернетом в России этой весной

Данные мобильных телефонов могут помочь живущим за чертой бедности

Ученые натренировали нейросеть определять, кто из пользователей мобильных устройств нуждается в гуманитарной помощи. Такой подход могут использовать правительства и гуманитарные группы при планировании своей социальной политики.

Автор(ы) умер(ли), а проблемы остались

Продолжаем разгадывать вечную тайну «Беовульфа» и рассказывать о том, как цифровые филологи строят научный диалог в поисках правды.

Данные будут закрыты — как и границы с Европой

Российские власти скрыли данные о закупках компаний, попавших под западные санкции. «Системный Блокъ» поговорил с экспертом в области данных Иваном Бегтиным о том, как это влияет на всех нас и почему открытость данных — неотъемлемое право каждого человека и гражданина.

«Заговори, чтобы я тебя увидел»: эволюция диалога в русской литературе XIX века

Литература как любая сложная система развивается и эволюционирует. Какие-то произведения остаются в центре внимания читателей на десятки и даже сотни лет, другие забываются сразу после издания. Так работает «литературная эволюция», модель которой начинал разрабатывать русский филолог Юрий Тынянов (подробнее об этом — в нашем прошлом материале). Применима ли эта концепция к отдельным частям произведения — например, к диалогу? Исследователи пытаются дать ответ на этот вопрос.

«У нас в культуре надо не думать, а надо прыгать»: интервью с психологом Марией Фаликман

Мария Фаликман — доктор психологических наук, профессор департамента психологии факультета социальных наук НИУ ВШЭ, специалист в области когнитивной науки. «Системный Блокъ» расспросил Марию о том, чем занимаются когнитивные исследователи, как связаны когнитивная наука и искусственный интеллект, а также почему воспоминания со временем искажаются.

Reverso Context — сервис для перевода слов с примерами использования в контексте

Reverso Context — сайт, разработанный с целью улучшения качества работы с переводом с различных языков, в том числе и с русского. Рассказываем, как работает переводчик, которым пользуется даже Департамент культуры Франции.

Был ли геноцид: статистика гибели жителей Донбасса в 2014-2021 годах

Российские власти говорят о «8 годах геноцида» на Донбассе. Именно этим объяснял необходимость «спецоперации» против Украины президент РФ. Но что говорит статистика? Был ли там геноцид? Мы изучили данные из официальных источников Донецкой народной республики и визуализировали жертвы среди ее военных и ее мирных жителей.

Транспортное освоение России: как увидеть жизнь за пределами основной полосы расселения?

Обосновано ли разделение России на «освоенную» и «неосвоенную» части? Карты плотности автодорог, железнодорожного полотна и аэропортов доказывают обратное.

Нетворкинг Пикассо и Уорхола: сетевой анализ выставок в МоМА

Нью-йоркский музей МоМА — один из старейших музеев современного искусства в мире. В MoMA хранятся работы Рене Магритта и Энди Уорхола, Джексона Поллока и Марко Ротко, Марка Шагала и Казимира Малевича, Сальвадора Дали и Пабло Пикассо. А еще там постоянно проходят выставки — их было так много, что это можно изучить цифровыми методами.

Мозг меланхолика: видно ли темперамент на ЭЭГ

Мы часто слышим фразы вроде «Он не проявляет никакого интереса. Это все потому, что он флегматик!» или «У нее все время печальный вид, может быть, она меланхолик?». Но ведь эти слова придумали еще древние греки. А что говорит про темпераменты современная наука, вооруженная ЭЭГ, МРТ и прочими объективными методами познания мозга? Разбираемся, почему именно так делят людей и насколько научно это разделение.

Что такое дальнее чтение?

Франко Моретти пишет: «Мы умеем читать тексты, теперь нужно научиться не читать их». Возможно ли исследование литературы без детального чтения текстов? Возможно. При помощи дальнего чтения и инструментария digital humanities.

Цифровой культурный колониализм в Google Arts&Culture

Пандемии, кризисы и войны бьют не только по людям, но и по культуре. Многие музеи оказываются недоступны, а то и вовсе лишаются своих фондов. В феврале 2011 года Google запустил агрегатор изображений произведений искусства в высоком качестве — Google Art Project (GA&C) с целью сделать культуру более доступной и сохранить ее в цифровой форме. Но во всём ли многообразии культура доступна в GA&C, или там есть подвохи?

Неизвестное будущее: как не сойти с ума в условиях неопределенности

Еще месяц назад мы с уверенностью смотрели в будущее, почти привыкнув к «новой нормальности» в мире с пандемией. Но оказалось, что впереди нас ждали внезапные события, имеющие колоссальные последствия для всех. Как в условиях неопределенности сохранить способность мыслить? Как поддерживать себя и близких? Как реагировать на острые ситуации? И что делать с планами, которые рассыпались за секунды? «Системный Блокъ» попросил психологов ответить на вопросы, которые волнуют нас сегодня.

Что такое онтология

Изучением всего сущего и категоризацией понятий и объектов занимается не только философия, но и компьютерная наука. Как это может помочь оптимизировать работу поиска, предостеречь от кибератак и построить графы знаний? В новой статье глоссария рассказываем об онтологии – формате хранения структурированных данных – и объясняем, зачем ее создавать и где применить.

Как сделать тематическое моделирование

Рассказываем, как сделать тематическое моделирование для большого объема текста, предположить его содержание и разделить по темам

Knowledge Graph или граф знаний: что это такое и где применяется

Порой поисковик понимает нас лучше, чем мы сами. Например, по запросу «фильм, в котором был грунт» он ответит верно и выдаст «Стражей галактики». Это возможно благодаря Knowledge Graph – семантической сети, которая умеет выявлять взаимосвязи между разными объектами. В новой статье глоссария рассказываем, что такое граф знаний, как он устроен и чем помогает поисковикам.

Культура в цифровом сите: что остается за кадром

Инна Кижнер — старший преподаватель кафедры информационных технологий в креативных и культурных индустриях, научный сотрудник лаборатории «Digital Humanities» Сибирского федерального университета. В интервью «Системному Блоку» она рассказала, каким искажениям подвержены цифровые коллекции музеев, какие культурные явления можно исследовать благодаря оцифровке и как должна выглядеть идеальная цифровая коллекция.

Обратный тест Тьюринга

Тест Тьюринга придумали в середине 20 века, чтобы измерить интеллект машин и проверить, насколько он схож с человеческим. Сегодня мы все еще используем этот тест, но чаще с обратной целью: теперь компьютер проверяет наш интеллект. Рассказываем про обратный тест Тьюринга, популярные капчи и объясняем, зачем нам все это нужно

Как работают диалоговые системы и чем они отличаются

Алиса Яндекса, Олег Тинькофф-банка и телеграм-бот для демотиваторов — одно и то же? Или нет? Разбираемся, как работают диалоговые системы и почему одни могут рассказать анекдот и поддержать диалог о жизни, а другие — сводить в кино и заказать пиццу.

Выдающиеся «писатели» Госдумы: изучаем KPI депутатов с помощью Python

Разбираемся, как законотворческая деятельность депутатов сказывается на их внутрипартийном рейтинге. Может ли «активный» депутат рассчитывать на попадание в следующий созыв Государственной Думы РФ?

Как плести виртуальные сети с помощью Gephi

Gephi — самый известный инструмент для визуализации графов и сетевого анализа. С его помощью можно исследовать и население Викторианской Англии, и отношения героев «Войны и мира», и странички друзей Вконтакте. Рассказываем максимально просто, как пользоваться Gephi

Непарадоксальные парадоксы канона. «Дальнее чтение» Франко Моретти

В необычном для «Системного блока» формате book review рассказываем о книге Франко Моретти «Дальнее чтение» и разбираемся, почему в «Гамлете» погибают только персонажи, связанные с Гамлетом и Клавдием, а литература Парижа и Буэнос-Айреса в XIX в. имеет больше общего, чем литература Парижа и французских провинций

«Мы заставили нейронную сеть креативить»: как алгоритмы моделируют химические реакции

Учёные придумали систему, которая поможет в поиске синтеза новых лекарств. В разработке участвовали исследователи из университетов Страсбурга, Казани и Хоккайдо. Один из руководителей проекта, Тимур Маджидов из Казанского федерального университета, подробно рассказал об истории и работе нейросети и будущем химии

Нейросеть не потечет: можно ли накраситься цифровым макияжем

Маски в Инстаграме и ТикТоке способны изменить лицо до неузнаваемости или вообще превратить его в зайчика/оленя/волдеморта. Создание таких масок не обходится без нейросетей и играет в цифровом мире в основном развлекательную роль. Но что если те же технологии можно применить в образовательных целях?

Как Джордж Вашингтон стал эмо: Google N-grams в ТикТок трендах

Если вы были в ТикТок, то знаете, что тренд там можно сделать из чего угодно. Пару месяцев назад сотни тысяч просмотров начали набирать записи экрана с сайта Google Books Ngram Viewer, показывающем популярность слова в определенный период времени. Пользователи находят слово «эмо» в 1803 году или упоминание «Звёздных войн» — в 1696

Современный урок математики в цифровую эпоху

Всеобщая цифровизация повлияла и на школьные уроки математики. Интерактивная доска Miro, программа для визуализации графов Gephi и другие цифровые инструменты помогают разобраться с абстрактными понятиями и побороть математическую тревожность

«Впереди сущий сахарный голод»: что говорит о дневниках 1917 года анализ данных

Революция 1917 года — одно из крупнейших потрясений в российской истории. О чем думал Николай II в день отречения? Что волновало простых граждан? Какие темы поднимали в газетах? Мы проанализировали дневники очевидцев, которые собрал проект «1917. Свободная история», и выяснили, о чем в революцию писали чаще всего

Русские классики – сексисты или все-таки нет? Корпусный анализ текста Пушкина

В октябре «Системный блокъ» опубликовал корпусное исследование русской классики, в котором были проанализированы произведения школьной программы. Тогда в анализ текста Пушкина вошли «Евгений Онегин» и «Руслан и Людмила». Внимательные читатели заметили, что исследователи упустили не менее важные произведения классика – «Повести покойного Ивана Петровича Белкина» и «Капитанскую дочку», которые также входят в школьную программу. Мы посчитали такие замечания справедливыми и решили провести дополнительный анализ

Идеальная формула депрессивной песни на примере Radiohead

В наше время компьютер может работать практически с чем угодно, в том числе и с музыкой: существует множество методов как преобразовать её в формат, понятный компьютеру, так и проанализировать полученные данные по разным параметрам. В анализе песни текст не менее важен, чем мелодия. В этом материале мы расскажем, как с помощью цифровых методов можно измерить депрессивность вашей любимой песни.

Рекомендательные системы плохо работают для музыки андеграунд

Если вы слушаете не мейнстрим, скорее всего, стриминги подбирают вам музыку не очень удачно

Китайский ИИ на страже порядка: автоматизация цензуры

Об искусственном интеллекте часто говорят как о технологии, которая поведет мир в светлое демократическое будущее, но далеко не всегда она используется в демократических целях. Разбираемся, как в Китае ИИ служит цензуре.

Тайна стихов декабриста Батенькова: стилометрия на страже истины

Стилометрия — метод анализа текста, который сейчас проводится с помощью компьютеров и сложных вычислений. Благодаря современной стилометрии можно изучить не только стиль произведения, но и установить авторство текста. «Системный Блокъ» рассказывает об одном из самых крупных стилометрических расследований — о загадке стихов декабриста Батенькова.

«Шуточная попытка похищения пирожка»

Исследователи оцифровали похороны, объятия и выпас скота

Айтрекинг и сканпафы: как движения глаз выдают неуверенного читателя

Движения глаз при чтении исследуется еще с шестидесятых годов двадцатого века. Однако лишь недавно исследователи из Центра языка и мозга Высшей школы экономики и Городского университета Нью-Йорка перешли от описания локальных параметров движений глаз при чтении отдельных слов в предложении к описанию глобального рисунка чтения целых предложений в разных русскоязычных группах. Помог им в этом новый метод анализа.

«Системный Блокъ»: лучшее за 2021 год

По традиции 31 декабря «Системный Блокъ» публикует подборку лучших материалов уходящего года. В 2021-м в подборке оказались спецпроект в духе «Намедни» к 30-летию крушения СССР, дата-исследование зарплат учителей в России, выпуск подкаста о том, как врет искусственный интеллект, тесты о средневековых студентах и о цифровых гуманитариях и видео о людях, из которых состоит сам «Системный Блокъ». С новым годом!

Программа для поиска рифмы: как она работает и когда ломается

В 2018 году был разработан метод автоматической разметки рифм. В 2021 его автор представил RhymeTagger — общедоступную библиотеку на Python , которая позволяет вам анализировать рифмовку стихотворения. Рассказываем, как работает инструмент, и тестируем его на лесенках от Маяковского

Госдума разогнала бешеный принтер

Независимые исследователи и аналитики ОВД-Инфо* измерили скорость принятия законов депутатами разных созывов. *Внесен в реестр СМИ-иноагентов

Как автоматизация труда и гендерные стереотипы повлияют на ваш успех (особенно если вы женщина)

Замена работников роботами вполне реальна в век автоматизации. Квалификацию можно подтянуть самостоятельно и до прихода робота на твое рабочее место, а вот решить проблему гендерной дискриминации на рынке труда гораздо сложнее. Разбираемся, какие гендерные стереотипы встречаются в рабочей среде и как на них влияет автоматизация

Знаете ли вы, как информационные технологии повлияли на общественно-политические процессы?

Реформы, перевороты, вооружённые конфликты, распад СССР… Все это происходило параллельно с развитием интернета и становлением массовой IT-индустрии. Как информационные технологии изменили общество после крушения Советского Союза? Пройдите тест и узнайте, насколько точно вы помните события, сформировавшие лик современности.

Музейные технологии и роботы в искусстве: рассказываем про Art & Science

Видели когда-нибудь музыкальный синтезатор, сделанный из живых нервных клеток? А старые лампы, которые общаются на языке Достоевского? Рассказываем о технологиях в современных музеях — и это уже давно не только интерактивные экраны

Насколько хорошо вы знаете историю цифрового литературоведения?

Методы, которыми пользуются цифровые филологи, изобретены совсем недавно. Или так только кажется? Предлагаем вам пройти тест и узнать побольше об истории цифровой филологии и некоторых ее методах.

Джон Донн уснул: Кем были англиканские священники в XVI-XIX вв.?

Возникшая в период Реформации англиканская церковь была и остаётся сложной и разветвлённой организацией. Разобраться во всём многообразии священнослужителей, их перемещениях и особенностях церкви изнутри было нереально, пока не была создана база данных. Разбираемся, как она устроена

Отмороженный искусственный интеллект: зима (не) близко

Многие представляют себе искусственный интеллект по фантастике. Альтрон из «Железного человека», ВИКИ Азимова, «Мир Дикого запада» и «Апгрейд» — все это выглядит, как торжество развития технологии, способной и улучшить жизнь человечества, и положить ему конец. Правда, реальный искусственный интеллект пока далек от того, что показывают нам в фильмах и книгах. Но это не повод расстраиваться — ведь в истории ИИ были и куда более тёмные времена

Алгоритмы и дискриминация на рынке труда. Чему мы научили искусственный интеллект?

В 2014 году Amazon разработал технологию с ИИ, которая присваивала рейтинг каждому отклику на вакансии. Вскоре обнаружилось, что при этом робот занижал баллы женщинам. Выясняем, как часто происходит такая дискриминация, и что можно с этим сделать

общение в интернете

«Интернет-среда влияет на политическую активность»: интервью с Ольгой Гулевич

Системный Блокъ поговорил с психологом Ольгой Гулевич, профессором департамента психологии НИУ ВШЭ о том, как психологи изучают поведение в цифровой среде, чем кибербуллинг отличается от обычного буллинга, существует ли интернет-зависимость и как интернет влияет на политические настроения.

Как робот-художник пишет портреты и пугает таможенников

Человекоподобный робот AI-Da пишет абстрактные картины, распознает лица для создания портретов людей, восхищается Пикассо и цитирует Оруэлла. Разбираемся, как она появилась и почему у нее недавно прошла собственная выставка в Лондоне

Как создать цифровой проект по публичной истории: опыт «Истории немцев ХМАО»

Участница НКО «Немецкая национально-культурная автономия города Ханты-Мансийска» Юлия Папанова рассказывает о цифровом проекте «История немцев ХМАО»: от замысла и сбора материалов до поиска финансирования и претворения в жизнь.

Искусствовед в кармане, двойники на картинах и Интерпол

О том, как приложения для распознавания картин помогают больше узнать о произведениях искусства, найти похожих на вас героев с полотен и отыскать похищенные произведения, читайте в новом материале СБъ

ИИ вокруг нас: от работы в кадре до работы с кадром

Возможности искусственного интеллекта в медиа часто переоцениваются или недооцениваются: иногда кажется, что завтра мир ждет восстание машин, а иногда — что он до сих пор не вышел из цифрового каменного века. Разбираемся, как ИИ используется в медиа уже сегодня

Скажи «да» по-русски: зачем нужен «Прагматикон»

Многие говорят, что эффективный способ выучить иностранный язык – смотреть сериалы на этом языке. Если вы тоже пробовали такой метод, то наверняка обращали внимание, как какой-нибудь герой из сериала Netflix вместо простых «нет» или «да» произносит не всем знакомые выражения типа no way или you bet. Что это такое и почему об этом почти не говорили на уроках в школе? Рассказываем о дискурсивных формулах и новом цифровом ресурсе для их изучения в русском языке, а также поиска аналогов в английском