анализ

В школьных учебниках пересчитали березки и программистов

В Институте имени Пушкина создали технологию лингвистической оценки учебников. С ее помощью тексты цифрового Яндекс.Учебника сравнили с другими школьными пособиями по русскому языку. Выяснилось, что в цифровом учебнике меньше агрономов и березок, зато больше программистов и бабушек. Но есть и более глубокие отличия

Как компьютеры читают комиксы?

Мы привыкли воспринимать комиксы как цветные или черно-белые картинки с текстом, которые складываются в историю. Однако это сложно организованный текст, потребление которого требует от нас и визуального, и текстового восприятия. Несмотря на сложность, сегодня комиксы исследуют автоматически при помощи компьютерного зрения. Рассказываем, как это работает

Джеймс против Джойса: вычислима ли сложность художественной литературы

Измерение сложности текста — задача для компьютерной лингвистики не новая, и в этой области многое уже придумано. Но применимо ли это для художественной литературы? Разбираемся на примере произведений американского писателя Генри Джеймса

Книги про питание: проверка на обман

Многие люди обращаются за консультациями по питанию к книгам по нутрицевтике. Это не признанная официальной наукой область на стыке фармацевтики и науки о питании. В основном нутрицевтику интересуют биологически активные добавки. Насколько научно обоснованы такие книги и кто их пишет — ученые или шарлатаны? Разбираемся с помощью методов дальнего чтения и анализа метаданных

Эволюция литературы: может ли Дарвин объяснить Конан Дойла и футуризм

В отличие от биологии, в филологии нет общепринятой теории эволюции литературы. Никто до конца не понимает, почему одни книги оказываются в центре внимания и входят в канон, другие остаются неизвестными, а третьи переживают период славы, но быстро забываются. Но были (и есть) те, кто пытается адаптировать теорию эволюции к анализу словесности. Рассказываем о двух подходах к объяснению эволюции литературы, один из которых придумали русские филологи еще в начале XX века

Data Science против фейков: как алгоритм отделяет выдуманные новости от правды

Фейковые новости – острая проблема информационного общества. Они быстро распространяются через социальные сети, мессенджеры и СМИ, вводя людей в заблуждение. Это может привести к массовой дезинформации, манипуляциям и общественным кризисам

С миру по нитке - фельдшеру зарплата: финансирование здравоохранения в Москве в начале XX века

Врач — профессия, отношение к которым колеблется от тотальной демонизации до безусловного обожествления, однако за этическими и нравственными вопросами жизни медиков стоят вполне материальные трудности — какой будет зарплата? Какой — нагрузка? Как обустроить больницу где-нибудь в глубинке? Это вопросы не сильно меняются от века к веку — и вот как они решались сто лет назад

«Если бы по Евангелию жили бездумные роботы, они были бы одноглазые, однорукие и одноногие»

Как сочетаются компьютерные технологии и Церковь? Зачем настоятелю монастыря алгоритм дистрибутивной семантики word2vec? Исследовать церковные тексты количественными методами — это вообще нормально? Системный Блокъ поговорил об этом с настоятелем Свято-Троицкого Данилова монастыря игуменом Пантелеимоном

Технологии будущего в «Черном зеркале»

Сериал «Черное зеркало» выходил с 2011 года, но популярность пришла к нему только в 2016, когда права на творение Чарли Брукера выкупил Netflix. За восемь лет существования сериала его не раз обвиняли в технофобии и распространении истерии в отношении технологий. Некоторые разработки, показанные в сериале — это вымысел авторов, но многие уже имеют прототипы в реальном мире

И целого мира мало. Как отследить мировую историю через анализ и визуализацию данных?

Диаграммы, графики, интерактивные карты по истории — визуализация стала неотъемлемой частью любой науки. Посмотрим на историю международных конгрессов XIX-XX веков через призму наглядной визуализации

Как измеряют эффект Вертера

Но не тот, о котором вы подумали. Мы расскажем не о последствиях трагической любви, которые заставляют молодых людей с разбитым сердцем сводить счеты с жизнью, а о том, как «Страдания юного Вертера» перекликаются с окружающими его текстами

Цифровое окно в природу

Миллионы людей по всему миру помогают науке, собирая фотографии живых организмов и пополняя гигантскую базу iNaturalist. Из-за пандемии снимать стало сложнее, но помочь науке все равно можно. Рассказываем, как это сделать

«Мы сделаем вас счастливыми». Искусственный интеллект ответит, как на нас влияет музыка.

Машины помогут определить какие особенности музыкального трека влияют на физическую активность человека и его эмоции

Стали ли современные поп-песни грустнее за последние 50 лет?

Поп-музыка — практически неограниченное пространство для исследователя. Можно попробовать изучать ее инструментами социологии, теории музыки, культурологии и еще десятка дисциплин, но самый простой способ — проверить, как меняются тексты в самом распространенном музыкальном стиле последнего столетия

«Прямо как в Plague Inc.» Что объединяет игры и фильмы про эпидемии

Какие общие тропы можно найти в Plague Inc., Pandemic и Left 4 Dead? Проводим сетевой анализ печально актуальной игры, в которой человечество уничтожает смертельная болезнь, при помощи базы данных Neo4j и сайта TVtropes, а также сравниваем ее с аналогами

Невидимые кинозвезды: как Голливуд не замечает женщин-режиссеров

В 2010 году «Оскар» за лучшую режиссуру впервые получила женщина — Кэтрин Бигелоу с фильмом «Повелитель бури». Стали ли после этого режиссеры женского пола более заметными фигурами в киноиндустрии? Редакция «Системного Блока» провела исследование, проследив динамику упоминаний женщин-режиссеров в статьях популярных киножурналов

Код «Мастера и Маргариты»

Как устроен шедевр Булгакова: анализируем роман «Мастер и Маргарита» с помощью методов цифрового литературоведения