По традиции 31 декабря «Системный Блокъ» публикует подборку лучших материалов уходящего года. В 2023-м в подборке есть стилометрия Набокова, интервью об исторической информатике, открытка из варшавского гетто, дата-исследование поляризации российских СМИ, предсказание появления ChatGPT от современника Пушкина… С Новым годом!
В 2023 «Системный Блокъ» выпустил девять интервью (рекорд издания), но в итогах года выделим разговор с Леонидом Бородкиным, заведующим кафедрой исторической информатики МГУ. Дело даже не в том, что это наше первое интервью с членкором РАН. Просто интервью соединяет в себе рассказ о задачах исторической информатики, хронику её становления в нашей стране (с уникальными фото из личных архивов и историческими анекдотами!), а также описание того, как студенты-историки находят нестандартные применения своим цифровым навыкам в жизни.
Первые компьютерные терминалы исторического факультета МГУ. Начало 1980-х годов // Личный архив Л. И. Бородкина
Что будет, если стилометрически сравнить романы Набокова, написанные по-английски, и английские переводы его русскоязычных романов («Дар», «Приглашение на казнь», «Защита Лужина»)? Будет ли у них единый авторский сигнал или они будут выглядеть как два разных автора? И что будет, если перевод выполнял сам Набоков? А если развернуть эксперимент и посмотреть на русские романы Набокова рядом с переводами его англоязычных текстов на русский? Пересказываем остроумное стилометрическое исследование Бориса Орехова о том, как работают авторский и переводческий сигнал в ситуации билингвизма.
В 2023 году вышла первая русскоязычная монография по цифровым гуманитарным исследованиям, сделанная командой из СФУ, МГУ, НИУ ВШЭ и РАНХиГС. Книга рассказывает о компьютерном анализе текста, геоинформационных методах в гуманитарных исследованиях, 3D-моделировании, культуромике, сетевом анализе, базах данных и моделях данных в гуманитарных науках. А еще из неё можно узнать, что учёные называют «чёрной дырой двадцатого века», как и когда девяностые стали «лихими» и всегда ли осмысленно называть данные — данными.
В 2023 году в «Системном Блоке» наконец появилась инструкция по самому популярному и доступному инструменту для стилометрии — пакета stylo. Этот гайд проведёт вас по всему пути от установки языка R до получения визуализации стилометрической близости текстов, с которыми вы работаете. Кстати, эксперимент с Набоковым выше тоже выполнен при помощи пакета stylo.
«Системный Блокъ» вместе с изданием «Подтекст» придумали сюжет для небольшого рассказа и предложили петербургскому писателю Александру Сорге воплотить его в жизнь. То же самое небольшое описание стало запросом для ChatGPT: мы попросили модель сгенерировать рассказ с заданным сюжетом. В результате работа ChatGPT оказалась очень «традиционной» (повествование от третьего лица, строго в прошедшем времени, никаких шагов «влево-вправо» от задания) и на фоне работы писателя — довольно скучной. Но есть и любопытные совпадения человека и машины в типичных деталях.
Наглядная data-демонстрация того, насколько контрастны дискурсы и нарративы «прогосударственных» и «альтернативных» медиа после 24 февраля 2022 года. Через корпусный анализ мы показываем, какие слова и фразы могут вообще не встречаться в одном или другом типе медиа, как в подборе слов проступает редакционная политика, государственные запреты и, по сути, откровенная цензура.
Эта история началась с комментария под постом в одной из соцсетей «Системного Блока», где мы рассказывали о нашем проекте по оцифровке открыток «Пишу тебе». Читатель написал: «У меня есть не очень красивая открытка, отправленная в мае 41 года из варшавского гетто в Смоленск моему прадеду его матерью и сестрой». В итоге мы получили не только открытку, но и целую историю — одну из миллионов трагических историй европейского еврейства. Открытка из варшавского гетто в 1941 году стала последним посланием от большой еврейской семьи. Никто из варшавской части семьи — а это мать, пять дочерей, их дети и их мужья — не пережил Холокост. Для истории остался лишь этот небольшой кусок бумаги, исписанный на польском языке.
Про ОГАС слышали многие, но мы попытались рассказать историю целиком (и показать её в картинках): от ранних рукописных заметок военного инженера-кибернетика Анатолия Китова о «единой … сети вычислительных центров» — через титанические, но безрезультатные усилия Виктора Глушкова — до работ современных историков технологий, где осмысляются причины неудачи «советского интернета».
Если про ОГАС слышали многие, то о том, как современник Пушкина Фаддей Булгарин предсказал появление ChatGPT, знают далеко не все. Герой Булгарина оказывается в будущем и пытается поставить «сочинительную машину» в затруднение, попросив её сгенерировать описание его родного города — но автомат справляется и с этим, подтягивая информацию из «словаря древней географии». Ещё в этом материале есть предсказания мессенджеров, 3D-кинематографа и единой автоматизированной системы сбора статистики, похожей на всё тот же ОГАС, но придуманной в 1908 году писателем-социалистом Александром Богдановым.
В этом году ко дню программиста мы вспоминали в наших карточках женщин-программисток, которые положили начало развитию IT и вычислительной техники. Этим мы хотели бы вдохновить больше девушек и женщин пойти в программирование, несмотря на сохраняющиеся гендерные стереотипы об этой профессии.
За год мы выпустили 15 тестов, и выбрать из них единственный невозможно. Поэтому мы предложим вам целых три теста.
«Лучше пешком», — говорим мы себе летом и выбираем прогулки непривычными маршрутами. А если путь не знаком — поможет приложение-навигатор.…
SpaceX, Anthropic и OpenAI готовятся стать публичными компаниями, Google и Microsoft выпустили новые модели — рассказываем, что произошло в мире…
Японская культура повседневности отличается вниманием к визуальной эстетике, типографике и деталям коммуникации. Поэтому даже самые обычные документы — билеты, рекламные…