ИИ для исследователей: как заниматься наукой по-новому

ИИ для исследователей открывает новые горизонты в работе с данными: от поиска научных публикаций до анализа больших массивов информации. Своим опытом делятся главный редактор «Системного Блока» Даниил Скоринкин, автор «Системного Блока» Анастасия Жук и преподаватель Тимур Хусяинов.

Оглавление

Инструменты

  • Elicit — помогает искать идеи для исследования, выбирать и уточнять тему;
  • Litmaps, Connectedpapers — используются для поиска научных статей;
  • Meetcody.ai, Typeset.io — позволяют создавать базы знаний;
  • Consensus.app, Perplexity.ai — применяются для чтения и анализа научных источников;
  • DeepSeek — оформляет библиографический список;
  • Zotero — помогает собирать, организовывать, аннотировать, цитировать и делиться исследовательскими материалами;
  • Mendeley — является аналогом Zotero, но имеет встроенный поиск статей и рассылки по тематикам.

Задачи

Задача 1. Систематический обзор литературы

Systematic Literature Review (SLR) — выявление и оценка всей релевантной литературы по теме для формирования выводов по рассматриваемому вопросу. Для чего это необходимо? 

  • Демонстрация текущего состояния темы;
  • Идентификация пробелов и направлений для дальнейших исследований по заданному исследовательскому вопросу.

Цель SLR — формализованный методологический подход для уменьшения искажений, вызванных чрезмерно ограничительным отбором доступной литературы, и для повышения надежности отобранной литературы.

Elicit

Может использоваться для поиска идеи исследования, выбора темы и ее уточнения. Получаемые ответы представляют собой реальные статьи, проверенные или сгенерированные языковой моделью.

Что мы можем здесь найти? 

  • Ссылки на работы;
  • DOI;
  • Авторы и исследования (NB! Которые ИИ считает самыми релевантными);
  • Краткий пересказ статей;
  • Можно добавить различные лимитирующие параметры (методология, основные выводы исследования, место исследования, участники, какая статистика использовалась);
  • NB! Research gaps — найти новые темы для исследования!

Для сужения темы можно скопировать заинтересовавшее название в новый блокнот и задать исследовательский вопрос. Также есть возможность добавлять колонки для автоматической идентификации пробелов в исследованиях (gaps) и участников.

Автор: Анастасия Жук

Задача 2. Поиск научных статей

Litmaps

Сервис помогает найти связанные с указанной темой статьи. Поиск возможен по количеству цитирований (top-shared citations) и ссылкам (references). Также доступен поиск по самым цитируемым авторам в выбранной сфере (common authorship patterns).

В платной версии сервис синхронизируется с Zotero. В бесплатной интегрирован поиск по DOI, названию и другим идентификаторам.

Функция Visualize помогает построить графики по работам
Разные типы поиска

Возможно также импортировать статьи вручную.

Connectedpapers

Cервис помогает определить статьи «предшественники» и «преемники». Поиск осуществляется по теме исследования. Также присутствует возможность загрузки: list view — download. Так выглядит демонстрационный датасет:

Автор: Анастасия Жук

Задача 3. Создание базы знаний

Meetcody.ai

Meetcody — чат-бот, которого вы можете натренировать отвечать на вопросы на основе загруженных в него работ. 

Как это сделать? 

  • Загрузите статьи (Knowledge section);
  • Выберите Personality — factual bot;
  • Выберите Handling unanswerable queries — best guess;
  • Попробуйте задать вопросы (e.g. What possible research questions can you suggest? What possible research strategy and methodology can you suggest?)

Создание бота в Meetcody

Обучение созданного бота

Какие вопросы можно задать боту?

  • Пробелы в исследованиях: Какие пробелы в исследовании ты можешь обнаружить, и как я могу это учесть в будущих исследованиях?
  • Методология: Какая методология использовалась в исследовании, какие есть сильные и слабые стороны?
  • Результаты: Какие основные результаты исследования, какие выводы они имеют для образовательной практики или политики?
  • Теория: Какие теоретические основы лежат в основе исследования, и как они влияют на анализ и выводы?
  • Другие факторы: Как социально-экономические и политические факторы влияют на результаты исследования?
  • Сравнительные исследования: Есть ли в исследовании сравнения различных образовательных контекстов или педагогических подходов?
  • Участники: Как исследования учитывают мнения учителей и студентов, и какое влияние это оказывает на результаты?
  • Будущие направления: Какие направления для будущих исследований предлагаются, и какие области требуют дальнейшего изучения?
Примеры вопросов боту

Typeset.io

Typeset.io — “scispace” / «научная база данных» для работы с научной литературой. Задайте вопрос по теме и получите ответ будет на основании топ-5 работ. Вы также можете получить краткое описание других релевантных работ по вашей теме в формате таблицы.

Пример выдачи базы данных в Typeset.io

Также есть возможность работать с определенной работой: upload paper — co-pilot (задавать вопросы по конкретной работе). 

Формулирование вопросов по конкретной работе

Наконец, сервис может объяснять непонятные фрагменты статьи, графики, математические формулы.

Объяснение конкретного фрагмента статьи

Фактически — это комбинация всех рассматриваемых ранее инструментов.

Автор: Анастасия Жук

Задача 4. Чтение и анализ научных работ

Consensus.app

Сервис дает научно обоснованные ответы на заданные вопросы. Поддерживает русский язык.

Рекомендация: сервис лучше всего работает с закрытыми вопросами.

Perplexity.ai

Данный сервис является аналогом Consensus.app, но, в отличие от Consensus, предоставляет результаты в различных сферах, а не только в науке.

В сервисе также есть режим «фокуса», который позволяет настроить определенную фильтрацию. Например, использовать только подтвержденные данные, только данные со ссылками или только научные работы.

Автор: Анастасия Жук

Задача 5. Оформление библиографического списка

Описание задачи

Я обращаюсь к нейросетям для правильного оформления списка литературы (источников).

Промпт

Оформи ссылки по примеру.
Пример: 
1. ADEDZE, Agbenyega, “Commemorating the Chief: The Politics of Postage Stamps in West Africa,” African Arts, 37, 2 (2004): 68-73, 96.
2. “Re-Presenting Africa: Commemorative Postage Stamps of the Colonial Exhibition of Paris (1931),” African Arts, 37, 2 (2004): 58-61, 94-95.
3. “Domination and Resistance through the Prism of Postage Stamps,” Afrika Zamani, 17 (2009): 227-246.
4. “Visualizing the Game: the Iconography of Football on African Postage Stamps,” Soccer & Society, 13, 2 (2012): 294-308.
5. AHMAD, Feroz, “Postage Stamps, Politics and Ideology in the Late Ottoman Empire,” in Feroz AHMAD, From Empire to Republic vol. 2 Essays on the Late Ottoman Empire and Modern Turkey (Istanbul: Bilgi University Press, 2008).

То, что нужно оформить (на русском и с транслитерацией):
278. Пермякова П.В., Хусяинов Т.М. Почтовая открытка как источник по изучению истории Выборга и его жителей начала XX века: по материалам цифрового корпуса «Пишу тебе» // Страницы Выборгской истории. Книга восьмая. Выборг, 2024. С. 154-163.
277. Хусяинов Т.М. Почтовая коммуникация и повседневность жителей Гродно на рубеже XIX-XX веков (на материалах цифрового корпуса почтовых открыток «Пишу тебе» // Социальные, культурные и коммуникативные практики в динамике общественного развития : сб. науч. ст. / ГрГУ им. Янки Купалы ; редкол.: В. А. Белозорович (гл. ред.) [и др.]. – Гродно: ГрГУ, 2024 – С. 332-336.
276. Динамика коммуникативных практик в почтовой переписке (на материале корпуса «Пишу тебе»): монография / В. А. Куликова, Т. М. Хусяинов, П. А. Шкунов, А. К. Айсина, П. В. Доможирова, А. А. Карнаухов, М. С. Журавлева, П. В. Пермякова, Ю. Д. Мусинова; Под ред. В. А. Куликовой, Т. М. Хусяинова. – М.: Издательство РОИФН, 2024. 258 с.
275. Хусяинов Т.М. Почтовые открытки в рамках современных практик психологических интервенций у различных категорий // Современная реальность в социально-психологическом контексте – 2024: сборник научных трудов / под науч. ред. А. Л. Журавлева, О. А. Белобрыкиной, М. И. Кошеновой; Министерство просвещения Российской Федерации, Новосибирский государственный педагогический университет. – Новосибирск : Изд-во НГПУ, 2024. С. 188-191. 

Выдача нейросети

Комментарий

Я обычно за один раз оформляю как русскоязычные, так и англоязычные источники. Принцип, таким образом, довольно простой: присылаешь пример оформления, а затем перечень источников, которые необходимо оформить.

Автор: Тимур Хусяинов

Задача 6. Обработка больших массивов мультимодальных данных

Описание задачи

Передо мной стояла задача переформатировать информацию из файла Word в Excel; при этом структура сильно отличалась. Сами данные — это ревизская сказка одной из деревень Костромской губернии за 1850 год. В дальнейшем ее надо было загрузить на сайт Familio. Так как я уже несколько лет занимаюсь генеалогической реконструкцией по этому району, то накопилось много материалов, и сделать их общедоступными — это помочь большому кругу потенциальных исследователей. В процессе решения задачи было использовано две нейросети: ChatGPT и DeepSeek. В результате второй справился лучше, быстрее поняв суть задачи и выдав верный результат.

Задача выполнялась с помощью нескольких промптов.

Промпт 1

Привет! У меня есть образец документа в Excel и данные для заполнения в Word, можешь сделать?

Образец:

Оглавление
Лист со списком населённых пунктом очень важен в шаблоне индексации.
Лист с персонами из ревизии в шаблоне
Перечисление персон из ревизской сказки

Ревизская сказка — это документ, содержащий результаты проведения подушных переписей податного населения Российской империи в начале XVIII — XIX веков. Ревизские сказки проводились с целью налогообложения и представляют из себя поимённые списки населения с указанием фамилии (при наличии), имени, отчества главы семьи, его возраст, и имена, отчества членов семьи с указанием возраста, отношения к главе семьи.

Данный он предназначен для индексации ревизских сказок. Шаблон для индексации ревизских сказок выполнен в табличном редакторе Excel. Файл с оцифрованной ревизской сказкой можно хранить локально на компьютере, делиться файлом с другими исследователями, в Excel можно легко осуществлять поиск и фильтрацию, а также структура файла сделана в формате, удобном для дальнейшего внесения в «Справочники Familio».

Вся основная информация описана во вкладке «INFO» шаблона. Табличный редактор Excel удобен тем, что некоторые данные можно использовать как «список» и при наборе выбирать данные из него, а не набирать. Это также позволяет избежать опечаток.

Индексирующий сам вносит основные данные о документе и о себе. Индексацию можно сделать по нескольким годам, а можно по 1 году. Если РС за один год, то неплохо бы заполнить все данные о архивном документе, чтобы они также прописались у каждой персоны на сайте. Во вкладке «spiski» прописывается перечень чинов и статусов персон. «Пол» уже заполнен.

Вспомогательные листы для набора в шаблон индексации ревизских сказок. Лист «about». Лист со списком населённых пунктом очень важен в шаблоне индексации.
Для привязки записей о персонах к населённым пунктам на сайте необходимо будет составить список н.п. в листе «location» с привязкой к «Местам» Familio.
Один нас.пункт точно будет по месту составления ревизии. Но также очень часто людей переводили из других н.п. или в другие н.п., название указано и его точно можно определить на карте. Тогда одна запись по персоне может быть привязана минимум к одному н.п. или к двум, трём. Не обязательно заполнять «волость» или «уезд» если вы не знаете, но от того как заполните зависит что будет написано у персоны на сайте, а от URL — к какому населённому пункту пойдёт привязка.

Непосредственно привязка к н.п. позволит из справочника на сайте переходить от записей по персонам к н.п. и наоборот, персоны будут появляться в населённых пунктах, по ним можно будет вести поиск или эти «справочные записи» связывать со своими персонами в древе.

Если какого то населённого пункта нет в базе мест Familio, но у вас есть карта или иная информация, позволяющая точно определить это место, то вы можете написать в любом чате Familio сообщение с хэштегом #хочунп и запросом на добавление. Список чатов находится здесь: chat.familio.org

Лист с персонами из ревизии в шаблоне
Шаблон для заполнения информации о персонах, указанных в ревизии, сделан максимально подробным. Архивный шифр дела и листов, для того чтобы желающие всегда могли обратиться к источнику. Населённый пункт составления ревизской сказки выбирается из списка листа «location».

Одна персона в ревизии — одна строка в Excel. Члены одной семьи (двора) все с одним номером двора/семьи, и каждый уже внутри двора имеет свой порядковый номер. Общий номер двора/семьи позволит все персоны с единым номером связать в общий блок на сайте. Нумерация персон внутри семьи также позволяет указывать родственные связи.

При наличии в одной переписи персон нескольких помещиков — есть возможность указать к какому помещику относятся переписываемые персоны.

Архивный шифр и нумерация персон одной семьи в шаблоне ревизской сказки
Перечисление персон из ревизской сказки. Построчно вносятся ФИО «участников переписи», их пол. Для понимания связей внутри семьи используется указание степени родства и номера по списку того члена семьи, к которому относится указанное родство. Саму связь можно указывать на своё усмотрение от «сын» (номера 1) до «сын Василия Яковлева» (номер 1).

Далее указывается возраст на текущую ревизию и возраст на прошлую ревизию (если таковой записан). В некоторых более поздних ревизиях указывается точная дата рождения и для этого предусмотрены отдельные поля.

Очень часто указана информация о переводе людей из других населённых пунктов, тогда указана причина перевода и очень часто название н.п.. Аналогично с местом, куда персоны переводят. Как уже сказано ранее, если удаётся определить название места по «Местам» на сайте Familio, то лучше это сделать, т.к. тогда запись о персоне будет видно среди персон и одного нас.пункта и другого. Исходя из указанного возраста и года ревизии высчитывается примерный год рождения персон и при наличии записи о смерти в определённом году в столбцах убытия — прописывается год смерти.

Есть поле для пометок или комментариев, которые указаны непосредственно в ревизской сказке (например о на всю семью может быть указано примечание в стиле «эта семья получена от помещика такого-то в таком то году…) и если примечание для всей семьи, то повторить текст пометки нужно в каждой строке всех членов семьи. А также есть поле для «авторского комментария наборщика», куда можно внести любые дополнения «от себя», например указать что не разобрали фамилию, что утрачена часть текста и т.д.

Образец исходной таблицы

СемьяКрестьянеВозраст по последней ревизииВыбылиВозраст на момент ревизии
1Степан Николаев28 44
Степана Николаева жена Афросинья Филиппова 44
сын Петр Степанов5 21
Петра Степанова жена Каптелина (^Капитолина) Андреева 20
сын Николай Степанов2 18
дочь Арина Степанова 15 1/2
2Конон Ефимов18Отдан в рекруты в 1841 г. 
Конона Ефимова мать Дарья Леонтьева 64
Конона Ефимова брат Агап4 20
Агапа Ефимова жена Варвара Матвеева 18
3Иван Карпов30 46
сын Лукьян Иванов2 18
сын Василий Ивановноворожденный 14 1/2
дочь Марина Иванова 11
дочь Оксинья Иванова 6 1/2
Лукьяна Иванова жена Маремьяна Феодулова  17

Комментарий

DeepSeek лучше понял структуру таблицы и в целом правильнее справился с задачей, чем ChatGPT. Затем нейросеть (ChatGPT) задала уточняющие вопросы по таблице. И ChatGPT, и DeepSeek сделали требуемое по 2-3 семьям из 18. Первый сделал 3, второй — 2, после чего оба спросили, нужно ли сделать то же самое по остальным. Ниже даны вопросы нейросети и мои ответы на них.

Выдача нейросети

Год ревизии — это 1850, как указано в документе. Подтверди, пожалуйста? Да.

Населённый пункт: деревня Дубовик, Замерская волость, Галичский уезд, Костромская губерния — правильно ли я понимаю, что именно это место нужно указать в листе location? Да.

В документе есть указания о переводе, выбытии, смерти — нужно ли всё это заносить в шаблон? Например: «Отдан в рекруты в 1841 г.», «Умер в 1843 г.», «Переведен из Буйского уезда деревни Устинова». Да, в комментарии.

Пол и родственные связи — можно ли определять автоматически по имени и описанию (например, «жена», «сын» и т.д.)? Да.

Нужно ли указывать архивный шифр или оставить поле пустым (если в Word его нет)? Государственный архив Костромской области, фонд 200, опись 14, дело 42, листы 110-115об.

У некоторых персон есть указания типа «новорожденный», «1/2 года», «14 1/2» и т.д. — сохраняем это как есть, или округлять возраст до целого числа? Округляем.

Промпт 2

Сделай CSV по примеру. Пример: таблица-шаблон в формате txt

Образец в формате txt

Выдача нейросети

Комментарий

Затем я перенес результат в Excel. За 3 промпта нейросеть справилась с этой задачей. Единственная проблема, которую мне удалось обнаружить, — формат ячеек не везде подходит данным. Но это удалось исправить уже вручную.

Автор: Тимур Хусяинов

Написание кода для визуализации романов

Описание задачи

Я использую ChatGPT для написания кода. Например, у меня есть датасет с частотностями слов в разных книгах. Я прошу нейросеть написать мне код, который делает такую визуализацию, чтобы каждая книга была трехмерным вектором трех верхних частотностей. Задача выполняется в 4 промпта.

Промпт 1

Hey, I have data on word frequencies in certain novels in csv format (see attached). Each novel is a column, each word a row. Write a python code to visualize novels as points in 3-dimensional space, where the dimensions would come from the frequencies of selected words.

(У меня есть данные о частоте встречаемости слов в некоторых романах в формате csv (см. вложение). Каждый роман это столбец, каждое слово строка. Напиши код на python для визуализации романов в виде точек в 3-мерном пространстве, где размерность будет определяться частотой выбранных слов).

Выдача нейросети

Результат выдачи ChatGPT

Комментарий

Затем прошу ChatGPT использовать кодирование по цветам для визуального разграничения Толстого и Достоевского.

Промпт 2

Can you use colors to differentiate Tolstoy and Dostoevsky?

Выдача нейросети

Комментарий

Я попросил изменить код — так, чтобы сетка была белого, а не серого цвета.

Промпт 3

Can we alter the code so that the grid behind is white and not grey?

Выдача нейросети

Комментарий

Уточняю, как можно дифференцировать маркеры.

Промпт 4

Is there also a possibility to differentiate the markers? Now both are the same shape, I’d love to change them 

Выдача нейросети

Автор: Даниил Скоринкин

Создание разметки

Описание задачи

ChatGPT выполняет задачи по разметке текста. Например, мне понадобилась разметка прямой речи в тексте с указанием говорящего и адресата реплики.

Промпт

Hello. You are a native speaker of Russian and an assitant in manual text markup. You will be marking up all instances of direct speech in Russian texts. You will need assign a speaker (i.e. concrete speaking character) to each direct speech instance, and, whenever it is known, assign an addressee of the speech (i.e. the character to whom the speech is addressed). But you should not assign an addressee if there is no clear addressee or the character speaks to himself. The output should be in JSON format. Please do not omit any speech text. Here is an example input: 

Раздался звонок. В дверь. Калям спрыгнул с тахты и, задрав хвост, поскакал в прихожую. Малянов аккуратно положил ручку.

– С цепи сорвались, честное слово, – произнес он.

В прихожей Калям описывал нетерпеливые круги и орал, путаясь под ногами.

– Ка-ал-лям! – сказал Малянов сдавленно-угрожающим голосом. – Да Калям, пошел вон!

Он открыл дверь. За дверью оказался плюгавый мужчина в кургузом пиджачке неопределенного цвета, небритый и потный. Слегка откинувшись всем корпусом назад, он держал перед собою большую картонную коробку. Бурча нечленораздельное, он двинулся прямо на Малянова.

– Вы… э… – промямлил Малянов, отступая.

Плюгавый был уже в прихожей – глянул направо в комнату и решительно повернул налево в кухню, оставляя за собой на линолеуме белые пыльные следы.

– Позвольте… э… – бормотал Малянов, наступая ему на пятки.

Мужчина уже поставил коробку на табурет и вытащил из нагрудного кармана пачку каких-то квитанций.

– Вы из ЖЭКа, что ли? – Малянову почему-то пришло в голову, что это водопроводчик наконец явился – чинить кран в ванной.

– Из гастронома, – сипло сказал мужчина и протянул две квитанции, сколотые булавкой. – Распишитесь вот здесь…

– А что это? – спросил Малянов и тут же увидел, что это бланки стола заказов. Коньяк – две бутылки, водка… – Подождите, – сказал он. – По-моему, мы ничего…

Он увидел сумму. Он ужаснулся. Таких денег в квартире не было. Да и вообще с какой стати? Охваченное паникой воображение мигом выстроило перед ним удручающую последовательность всевозможных сложностей, вроде необходимости оправдываться, отпираться, возмущаться, призывать к здравому смыслу… звонить, наверное, куда-нибудь придется, может быть, даже ехать… Но тут на углу квитанции он обнаружил фиолетовый штамп «Оплачено» и сразу же – имя заказчика: Малянова И.Е. Ирка!.. Ни черта понять невозможно.

– Вот тут расписывайтесь, вот тут… – бурчал плюгавый, тыча траурным ногтем. – Вот где птичка стоит…

Малянов принял от него огрызок карандаша и расписался.

– Спасибо… – сказал он, возвращая карандаш. – Большое спасибо… – обалдело повторял он, протискиваясь рядом с плюгавым через узкую прихожую. Дать ему надо бы что-нибудь, да мелочи нет… – Огромное вам спасибо, до свидания!.. – крикнул он в спину кургузому пиджачку, ожесточенно отпихивая ногой Каляма, который рвался полизать цементный пол на лестничной площадке.

Потом Малянов закрыл дверь и некоторое время постоял в сумраке. В голове было как-то все неясно.

– Странно… – сказал он вслух и вернулся на кухню.

For that example input, here is an example output:  

[
     {
         «speaker»: «Малянов»,
         «speech»: «С цепи сорвались, честное слово»
     },
     {
         «speaker»: «Малянов»,
         «speech»: «Ка-ал-лям!»,
         «addressee»: «Калям»
     },
     {
         «speaker»: «Малянов»,
         «speech»: «Да Калям, пошел вон!»,
         «addressee»: «Калям»
     },
     {
         «speaker»: «Малянов»,
         «speech»: «Вы… э…»,
         «addressee»: «Мужчина с коробкой»
     },
     {
         «speaker»: «Малянов»,
         «speech»: «Позвольте… э…»,
         «addressee»: «Мужчина с коробкой»
     },
     {
          «speaker»: «Малянов»,
         «speech»: «Вы из ЖЭКа, что ли?»,
         «addressee»: «Мужчина с коробкой»
     },
     {
         «speaker»: «Мужчина с коробкой»,
         «speech»: «Из гастронома, Распишитесь вот здесь…»,
         «addressee»: «Малянов»
     },
     {
          «speaker»: «Малянов»,
         «speech»: «А что это?»,
         «addressee»: «Мужчина с коробкой»
     },
     {
         «speaker»: «Малянов»,
         «speech»: «Подождите, По-моему, мы ничего…»,
         «addressee»: «Мужчина с коробкой»
     },
     {
         «speaker»: «Мужчина с коробкой»,
         «speech»: «Вот тут расписывайтесь, вот тут… Вот где птичка стоит…»,
         «addressee»: «Малянов»    
     },
     {
         «speaker»: «Малянов»,
         «speech»: «Спасибо… Большое спасибо… Огромное вам спасибо, до свидания!»,
         «addressee»: «Мужчина с коробкой»
     },
     {
         «speaker»: «Малянов»,
         «speech»: «Странно…»
     }
]

Комментарий

После этого я присылаю ChatGPT текст для создания разметки. 

Выдача нейросети

Автор: Даниил Скоринкин

Авторы раздела

«Системный Блокъ» выражает благодарность Анастасии Жук, Тимуру Хусяинову и Даниилу Скоринкину за предоставление промптов, текста и фотоматериалов.

Recent Posts

От саркофагов до дворцовых залов: как 3D-технологии делают памятники культуры доступнее

Восковая скульптура Микеланджело, которую нельзя выставлять в тепле. Средневековый французский ковёр длиной 70 метров, который невозможно рассмотреть целиком. Египетские саркофаги,…

16.05.2026

Малярия и храмы: как болезни влияли на распространение культов в Древнем Риме

Малярия — одна из самых страшных болезней, которая веками отнимала силы и жизни у миллионов людей. Уже жителям Римской империи…

30.04.2026

Женщина для галочки: дата-исследование о принципе Смурфетты в российском кино

Принцип Смурфетты — это ситуация, когда среди мужских персонажей фильма есть только одна героиня. Ее образ — это стереотипное представление…

26.03.2026

Феномика, ГМО и роботы: как завтрашний урожай проектируется уже сегодня

Что общего между ДНК-маркерами, прогностическими моделями и дронами с мультиспектральными камерами? Все это — инструменты селекции, которая за последние два…

18.03.2026

«Один человек сможет построить компанию в миллиард долларов»: интервью с технооптимистом Иваном Ямщиковым

Как ИИ изменит общество и образование? Что в школе будущего должен делать учитель, а что — тренажер? Почему в XXI…

21.02.2026

От генома к родословным: как палеогенетика помогает изучать социальную структуру древних сообществ

Историки и биологи давно исследуют прошлое человечества вместе. С недавних пор к ним присоединились палеогенетики и биоинформатики. Их методы позволяют…

17.02.2026

Исторические личности в русской прозе: кто, почему и где упоминается чаще всех?

В художественных произведениях часто упоминаются исторические личности. Что будет, если посмотреть на русскую литературу XIX века через упоминания реальных людей?…

30.01.2026

ИИ-итоги 2025: рассуждающие модели, агенты, партнеры по разуму

Подводим итоги и рассказываем о самых важных событиях в мире ИИ за прошедший год

01.01.2026

От судебных картотек к базам данных: как цифровые архивы помогают историкам права

За что и как наказывали людей в прошлом? Как судебные архивы превращаются в базы данных, а историки — в дата-аналитиков? Чем историкам права помогают цифровые методы? На примере проекта The…

17.11.2025

Отпечатки пальцев дерева: как ДНК растений и животных помогает раскрывать преступления

Мы привыкли, что на месте преступления ищут отпечатки пальцев, следы обуви и человеческую ДНК. Но сегодня вещественным доказательством может стать…

08.11.2025

«Чукотка — это культура, сквозь которую прорастает язык»: лингвист Инна Зибер об изучении Севера, магии чукотского имени и утрате традиций

Как Север может оказаться южнее Москвы? С какими сложностями сталкивается исследователь языков и народов Арктики? Где лучше искать носителей чукотского…

24.09.2025

Что такое рассуждающая языковая модель и как она работает

Прогресс больших языковых моделей через увеличение их размеров застопорился: их масштабирование уже почти не дает прироста качества. Выход ищут в…

15.09.2025

Музыка на «костях»: как рентгеновские снимки заменили винил

Когда в СССР пластинки с западной музыкой оказались под запретом, меломаны нашли неожиданный выход. Вместо винила они использовали... медицинские рентген-снимки.…

21.08.2025

Небоскребы из бумаги: как упорядочить деловую переписку в эпоху капитализма

Почему ваши файлы на компьютерах и смартфонах до сих пор лежат в «папках»? Все началось с бухгалтеров XIX века и…

10.07.2025

Как визуализировать книги мира на одной полке с помощью ISBN

Как «разложить» все книги мира на одной гигантской полке? 📚 Оказывается, для этого достаточно внимательно посмотреть на коды ISBN. Рассказываем,…

26.06.2025

Герои и драконы с привязкой к местности: как цифровая картография помогает исследовать мифы

Драконы, духи и герои древних легенд теперь не бродят по туманным мирам — они появляются на картах. Современные базы данных…

02.06.2025

Как работают мультимодальные модели: от пикселей — к пониманию

Как работает поиск изображений по текстовым описаниям? Как это связано с генерацией изображений? Как языковые модели «понимают» не только текст,…

21.05.2025

Эксперт всегда под рукой: забытая история первых цифровых помощников

Искусственный интеллект повсюду: заменяет врачей, ищет нефть, а инженеры разрабатывают специальные чипы для машинного разума. Звучит как заголовки из 2025…

16.05.2025

Цифровые репетиторы: как ИИ помогает готовиться к экзаменам

ЕГЭ — нервное событие, а подготовка к экзаменам — долгая и сложная. На помощь ученикам и учителям приходят сервисы на…

28.04.2025

DeepSeek: обзор китайской нейросети и ее возможностей

DeepSeek — новая китайская нейросеть, вызвавшая фурор как среди простых пользователей, так и специалистов. Некоторые даже окрестили ее «убийцей ChatGPT».…

23.04.2025

Археология памяти. Как цифровые методы помогают исследовать преступления нацистского режима

Исследование мест массовых убийств позволяет высветить обстоятельства и корни преступление против человечности, а также делает нас свидетелями прошлого. Современные технологии…

17.04.2025

Искусственный интеллект помог обнаружить сотни геоглифов в пустыне Наска

Геоглифы Наски известны людям с XVI века — о них упоминали конкистадоры, которые проходили через пустыню. Тем не менее научное…

09.04.2025

Вспоминайте иногда вашего студента: изучаем базу данных средневековых университетов

Средневековые студенты часто перемещались из одного университета в другой, чтобы получить всестороннее образование и ученую степень. Все это, наряду с…

25.03.2025

Как 3D-моделирование спасает памятники древнерусской письменности: Corpus Inscriptionum Rossicarum

Могут ли новые технологии помочь прочесть нечитаемую древнюю надпись на камне? Как трехмерные модели старинных надгробий, крестов, камней и эпиграфических…

13.03.2025

Паузы в словах: ИИ учится диагностировать болезнь Альцгеймера по речи

Болезни Альцгеймера подвержены миллионы людей по всему миру, и с каждым годом число заболевших продолжает расти. Однако традиционные методы диагностики…

22.02.2025

«Дисциплинировать литературоведческую мысль может только рациональный метод»: научное завещание Бориса Ярхо

Борис Ярхо — один из самых недооцененных филологов знаменитого поколения «русских формалистов» 1910-х — 1920-х. В отличие от куда более…

04.02.2025

Как биологи и лингвисты вместе изучают эволюцию языков

Язык — естественная система. Он распространяется, развивается и даже мутирует, подчиняясь законам естественных наук. Можно ли с его помощью реконструировать…

28.01.2025

Взламывая шифр Зодиака: как энтузиасты разгадали послание серийного убийцы

Современные технологии хорошо помогают в криптоанализе: программы, перебирающие тысячу вариантов за несколько секунд, в разы превосходят возможности человека. Однако слепого…

22.01.2025

«Системный Блокъ»: лучшее за 2024 год

В 2024 году «Системный Блокъ» опубликовал 180 материалов. В этом посте мы рассказываем о наших итогах года: о запуске новых…

31.12.2024

Как изучать наскальные изображения оленей Чукотки с помощью нейросетей

Петроглифы — небольшие древние наскальные изображения — часто сложно датировать и атрибутировать. При этом для некоторых рисунков может быть очень…

23.12.2024

Создай метательный аппарат и пробей крепостную стену: как понять науку через симуляторы

Хотите смоделировать процесс эволюции или работу человеческого глаза? Не можете разобраться в баллистике? Тогда воспользуйтесь интерактивным симулятором. Мы собрали самые…

18.12.2024

Языковые модели — это адронный коллайдер для языка: интервью с Татьяной Шавриной

Куда развивается искусственный интеллект и какие новые умения он приобретет в ближайшем будущем? Что делать с тем, что коммерческие продукты…

19.08.2024

Девушки, живущие в сети: женщины-хакеры на экране

23 года назад вышел фильм «Пароль “Рыба-меч”» — знаковая лента о хакерах с Джоном Траволтой. Это не только первый массовый…

20.06.2024

Всемирная история картотек: как в эпоху Просвещения классифицировали знание

Как Линней придумал таксономию живых организмов, в чём польза игральных карт для каталогизации знания и сколько человек нужно, чтобы описать…

12.06.2024

Всемирная история картотек: как учёные и библиотекари пытались упорядочить всё

Информация бесполезна, если мы не знаем, как и где её найти. С появлением книгопечатания проблема упорядочивания выпущенных книг занимала учёных…

07.06.2024

Музыкальная «энциклопедия русской жизни»: о чём пела русскоязычная поп-эстрада с 1990 по 2019 год

Популярная музыка транслирует социальные нормы. Чем популярнее музыка, тем больше людей могут себя с ней соотнести. На какие детали быта…

05.06.2024

«Меня интересует знать, а не уметь»: Игорь Мельчук о нетрадиционной лингвистике, машинном переводе и жизни в Канаде

Как в СССР возник машинный перевод? Чем нетрадиционная лингвистика отличается от традиционной? Почему эмиграция иногда становится спасением жизни? Об этом…

16.05.2024

«Воскрешение» исторических личностей и лекция от суперзвезды: как использовать дипфейки в образовании

Эйнштейн объясняет старшеклассникам теорию относительности. Маяковский читает стихи у доски. Ученик «обменивается» телом с учителем, а у педагогов остаётся время…

07.05.2024

Цифровые технологии против гендерного неравенства в образовании

По данным ООН, закрытие школ во время пандемии, сокращение и автоматизация рабочих мест отодвинули равноправие женщин и мужчин на 31…

01.05.2024

Гид по Voyant Tools: анализ и визуализация

Продолжаем наше руководство по анализу текста с помощью Voyant Tools. В прошлом материале мы рассказали, как загрузить и подготовить корпус.…

24.04.2024

Невыносимая лёгкость атрибуции: новая пьеса Милана Кундеры

Филологи уже долгое время подозревают, что одна из пьес чешского драматурга Карела Штайгервальда на самом деле принадлежит перу Милана Кундеры.…

10.04.2024

Четыре проекта по борьбе с коррупцией онлайн. Как они работают?

Может ли работа с данными помочь в борьбе с коррупцией? «Системный Блокъ» выяснил, какие цифровые сервисы и проекты занимаются антикоррупционной…

30.03.2024

«Ты же не думаешь, что можно заниматься диалектологией как профессией?»: интервью с диалектологом Игорем Исаевым

Как отделить язык от диалекта? Должна ли вся страна говорить на одном «стандартном» языке и какие преимущества есть у использования…

01.03.2024

10 необычных экспонатов музейного Госкаталога РФ

Где можно найти настольную игру, иронизирующую над перестройкой, матрёшку с мордой собаки Стрелки и сборник суеверий из XVIII века? Рассказываем…

22.02.2024

«Нас вообще все боятся»: Александра Архипова о том, зачем фольклористы и социальные антропологи собирают слухи и считают репосты

Как примирить сторонников количественных и качественных исследований культуры? Как исследователям фольклора помогают цифровые базы данных? О чём могут рассказать лозунги…

15.02.2024

Понять Льва Толстого: как векторно-семантические модели помогают литературоведам

Идиостиль — это авторский стиль писателя. И если на небольших стихах его изучать удобно, то вот на текстах Льва Толстого…

07.02.2024

Стилометрия древнегреческих текстов: работает ли Дельта — и что кроме нее

Стилометрия — количественный метод определения авторства, который проверен на десятках современных языков. А что там с языками древними? Историк философии…

22.11.2023

«Digital Humanities — это крыша для всех, кто применяет цифровые технологии»: интервью с Леонидом Бородкиным об исторической информатике

Какие советские ученые стоят у истоков исторической информатики? Как математические методы позволяют моделировать исторические процессы? Как складывались отношения российских исторических…

08.11.2023

Стилометрия кинодиалогов: шесть жанров в поисках автора

Статья Агаты Холобут и Яна Рыбицкого The Stylometry of Film Dialogue: Pros and Pitfalls показывает связь между жанровыми особенностями кино…

28.09.2023

Интернет на службе коммунизма: как СССР создавал свою электронную сеть

В конце 60-х гг. не только США разрабатывали компьютерные сети. В СССР также строили грандиозные планы по созданию системы, которая…

25.09.2023

Поясни за стиль. Какому поэту подражает нейросеть?

Цифровые филологи научились «измерять стиль»: у «Системного Блока» есть подборка статей о стилометрии и гайд о том, как провести собственное…

22.09.2023

Шесть рукопожатий Владимира Маяковского

Представляем результаты авторского цифрового исследования: граф социальных связей персоналий Серебряного века на основе материалов проекта «Устная история». Центральная фигура —…

06.09.2023

Фонограммархив для науки: Светлана Подрезова о коллекции аудиозаписей Пушкинского Дома и работе с источниками

Как связаны имена Блока и Гумилёва с историей крупнейшей коллекции этнографических аудиозаписей? Когда исполнители перестали бояться раструба фонографа? Что происходит,…

01.09.2023

Искусственный интеллект vs. феномен Владимира Набокова

Владимир Набоков известен тем, что писал и на русском, и на английском. Сможет ли компьютер распознать его оригинальный стиль? Этот…

23.08.2023

Голос(а) автора: может ли один человек писать как несколько?

Стилометрический анализ позволяет определить, принадлежат ли тексты одному и тому же автору. Но что если писатель творит под несколькими литературными…

17.08.2023

Машина управляет танцем: кибернетика в театре и музыке XX века

Может ли машина писать мелодии, разговаривать с музыкантом во время выступления и руководить групповым танцем? В середине прошлого столетия последователи…

04.08.2023

Как научить компьютер распознавать арабские тексты

Исследователи-филологи, занимающиеся древними текстами, давно используют компьютерную обработку текста. Но арабистика пока лишена многих цифровых инструментов текстового анализа. Рассказываем, почему…

03.08.2023

От аналогового к цифровому: как происходит оцифровка в архивах, музеях и библиотеках

Современный мир захлестнула цифровизация. Это не обошло стороной, в том числе, и институции культурного наследия, которые начали массово переводить свои…

18.07.2023

Домашнее и партнерское насилие в России: сколько у него жертв и как им помочь

Проблема домашнего насилия — одна из наиболее острых социальных проблем в современной России. А вопрос о достоверной статистике по этой…

12.07.2023

Изучение русской культуры: подборка цифровых ресурсов

За последние годы появилось много возможностей исследовать русскую культуру, не выходя из дома. Сейчас для этого нужен лишь компьютер либо…

30.06.2023

Поиграем в прошлое: как исторические видеоигры влияют на современность

Исторические игры регулярно попадают в десятку самых продаваемых видеоигр в разных странах, а опирающаяся на всемирную историю Assassin's Creed —…

21.06.2023

500 героев в одной схеме: о чем говорит сетевой анализ «Войны и мира»

Ранее мы рассказывали про цифровой анализ речи героев «Войны и мира». В этом материале с помощью сетевого анализа разбираемся, как…

15.06.2023

Нужный, живой, веселый, пьяный, хороший: цифровой анализ текстов песен «Короля и Шута»

Наверняка вы когда-нибудь слышали о группе «Король и Шут». Даже, если вы не преданный фанат, то мы почти уверены, что,…

30.05.2023

Как работают языковые модели

Что такое языковая модель? Что общего между клавиатурой вашего телефона и GPT? Почему языковые модели умеют не только моделировать язык?…

25.05.2023

«Открытые данные против мракобесия и пренебрежения реальностью»: интервью с Кириллом Маслинским

Кирилл Маслинский — цифровой филолог, руководитель Лаборатории цифровых исследований литературы и фольклора в Пушкинском Доме, создатель Детского корпуса и Репозитория…

16.05.2023

Уникальные книжные памятники онлайн: от старинных карт Сибири до мохнатого «лесного чюда»

Исторические сокровища, ранее доступные лишь немногим, впервые появились в сети благодаря проекту «Книжные памятники». Мы расскажем, как и зачем происходит…

15.05.2023

От древнерусского до корпуса блогов: как изменился Национальный корпус русского языка после редизайна

Национальный корпус русского языка (НКРЯ) — важнейший инструмент любого исследователя, который занимается русским языком, русской литературой и вообще русской словесной…

06.05.2023

Шифропанки — анархисты интернета

В конце 80-х годов опасения, что госструктуры будут контролировать зарождающийся интернет, привели к возникновению движения шифропанков. Эти интернет-активисты выступали за…

03.05.2023

«Цифровой концлагерь»: как закон о повестках через «Госуслуги» взбудоражил россиян

В России вступил в действие закон, объявляющий повестку из военкомата врученной вне зависимости от ее получения призывником. Теперь повестку достаточно…

19.04.2023

Хактивизм: кто и как ведет борьбу в киберпространстве

Сайт Госуслуг «упал» после объявления в России мобилизации. Rutube обрушился 9 мая 2022 года и не работал три дня. Некоторые…

11.04.2023

Что умеет GPT-4 — новая и самая совершенная языковая модель от OpenAI

Новая нейросеть семейства GPT не только точнее, надёжнее и безопаснее GPT-3 и ChatGPT. Еще она умеет работать с изображениями. Благодаря…

27.03.2023

«И пусть все читают “Одумайтесь”»: Анастасия Бонч-Осмоловская о цифровом Толстом и пересборке DH после 24 февраля

Анастасия Бонч-Осмоловская ― лингвист, филолог, цифровая исследовательница, идейная вдохновительница и душа российских Digital Humanities. «Системный Блокъ» поговорил с Анастасией о…

25.02.2023

Гулливер и нейросети: интернет-банкинг и онлайн-торговля в произведениях писателей XVIII-XIX века

Фантастика часто предугадывает будущие достижения науки и техники. «Системный Блокъ» уже рассказывал, как русские писатели XIX века предсказали появление генеративных…

20.02.2023

Голос Холокоста в «Пишу тебе»: как мы получили открытку из гетто

«Пишу тебе» всегда призывает наших читателей и волонтеров делиться открытками из семейного архива. История, которой мы хотим сегодня поделиться, началась…

15.02.2023

Собери их всех: как record linkage помогает обогащать большие биографические данные

Сейчас историки всё чаще уделяют внимание не столько выдающимся деятелям прошлого, сколько целым группам людей, жившим в ту или иную…

03.02.2023

Как писатели XIX века предсказали мессенджеры, интернет на Марсе и нейросети

Научная фантастика в русской литературе имеет давнюю историю. Писатели XIX и первой половины XX века предсказали многое: от телевидения до…

23.01.2023

«Системный Блокъ»: лучшее за 2022 год

В 2022 году «Системный Блокъ» опубликовал 247 материалов. В этом посте мы сформулировали краткие итоги ушедшего года: открытие дата-отдела, оцифровка…

16.01.2023

Скифия, Египет, Вавилон: как цифровые методы помогают в изучении средневековых карт

По сравнению с современными картографическими сервисами старинные средневековые карты выглядят загадочно и непонятно. Точно так же до недавнего времени на…

07.12.2022

Юдифь vs Саломея: какой библейский сюжет всему голова?

Две библейские героини — неприступная Юдифь и обольстительница Саломея — очень непохожи друг на друга. Но в истории каждой из…

01.12.2022

Что такое взлиза и кто носил чаплыжку: цифровое «Слово Толстого»

23 ноября команда Tolstoy Digital запустила сайт «Слово Толстого» – первый цифровой путеводитель по необъятному наследию писателя

24.11.2022

Эволюция приемов в кино: фильмы с нарушенной хронологией

Людьми часто движет любопытство. Мы хотим узнать, чем кончится история, были ли мы правы, что же автор всё-таки имел в…

10.11.2022

Культурная дипломатия: о чем рассказывал советский стоматолог в открытках из США и Германии?

«Шумно, дергано, стук ужасный» — среди материалов «Пишу тебе» обнаружились открытки знаменитого советского стоматолога, отправленные из Америки и Германии. О…

05.11.2022

Что такое гражданская наука и как участвовать в контроле воздуха

Можно ли принимать участие в экологических проектах, не будучи экологом? Можно! Ведь существует гражданская наука. Рассказываем, как каждый из нас…

03.11.2022

Chekhov Digital: как Чехов писал письма жене и куда течет время в его текстах

Знали ли вы, что слово «время» в произведениях А. П. Чехова имеет определенные схемы употребления, повторяющиеся от тома к тому?…

28.10.2022

Цифровой Чехов: как устроено семантическое издание и где искать 4500 писем Чехова

Каждый филолог желает знать, что такое семантическое издание. В этой статье мы расскажем вам об одном из них. В нем…

11.10.2022

Мобилизация после репрессий. Как Большой террор повлиял на участников ВОВ

Даже если государственный террор не воздействует на человека напрямую, он влияет на формирование его представлений о государстве и отношение к…

07.10.2022

Большие языковые модели умеют рассуждать

Модель психики «Думай медленно… решай быстро» оказалась верна не только для людей, но и для больших нейросетей. Вслед за интуитивными…

04.10.2022

Что статистические отношения в лексике могут рассказать про средневековую власть?

Чем тексты аббатов и епископов отличались от текстов графов и королей? Рассказываем, как при помощи статистики употребления слов и анализа…

15.09.2022

«Город без данных — город-призрак»: Алексей Новиков о том, как Big Data меняет представление о планировке и застройке

Алексей Новиков — кандидат географических наук, глава и соучредитель компании Habidatum, специализирующейся на аналитике городских данных. «Системный Блокъ» поговорил с…

07.09.2022

«Игнорируется и не ценится»: вклад женщин в науку через цифры

Если посмотреть на голую статистику, может показаться, что женщины-ученые публикуют меньше научных статей, чем их коллеги-мужчины, а также реже получают…

26.08.2022

Камера на сотню: как развивается видеонаблюдение в Москве

Москва входит в топ-30 городов по покрытию камерами. Цифровизация наблюдения уменьшает риск преступности, но при этом и помогает государству выследить…

25.08.2022

Бёрдвотчинг: что это за птица такая?

Лето почти закончилось, а вы все еще не отличаете сатанинского козодоя от башенного стрижа? А может, вам хотелось стать орнитологом,…

17.08.2022

Обсуждая гуманизм: тематическое моделирование немецкоязычной прессы XIX в.

Как цифровые методы помогают понять эволюцию идеи гуманизма в Германии XIX века? Рассказываем об исследовании «гуманистического дискурса» в немецкоязычных газетах…

11.08.2022

Кто скрывается за псевдонимом «Элена Ферранте»: стилометрия против мистификаций

Системный Блокъ много писал о стилометрии: об атрибуции и верификации авторства, анализе эмоций в песнях и стиля переводчика. Теперь на…

03.08.2022

Цифровое шекспироведение: драма в трех действиях

Человеку из XXI века может быть сложно понять социальные реалии, в которых создавались пьесы Шекспира. С помощью цифрового анализа исследователи…

30.07.2022

«К идее разных интернетов мы пока не привыкли»: Полина Колозариди об исследованиях интернета

Полина Колозариди — интернет-исследователь, координатор Клуба любителей интернета и общества, преподавательница ИТМО и НИУ ВШЭ. «Системный Блокъ» поговорил с ней…

14.07.2022

«Размечено»: как распознавать именованные сущности в исторических дневниках

Дневники людей, живших в различных исторических эпохах, могут многое сказать исследователю, но анализировать их вручную — тяжело и долго. Разбираемся,…

12.07.2022

Точка, точка, запятая: как меняется язык в интернет-пространстве

«Привет» или «ПРИВЕТ»? А, может быть, «првиет!»? Вариантов поздороваться в онлайн-переписке, как и написать любое другое слово, множество. Причем каждый…

06.07.2022

Тревоги «маленьких людей» Англии XVI-XVIII веков

В наши дни подписание петиций или краудфандинговый сбор средств на чьи-нибудь нужды стали привычным делом. Кажется, постоянный фидбек прочно вошел…

02.06.2022

Отличить Святополка от Святослава: цифровая генеалогия Древней Руси

Схемы, модели и другие способы наглядно представить информацию давно стали неотъемлемой частью повседневной жизни. В исторической науке к методу визуализации…

17.05.2022

Автор(ы) умер(ли), а проблемы остались

Продолжаем разгадывать вечную тайну «Беовульфа» и рассказывать о том, как цифровые филологи строят научный диалог в поисках правды.

02.05.2022

«Заговори, чтобы я тебя увидел»: эволюция диалога в русской литературе XIX века

Литература как любая сложная система развивается и эволюционирует. Какие-то произведения остаются в центре внимания читателей на десятки и даже сотни…

26.04.2022

«Агрессии нет, сочувствие есть»: что говорят россияне об отношении к ним за рубежом

С начала боевых действий на Украине мы регулярно слышим о том, что за границей притесняют людей из России. Но чаще…

15.04.2022

Нетворкинг Пикассо и Уорхола: сетевой анализ выставок в МоМА

Нью-йоркский музей МоМА — один из старейших музеев современного искусства в мире. В MoMA хранятся работы Рене Магритта и Энди…

08.04.2022

Цифровой культурный колониализм в Google Arts&Culture

Пандемии, кризисы и войны бьют не только по людям, но и по культуре. Многие музеи оказываются недоступны, а то и…

31.03.2022

Неизвестное будущее: как не сойти с ума в условиях неопределенности

Еще месяц назад мы с уверенностью смотрели в будущее, почти привыкнув к «новой нормальности» в мире с пандемией. Но оказалось,…

22.03.2022

Ученые спасают украинское культурное наследие и сетевые архивы

Международное сообщество исследователей запустило инициативу по сохранению украинского культурного наследия в цифровой форме

09.03.2022

Как сделать тематическое моделирование

Рассказываем, как сделать тематическое моделирование для большого объема текста, предположить его содержание и разделить по темам

01.03.2022

Культура в цифровом сите: что остается за кадром

Инна Кижнер — старший преподаватель кафедры информационных технологий в креативных и культурных индустриях, научный сотрудник лаборатории «Digital Humanities» Сибирского федерального…

17.02.2022

Как работают диалоговые системы и чем они отличаются

Алиса Яндекса, Олег Тинькофф-банка и телеграм-бот для демотиваторов — одно и то же? Или нет? Разбираемся, как работают диалоговые системы…

10.02.2022

Как плести виртуальные сети с помощью Gephi

Gephi — самый известный инструмент для визуализации графов и сетевого анализа. С его помощью можно исследовать и население Викторианской Англии,…

31.01.2022

«Впереди сущий сахарный голод»: что говорит о дневниках 1917 года анализ данных

Революция 1917 года — одно из крупнейших потрясений в российской истории. О чем думал Николай II в день отречения? Что…

18.01.2022

Русские классики – сексисты или все-таки нет? Корпусный анализ текста Пушкина

В октябре «Системный блокъ» опубликовал корпусное исследование русской классики, в котором были проанализированы произведения школьной программы. Тогда в анализ текста…

13.01.2022

Идеальная формула депрессивной песни на примере Radiohead

В наше время компьютер может работать практически с чем угодно, в том числе и с музыкой: существует множество методов как…

12.01.2022

«Желаю в веселье и радости провести и не нажить, опохмелившись, головной боли»: как поздравляли с Рождеством 100, 50 и 10 лет назад

Проект по оцифровке открыток «Пишу тебе» подготовил очередную тематическую подборку. На этот раз мы подобрали открытки, в которых есть поздравления…

07.01.2022

«Системный Блокъ»: лучшее за 2021 год

По традиции 31 декабря «Системный Блокъ» публикует подборку лучших материалов уходящего года. В 2021-м в подборке оказались спецпроект в духе…

31.12.2021

Знаете ли вы, как информационные технологии повлияли на общественно-политические процессы?

Реформы, перевороты, вооружённые конфликты, распад СССР… Все это происходило параллельно с развитием интернета и становлением массовой IT-индустрии. Как информационные технологии…

22.12.2021

Мне нужны твоя геолокация, камера и телефон: для чего ученым ваши фото птиц и растений

Что такое «гражданская наука» (citizen science)? Как определить редкий вид орхидеи? И зачем фотографировать углозубов? Читайте в новом материале СБъ

14.12.2021

«Интернет-среда влияет на политическую активность»: интервью с Ольгой Гулевич

Системный Блокъ поговорил с психологом Ольгой Гулевич, профессором департамента психологии НИУ ВШЭ о том, как психологи изучают поведение в цифровой…

03.12.2021

Как создать цифровой проект по публичной истории: опыт «Истории немцев ХМАО»

Участница НКО «Немецкая национально-культурная автономия города Ханты-Мансийска» Юлия Папанова рассказывает о цифровом проекте «История немцев ХМАО»: от замысла и сбора…

01.12.2021

Скажи «да» по-русски: зачем нужен «Прагматикон»

Многие говорят, что эффективный способ выучить иностранный язык – смотреть сериалы на этом языке. Если вы тоже пробовали такой метод,…

26.11.2021

Виртуальный «‎Город Гоголя» посетили аватары

С произведениями классика в интерпретации русских авангардистов и исследователя теперь можно познакомиться на онлайн-экскурсии по мультимедийному музею

11.11.2021

В школьных учебниках пересчитали березки и программистов

В Институте имени Пушкина создали технологию лингвистической оценки учебников. С ее помощью тексты цифрового Яндекс.Учебника сравнили с другими школьными пособиями…

01.11.2021

Толстой и Пушкин — сексисты? Корпусное исследование русской классики

«Системный Блокъ» писал об исследованиях того, как по-разному мужчины и женщины описывались в литературе XIX и XX веков. Сегодня перейдем…

18.10.2021

Как превратить текст в генеалогическое древо с помощью Python

Как понять, кем вам приходится сваха внучатого племянника вашей сестры? Проще всего - нарисовать генеалогическое древо, которое отразит все родственные…

11.10.2021

«Я совсем без денег»: о чем писали в открытках 120 лет назад

1 октября — Международный день открытки. В этот день в 1869 году австрийский экономист Эммануэль Херрман написал статью о том,…

01.10.2021

Цифровое искусство: как современные художники создают шедевры в TouchDesigner

Экспрессионизм обычно ассоциируется с Джейсоном Поллоком с его красочными разводами. Но создать подобное искусство можно и не пачкая рук. Рассказываем…

27.09.2021

Компьютер учит срамоту

Как обучить нейросеть генерировать жёлтые тексты в духе самых трешовых баннеров? Наш автор Иван Торубаров погрузился в глубины кликбейта и…

02.09.2021

«Да что они понимают»: как младенцы учатся говорить

В младенчестве нам предстояло выучить незнакомый язык на основе речи вокруг себя. Как мы осваивали язык и отделяли слова друг…

26.08.2021

«Кладмен мудак»: анализ тональности отзывов о запрещенных веществах

Язык интернета имеет свои характерные черты. И если исследованию языка Рунета посвящено множество работ, то DarkNet все еще остается серым…

18.08.2021

ИИ по классике: компьютер досочинил Десятую симфонию Бетховена

Людвиг ван Бетховен создал девять симфоний, а еще он успел набросать несколько заметок и к симфонии № 10. Рассказываем, как…

10.08.2021

История про людей: как устроены просопографические базы данных

Для исторической науки важны не только битвы, революции, переселения народов, смены экономических укладов и политических режимов. Важно еще понимать, кем…

27.07.2021

Как работает GPT-3 — самая продвинутая языковая модель

GPT-3 — самая известная из современных нейросетевых моделей языка. Вокруг нее много мифов, но модель действительно умеет впечатлить. Она отлично…

21.07.2021

UniLM — языковая модель для тех, кому мало BERT

Сегодня каждая большая IT-корпорация пытается сделать «еще более умную» нейросетевую языковую модель, которая решала бы сразу множество задач: и ответы…

13.07.2021

«Марь Иванна, у вас воротничок сине́ет»: исследование СБъ о зарплатах учителей

Сегодня в России более 1,3 млн учителей средних школ. «Системный Блокъ» решил узнать, насколько учитель средней школы в России подходит…

30.06.2021

Transkribus: как компьютерное зрение помогает переводить тексты сирийских мистиков

Сколько ваших знакомых без проблем смогут прочитать рукописи Пушкина? А петровскую скоропись? А рецепт своего лечащего врача? Чтобы разобрать написанное,…

15.06.2021

Как устроена нейросеть BERT от Google

BERT — нейросетевая модель-трансформер от Google, на которой сегодня строится большинство инструментов автоматической обработки языка. Модель появилась в начале 2018-го,…

09.06.2021

«Нравственное право» и «немеркнущая правда»: как речи президентов на 9 мая влияют на коллективную память

Мы проанализировали все речи президентов, которые произносились в честь 9 мая с 2000 года. О том, как эти выступления влияют…

31.05.2021

3D-моделирование разоблачило убийц Андрея Боголюбского

Ученые НИУ ВШЭ и РАН при помощи 3D-модели прочитали текст XII века на стене собора. В надписи перечисляются убийцы князя…

20.05.2021

Генеративное искусство: от калейдоскопа до машинного обучения

Со временем машины получают все больше способностей. Одной из них стало творчество. Произведения искусства, созданные автономными механизмами, существовали еще несколько…

13.05.2021

Программирование для филологов и нейропоэзия: интервью с Борисом Ореховым

Для чего филологу учиться программировать? Зачем учить нейросети писать стихи? Как мы опираемся на корпусные методы исследования языка в повседневной…

05.05.2021

Пообедать у Канта: калининградские ученые воссоздают дом философа в 3D

К грядущему 300-летию одного из самых цитируемых философов мира специалисты из Центра социально-гуманитарной информатики Балтийского федерального университета реконструируют дом своего…

21.04.2021

Ткани онлайн: как оцифровать полотно в 6 метров

Мы писали о том, как оцифровывают почти все, даже алтари. Но можно ли перевести ткани в цифровой формат? Разбираемся, как…

22.03.2021

От разобщенности к войне: что показывает сетевой анализ византийских писем

Может ли сеть средневековых писем рассказать исследователям о политических связях византийцев? Видно ли в ней наступление разобщенности элит, за которым…

03.03.2021

По словам их узнаете их: как вычисляли автора «Беовульфа»

Рассказываем, как одни ученые устанавливали авторство знаменитого древнеанглийского эпоса «Беовульф» при помощи статистики, а другие с ними спорили. Ведь научные…

15.02.2021

Определяем дату написания картины онлайн без регистрации и СМС

Научить нейросети понимать искусство пытаются уже много лет. И хотя про «понимание» говорить рано, некоторые задачи, ранее доступные лишь искусствоведу,…

09.02.2021

Посты о смерти: оценить нельзя игнорировать

Все видели мемы «Проспал дистанционку» с траурной свечкой, «Здоровья погибшим» и «Press F to pay respect»? Кому-то они покажутся циничными,…

01.02.2021

Опубликован открытый корпус европейских романов

Проект «Дальнее чтение для европейской литературной истории» выпустил собрание старых произведений. В коллекцию вошли 884 романа на 18 языках

28.01.2021

Как построить карту возрастов зданий на открытых данных: проект How old is this house?

Визуализация возраста зданий на карте — не новая идея, в том числе для Москвы. Подобную вещь несколько лет назад сделал…

20.01.2021

«Системный Блокъ» 2020: лучшие посты

В 2020 году Системный Блокъ опубликовал примерно 400 материалов, включая статьи, интервью, подкасты, видео и мемы. Сегодня мы собрали для…

31.12.2020

Пелопоннесская война и анализ данных: статистические модели для историков

При изучении прошлого ученые часто сталкиваются с нехваткой данных о событиях. Это вызывает проблемы при проверке подлинности фактов и ведет…

24.12.2020

Как сходить в Эрмитаж онлайн

Как посмотреть коллекцию одного из самых известных музеев мира, спланировать посещение или просто насладиться искусством, не тратя время на очереди…

08.12.2020

Социальный digital вместо нелегальных помидоров: интервью с соосновательницей IT-проекта для беженцев TaQadam

Платформа TaQadam — пример интеграции социальных задач и IT-предпринимательства. Рожденный в стенах ООН проект направлен на помощь одному из самых…

25.11.2020

«Цифровой антрополог отличается от Data Scientist’а вниманием к деталям»: интервью с Дарьей Радченко (КБ «Стрелка»)

COVID-19 изменил повседневные практики миллионов людей — и это видно по их «цифровым следам». Что говорят об эффективности весеннего карантина…

23.11.2020

Онлайн-выставки, цифровое кураторство и музейные IT: интервью с Владимиром Определеновым

Коронавирус повысил важность цифровой трансформации для музеев. Когда физический поход на выставку становится невозможен, остается надеяться на онлайн. Мы поговорили…

16.11.2020

Как работают трансформеры — крутейшие нейросети наших дней

Трансформер — самая модная сегодня нейросетевая архитектура. Она появилась в 2017 и перевернула всю обработку языка машинами. Мы расскажем о…

12.11.2020

Искусство до и после: как создать онлайн-выставку на Google Arts&Culture?

История диджитал-арта насчитывает уже не один десяток лет, но сегодня союз искусства и цифровых технологий вступает в новую фазу отношений.…

09.11.2020

Что хранит крупнейший онлайн-архив исторических документов Америки

Огромное количество исторических документов США теперь доступны онлайн в архиве Гилдера-Лермана. Разбираемся, как такие архивы помогают студентам, исследователям и всем…

06.11.2020

TEI: текстовый инструментарий, который смог

TEI (Text Encoding Initiative) – это формат кодирования текстов и отличная возможность перенести рукописи в удобный электронный вид. TEI используется…

28.10.2020

Маяковский и корпусный анализ: «несоветский» поэт Революции

Продолжаем серию постов о применении Sketch Engine в цифровой филологии на примере исследования текстов Маяковского. В прошлом материале мы узнали,…

21.10.2020

Sketch Engine и Маяковский. Часть I: человек до и после революции

Системный Блокъ уже рассказывал, как провести собственное корпусное исследование при помощи antconc и mystem. Теперь мы обратимся к другому инструменту…

14.10.2020

Реставрация картин: от вакуумных столов до машинного обучения

Разбираемся в том, как излечить хронически больные картины XIX столетия. Расскажем о методах реставрации картин: от клея из пузыря осетра…

10.10.2020

Русский 360°: виртуальный музей без границ

Русское искусство все быстрее переезжает в цифровой мир. Расскажем о виртуальных прогулках по Русскому музею — и о его цифровых…

08.10.2020

Осторожно: ретросимулякр! Советское прошлое в медиапроектах про 1968 год и Перестройку

Ностальгия по СССР подстерегает нас везде. Эту тему эксплуатируют многие, от эфирного ТВ до Лапенко. А мы разбираемся с механизмами…

30.09.2020

Цифровой гербарий МГУ: новая жизнь исторической коллекции растений

Второй по величине гербарий в России обрел цифровую форму. В свободном доступе более одного миллиона изображений с оригинальными оцифрованными этикетками…

28.09.2020

Покажи мне свой Spotify, и я покажу тебе, кто ты

«Spotify опоздал» — говорят одни. «Spotify — всего лишь один из многих!», — говорят другие. «Spotify неудобен» — говорят третьи.…

17.09.2020

Стереть нельзя оцифровать: эпиграфика открывает второе дыхание

Допустим, историк нашел древнюю надпись на скале — и хочет ее сохранить. Что делать? Классические методы: переписывание текста, зарисовка или…

14.09.2020

Над пропастью поржи: интервью с техноблогером Вастриком

Технологический блогер vas3k (в миру программист Василий Зубарев) известен всему просвещенному интернету как автор постов о машинном обучении, VR, машинном…

03.09.2020

Джеймс против Джойса: вычислима ли сложность художественной литературы

Измерение сложности текста — задача для компьютерной лингвистики не новая, и в этой области многое уже придумано. Но применимо ли…

25.08.2020

Цифровая этнография и «дьявольский значок» уведомлений

В книге «Жизнь онлайн: исследование реального опыта в виртуальном пространстве» цифровой этнограф Аннет Маркхэм показывает, как личность, социум и отношения…

20.08.2020

Стеклянные негативы блудного фотографа и другие приключения русских в американской библиотеке

Филиал России в Америке — это не только про русскую мафию или русских на Брайтон-Бич в Нью-Йорке. Это еще и…

12.08.2020

Поделись наушником своим: еще раз о том, как устроены рекомендации Spotify

О том, что в Россию пришел крупнейший в мире стриминговый сервис, не сказал только ленивый. Но чем же Spotify так…

10.08.2020

Что не скрывает Конгресс США?

Крупнейшая в мире библиотека Конгресса США ничего не скрывает, хотя многое хранит — и это не только книги, но и…

06.08.2020

Цифровой Ван Гог: на грани вечности

Некоторые знают об этом художнике благодаря легенде об отрезанном ухе. Другие вспоминают его единственную проданную картину «Подсолнухи». Есть те, кто…

29.07.2020

Лев Толстой онлайн: цифровые проекты о творчестве и жизни писателя

Каждый знакомится с литературным наследием Льва Толстого по-разному. Одни изучают его творчество одновременно с биографией, другие читают для себя, а…

21.07.2020

С миру по нитке — фельдшеру зарплата: финансирование здравоохранения в Москве в начале XX века

Врач — профессия, отношение к которым колеблется от тотальной демонизации до безусловного обожествления, однако за этическими и нравственными вопросами жизни…

13.07.2020

«Если бы по Евангелию жили бездумные роботы, они были бы одноглазые, однорукие и одноногие»

Как сочетаются компьютерные технологии и Церковь? Зачем настоятелю монастыря алгоритм дистрибутивной семантики word2vec? Исследовать церковные тексты количественными методами — это…

10.07.2020

Русский рэп через тематическое моделирование. О чем читает русскоговорящая хип-хоп сцена?

Кто такой русский рэпер, и о чем он читает? Пацан с района в трениках «три полоски», воспевающий «родных жульбанов»? Татуированный…

29.06.2020

Мы вытаскиваем людей из небытия: интервью с техническим руководителем ОБД «Мемориал» Виктором Тумаркиным

В России трудно найти семью, где не было бы родственника-участника ВОВ. Но многие почти ничего не знают о судьбе близких,…

22.06.2020

Мама мыла LSTM: как устроены рекуррентные нейросети с долгой краткосрочной памятью

Крафтовый техно-лонгрид издания Системный Блокъ, в котором мы разбираем по винтикам одну из самых ходовых технологий в современной компьютерной лингвистике…

17.06.2020

Системный Блокъ на самоизоляции

Как вы проводите время на самоизоляции? Наш урбанист Оля, например, встречается с друзьями в Zoom на кулинарных пятницах, куратор Ира…

03.06.2020

Вся классика в один клик: как выделить из текста события

Школьники, зависающие на сайтах с краткими содержаниями, многое бы отдали за чудо-ресурс, которому можно было бы отдать какое-нибудь художественное произведение…

16.05.2020

Разделить цену победы: кого, откуда и когда призывали в годы ВОВ?

В истории войны много неизвестных и спорных мест. К сожалению, до сих пор многие данные засекречены, ведутся споры о количестве…

09.05.2020

Кого учили иезуиты?

Орден иезуитов был передовым отрядом католической церкви в деле сопротивления Реформации. Иезуиты создали сеть школ и университетов по всей Европе.…

04.05.2020

Трудно быть ботом: как сделать чатбота с помощью DeepPavlov

Наряду с разработкой таких ботов-гигантов, как Алекса, Сири и Алиса, за которыми стоят крупнейшие IT-корпорации, появляются и доступные инструменты для…

29.04.2020

Идея для карантина: виртуальный хор

В 2009 году известный композитор, лауреат премии Грэмми Эрик Витакер придумал собрать людей со всего мира в виртуальный хор. Рассказываем,…

27.04.2020

Все переплетено: как распутать социальную сеть раввинской литературы

Что может рассказать об истории иудаизма социальная сеть мудрецов которые четыре века только и делали, что спорили?

21.04.2020

Компьютерный анализ Сезанна: что объединяет серию Купальщиков?

С помощью алгоритмов компьютерного зрения искусствоведы подтвердили теорию о том, что Поль Сезанн в своем творчестве пользовался математическими расчетами, а…

13.04.2020

Европейское культурное наследие онлайн

Пока границы закрыты, изучим возможности, которые предоставляют крупнейшие онлайн-коллекции объектов культурного наследия

08.04.2020

Как 3D-технологии воскресили Страстной монастырь

То место в центре Москвы, где сейчас находится Пушкинская площадь и главный в стране памятник Пушкину, почти три века занимал…

06.04.2020

«Прямо как в Plague Inc.» Что объединяет игры и фильмы про эпидемии

Какие общие тропы можно найти в Plague Inc., Pandemic и Left 4 Dead? Проводим сетевой анализ печально актуальной игры, в…

29.03.2020

В лес за большими данными: как ваши фотки белок и грибов помогут науке

Если у вас есть смартфон — вы можете почувствовать себя немного биологом и внести вклад в науку. Информатика биоразнообразия —…

25.03.2020

Как устроен шрифт Брайля и зачем его распознавать

Брайлевский шрифт придумали для передачи военных секретов, а в итоге он пригодился незрячим. Как устроен Брайль, зачем на нем пишут…

16.03.2020

Fembot’s tale: как виртуальным помощникам добиться равенства с людьми

На наших глазах происходит один из первых кибер-витков истории человечества. Виртуальные помощники выходят из зоны покорных слуг и обретают больше…

06.03.2020

Корпус для всех: как используют НКРЯ

Кому и почему «важно, чтобы корпус жил»? Системный Блокъ узнал, как применяют Национальный корпус русского языка: от школьных исследований до…

05.02.2020

Многомерное «Слово о полку Игореве»: от кукушки до алкогольного брендинга

Когда мобильный интернет был экзотикой, а отчёты по грантам сдавали на 3,5-дюймовых дискетах... в Рунете уже были цифровые гуманитарные проекты!…

03.02.2020

Невидимые кинозвезды: как Голливуд не замечает женщин-режиссеров

В 2010 году «Оскар» за лучшую режиссуру впервые получила женщина — Кэтрин Бигелоу с фильмом «Повелитель бури». Стали ли после…

20.01.2020

Код «Мастера и Маргариты»

Как устроен шедевр Булгакова: анализируем роман «Мастер и Маргарита» с помощью методов цифрового литературоведения

09.01.2020

Зрение, мозг и нейросети

Как ученые пытаются понять по активности мозга, что видит человек, и при чем тут машинное обучение

23.12.2019

Где учить Python: обзор онлайн-курсов от «Системного Блока»

Научиться программировать мечтают многие, но как выбрать подходящий курс из сотен доступных вариантов? Мы сделали обзор курсов по Python, которые…

17.12.2019

Ищем смыслы: как сделать тематическое моделирование корпуса текстов

Тематическое моделирование — легкий способ понять смысловой состав большой коллекции текстов, которую невозможно быстро прочесть глазами. Пользоваться инструментами тематического моделирования…

06.12.2019

Разбираем нейросети по частям: как работает градиентный спуск

Градиентный спуск — это способ поиска точек минимума или максимума в сложных функциях. Рассказываем, почему это так важно для обучения…

20.11.2019

Разбираем по частям научно-популярные ресурсы

Научпоп стремительно обзаводится почитателями по всему миру. Какие ученые хотят рассказать о своей работе больше всего, что ресурсы и паблики…

04.11.2019

Соцсети русской драмы, часть II Ревизор vs. Городничий: кто же главный герой?

Как, сколько и с кем общаться, чтобы стать по-настоящему главным героем пьесы — отвечает математика

30.10.2019

Семантические сети: как представить значения слов в виде графа

Компьютерные лингвисты из Вышки, университета Тренто и университета Осло разработали vec2graph — инструмент для визуализации семантической близости слов в виде…

28.10.2019

Нейросеть-предатель: алгоритм обучили выявлять тексты-подделки

Нейросети научились неплохо подражать человеку в написании текста. Но теперь есть симметричный ответ: системы обнаружения текста, порожденного нейросетями. Запасаемся попкорном…

15.10.2019

Перенос стиля нейросетями: Дрейк, Летов, Оксимирон

Авторский стиль тяжело определить формально — это целый комплекс деталей, которые заметны человеческому глазу, но могут ускользнуть от компьютера. Указать…

11.10.2019

Соцсети русской драмы, часть I: основы сетевого анализа

Сегодня модно исследовать художественную литературу методами анализа социальных сетей. Мы начинаем серию постов по сетевому анализу русской драматургии. В первом…

04.10.2019

Компьютерные языки музыки, часть II

Мы продолжаем цикл постов о компьютерных языках, используемых для передачи музыки. Сегодня рассказываем о принципиальных отличиях музыки от других видов…

02.10.2019

Тест Тьюринга для киберпоэтов

Как обычный «слепой тест» по отделению машинной поэзии от той, что написана людьми, приводит ученых к философскому спору об относительности…

12.09.2019

Накануне войны: что можно увидеть в сети родства монархов Европы 1914 года

Как соотносятся семейные связи европейских монархов начала XX века с их вероисповеданием? Сказалось ли родство на выборе стороны в Первой…

30.08.2019

Говорящий мозг

Ученые сумели перевести электрические импульсы коры мозга в звучащую речь. Это может стать прорывом в лечении речевых расстройств и поддержке…

11.03.2019

Обратная сторона навигаторов: куда нас ведут электронные карты и что с этим бывает не так

«Лучше пешком», — говорим мы себе летом и выбираем прогулки непривычными маршрутами. А если путь не знаком — поможет приложение-навигатор.…

10.06.2026

ИИ-компании готовятся к IPO, новые модели от Google и Microsoft

SpaceX, Anthropic и OpenAI готовятся стать публичными компаниями, Google и Microsoft выпустили новые модели — рассказываем, что произошло в мире…

09.06.2026

Как Япония оцифровывает повседневность и почему это важно

Японская культура повседневности отличается вниманием к визуальной эстетике, типографике и деталям коммуникации. Поэтому даже самые обычные документы — билеты, рекламные…

05.06.2026