ИИ для исследователей открывает новые горизонты в работе с данными: от поиска научных публикаций до анализа больших массивов информации. Своим опытом делятся главный редактор «Системного Блока» Даниил Скоринкин, автор «Системного Блока» Анастасия Жук и преподаватель Тимур Хусяинов.
Systematic Literature Review (SLR) — выявление и оценка всей релевантной литературы по теме для формирования выводов по рассматриваемому вопросу. Для чего это необходимо?
Цель SLR — формализованный методологический подход для уменьшения искажений, вызванных чрезмерно ограничительным отбором доступной литературы, и для повышения надежности отобранной литературы.
Может использоваться для поиска идеи исследования, выбора темы и ее уточнения. Получаемые ответы представляют собой реальные статьи, проверенные или сгенерированные языковой моделью.
Что мы можем здесь найти?
Для сужения темы можно скопировать заинтересовавшее название в новый блокнот и задать исследовательский вопрос. Также есть возможность добавлять колонки для автоматической идентификации пробелов в исследованиях (gaps) и участников.
Автор: Анастасия Жук
Сервис помогает найти связанные с указанной темой статьи. Поиск возможен по количеству цитирований (top-shared citations) и ссылкам (references). Также доступен поиск по самым цитируемым авторам в выбранной сфере (common authorship patterns).
В платной версии сервис синхронизируется с Zotero. В бесплатной интегрирован поиск по DOI, названию и другим идентификаторам.
Возможно также импортировать статьи вручную.
Cервис помогает определить статьи «предшественники» и «преемники». Поиск осуществляется по теме исследования. Также присутствует возможность загрузки: list view — download. Так выглядит демонстрационный датасет:
Автор: Анастасия Жук
Meetcody — чат-бот, которого вы можете натренировать отвечать на вопросы на основе загруженных в него работ.
Как это сделать?
Typeset.io — “scispace” / «научная база данных» для работы с научной литературой. Задайте вопрос по теме и получите ответ будет на основании топ-5 работ. Вы также можете получить краткое описание других релевантных работ по вашей теме в формате таблицы.
Также есть возможность работать с определенной работой: upload paper — co-pilot (задавать вопросы по конкретной работе).
Наконец, сервис может объяснять непонятные фрагменты статьи, графики, математические формулы.
Фактически — это комбинация всех рассматриваемых ранее инструментов.
Автор: Анастасия Жук
Сервис дает научно обоснованные ответы на заданные вопросы. Поддерживает русский язык.
Рекомендация: сервис лучше всего работает с закрытыми вопросами.
Данный сервис является аналогом Consensus.app, но, в отличие от Consensus, предоставляет результаты в различных сферах, а не только в науке.
В сервисе также есть режим «фокуса», который позволяет настроить определенную фильтрацию. Например, использовать только подтвержденные данные, только данные со ссылками или только научные работы.
Автор: Анастасия Жук
Я обращаюсь к нейросетям для правильного оформления списка литературы (источников).
Оформи ссылки по примеру.
Пример:
1. ADEDZE, Agbenyega, “Commemorating the Chief: The Politics of Postage Stamps in West Africa,” African Arts, 37, 2 (2004): 68-73, 96.
2. “Re-Presenting Africa: Commemorative Postage Stamps of the Colonial Exhibition of Paris (1931),” African Arts, 37, 2 (2004): 58-61, 94-95.
3. “Domination and Resistance through the Prism of Postage Stamps,” Afrika Zamani, 17 (2009): 227-246.
4. “Visualizing the Game: the Iconography of Football on African Postage Stamps,” Soccer & Society, 13, 2 (2012): 294-308.
5. AHMAD, Feroz, “Postage Stamps, Politics and Ideology in the Late Ottoman Empire,” in Feroz AHMAD, From Empire to Republic vol. 2 Essays on the Late Ottoman Empire and Modern Turkey (Istanbul: Bilgi University Press, 2008).
То, что нужно оформить (на русском и с транслитерацией):
278. Пермякова П.В., Хусяинов Т.М. Почтовая открытка как источник по изучению истории Выборга и его жителей начала XX века: по материалам цифрового корпуса «Пишу тебе» // Страницы Выборгской истории. Книга восьмая. Выборг, 2024. С. 154-163.
277. Хусяинов Т.М. Почтовая коммуникация и повседневность жителей Гродно на рубеже XIX-XX веков (на материалах цифрового корпуса почтовых открыток «Пишу тебе» // Социальные, культурные и коммуникативные практики в динамике общественного развития : сб. науч. ст. / ГрГУ им. Янки Купалы ; редкол.: В. А. Белозорович (гл. ред.) [и др.]. – Гродно: ГрГУ, 2024 – С. 332-336.
276. Динамика коммуникативных практик в почтовой переписке (на материале корпуса «Пишу тебе»): монография / В. А. Куликова, Т. М. Хусяинов, П. А. Шкунов, А. К. Айсина, П. В. Доможирова, А. А. Карнаухов, М. С. Журавлева, П. В. Пермякова, Ю. Д. Мусинова; Под ред. В. А. Куликовой, Т. М. Хусяинова. – М.: Издательство РОИФН, 2024. 258 с.
275. Хусяинов Т.М. Почтовые открытки в рамках современных практик психологических интервенций у различных категорий // Современная реальность в социально-психологическом контексте – 2024: сборник научных трудов / под науч. ред. А. Л. Журавлева, О. А. Белобрыкиной, М. И. Кошеновой; Министерство просвещения Российской Федерации, Новосибирский государственный педагогический университет. – Новосибирск : Изд-во НГПУ, 2024. С. 188-191.
Я обычно за один раз оформляю как русскоязычные, так и англоязычные источники. Принцип, таким образом, довольно простой: присылаешь пример оформления, а затем перечень источников, которые необходимо оформить.
Автор: Тимур Хусяинов
Передо мной стояла задача переформатировать информацию из файла Word в Excel; при этом структура сильно отличалась. Сами данные — это ревизская сказка одной из деревень Костромской губернии за 1850 год. В дальнейшем ее надо было загрузить на сайт Familio. Так как я уже несколько лет занимаюсь генеалогической реконструкцией по этому району, то накопилось много материалов, и сделать их общедоступными — это помочь большому кругу потенциальных исследователей. В процессе решения задачи было использовано две нейросети: ChatGPT и DeepSeek. В результате второй справился лучше, быстрее поняв суть задачи и выдав верный результат.
Задача выполнялась с помощью нескольких промптов.
Привет! У меня есть образец документа в Excel и данные для заполнения в Word, можешь сделать?
Образец:
Оглавление
Лист со списком населённых пунктом очень важен в шаблоне индексации.
Лист с персонами из ревизии в шаблоне
Перечисление персон из ревизской сказки
Ревизская сказка — это документ, содержащий результаты проведения подушных переписей податного населения Российской империи в начале XVIII — XIX веков. Ревизские сказки проводились с целью налогообложения и представляют из себя поимённые списки населения с указанием фамилии (при наличии), имени, отчества главы семьи, его возраст, и имена, отчества членов семьи с указанием возраста, отношения к главе семьи.
Данный он предназначен для индексации ревизских сказок. Шаблон для индексации ревизских сказок выполнен в табличном редакторе Excel. Файл с оцифрованной ревизской сказкой можно хранить локально на компьютере, делиться файлом с другими исследователями, в Excel можно легко осуществлять поиск и фильтрацию, а также структура файла сделана в формате, удобном для дальнейшего внесения в «Справочники Familio».
Вся основная информация описана во вкладке «INFO» шаблона. Табличный редактор Excel удобен тем, что некоторые данные можно использовать как «список» и при наборе выбирать данные из него, а не набирать. Это также позволяет избежать опечаток.
Индексирующий сам вносит основные данные о документе и о себе. Индексацию можно сделать по нескольким годам, а можно по 1 году. Если РС за один год, то неплохо бы заполнить все данные о архивном документе, чтобы они также прописались у каждой персоны на сайте. Во вкладке «spiski» прописывается перечень чинов и статусов персон. «Пол» уже заполнен.
Вспомогательные листы для набора в шаблон индексации ревизских сказок. Лист «about». Лист со списком населённых пунктом очень важен в шаблоне индексации.
Для привязки записей о персонах к населённым пунктам на сайте необходимо будет составить список н.п. в листе «location» с привязкой к «Местам» Familio.
Один нас.пункт точно будет по месту составления ревизии. Но также очень часто людей переводили из других н.п. или в другие н.п., название указано и его точно можно определить на карте. Тогда одна запись по персоне может быть привязана минимум к одному н.п. или к двум, трём. Не обязательно заполнять «волость» или «уезд» если вы не знаете, но от того как заполните зависит что будет написано у персоны на сайте, а от URL — к какому населённому пункту пойдёт привязка.
Непосредственно привязка к н.п. позволит из справочника на сайте переходить от записей по персонам к н.п. и наоборот, персоны будут появляться в населённых пунктах, по ним можно будет вести поиск или эти «справочные записи» связывать со своими персонами в древе.
Если какого то населённого пункта нет в базе мест Familio, но у вас есть карта или иная информация, позволяющая точно определить это место, то вы можете написать в любом чате Familio сообщение с хэштегом #хочунп и запросом на добавление. Список чатов находится здесь: chat.familio.org
Лист с персонами из ревизии в шаблоне
Шаблон для заполнения информации о персонах, указанных в ревизии, сделан максимально подробным. Архивный шифр дела и листов, для того чтобы желающие всегда могли обратиться к источнику. Населённый пункт составления ревизской сказки выбирается из списка листа «location».
Одна персона в ревизии — одна строка в Excel. Члены одной семьи (двора) все с одним номером двора/семьи, и каждый уже внутри двора имеет свой порядковый номер. Общий номер двора/семьи позволит все персоны с единым номером связать в общий блок на сайте. Нумерация персон внутри семьи также позволяет указывать родственные связи.
При наличии в одной переписи персон нескольких помещиков — есть возможность указать к какому помещику относятся переписываемые персоны.
Архивный шифр и нумерация персон одной семьи в шаблоне ревизской сказки
Перечисление персон из ревизской сказки. Построчно вносятся ФИО «участников переписи», их пол. Для понимания связей внутри семьи используется указание степени родства и номера по списку того члена семьи, к которому относится указанное родство. Саму связь можно указывать на своё усмотрение от «сын» (номера 1) до «сын Василия Яковлева» (номер 1).
Далее указывается возраст на текущую ревизию и возраст на прошлую ревизию (если таковой записан). В некоторых более поздних ревизиях указывается точная дата рождения и для этого предусмотрены отдельные поля.
Очень часто указана информация о переводе людей из других населённых пунктов, тогда указана причина перевода и очень часто название н.п.. Аналогично с местом, куда персоны переводят. Как уже сказано ранее, если удаётся определить название места по «Местам» на сайте Familio, то лучше это сделать, т.к. тогда запись о персоне будет видно среди персон и одного нас.пункта и другого. Исходя из указанного возраста и года ревизии высчитывается примерный год рождения персон и при наличии записи о смерти в определённом году в столбцах убытия — прописывается год смерти.
Есть поле для пометок или комментариев, которые указаны непосредственно в ревизской сказке (например о на всю семью может быть указано примечание в стиле «эта семья получена от помещика такого-то в таком то году…) и если примечание для всей семьи, то повторить текст пометки нужно в каждой строке всех членов семьи. А также есть поле для «авторского комментария наборщика», куда можно внести любые дополнения «от себя», например указать что не разобрали фамилию, что утрачена часть текста и т.д.
| Семья | Крестьяне | Возраст по последней ревизии | Выбыли | Возраст на момент ревизии |
| 1 | Степан Николаев | 28 | 44 | |
| Степана Николаева жена Афросинья Филиппова | — | 44 | ||
| сын Петр Степанов | 5 | 21 | ||
| Петра Степанова жена Каптелина (^Капитолина) Андреева | — | 20 | ||
| сын Николай Степанов | 2 | 18 | ||
| дочь Арина Степанова | — | 15 1/2 | ||
| 2 | Конон Ефимов | 18 | Отдан в рекруты в 1841 г. | |
| Конона Ефимова мать Дарья Леонтьева | — | 64 | ||
| Конона Ефимова брат Агап | 4 | 20 | ||
| Агапа Ефимова жена Варвара Матвеева | — | 18 | ||
| 3 | Иван Карпов | 30 | 46 | |
| сын Лукьян Иванов | 2 | 18 | ||
| сын Василий Иванов | новорожденный | 14 1/2 | ||
| дочь Марина Иванова | — | 11 | ||
| дочь Оксинья Иванова | — | 6 1/2 | ||
| Лукьяна Иванова жена Маремьяна Феодулова | 17 |
DeepSeek лучше понял структуру таблицы и в целом правильнее справился с задачей, чем ChatGPT. Затем нейросеть (ChatGPT) задала уточняющие вопросы по таблице. И ChatGPT, и DeepSeek сделали требуемое по 2-3 семьям из 18. Первый сделал 3, второй — 2, после чего оба спросили, нужно ли сделать то же самое по остальным. Ниже даны вопросы нейросети и мои ответы на них.
Год ревизии — это 1850, как указано в документе. Подтверди, пожалуйста? Да.
Населённый пункт: деревня Дубовик, Замерская волость, Галичский уезд, Костромская губерния — правильно ли я понимаю, что именно это место нужно указать в листе location? Да.
В документе есть указания о переводе, выбытии, смерти — нужно ли всё это заносить в шаблон? Например: «Отдан в рекруты в 1841 г.», «Умер в 1843 г.», «Переведен из Буйского уезда деревни Устинова». Да, в комментарии.
Пол и родственные связи — можно ли определять автоматически по имени и описанию (например, «жена», «сын» и т.д.)? Да.
Нужно ли указывать архивный шифр или оставить поле пустым (если в Word его нет)? Государственный архив Костромской области, фонд 200, опись 14, дело 42, листы 110-115об.
У некоторых персон есть указания типа «новорожденный», «1/2 года», «14 1/2» и т.д. — сохраняем это как есть, или округлять возраст до целого числа? Округляем.
Сделай CSV по примеру. Пример: таблица-шаблон в формате txt
Затем я перенес результат в Excel. За 3 промпта нейросеть справилась с этой задачей. Единственная проблема, которую мне удалось обнаружить, — формат ячеек не везде подходит данным. Но это удалось исправить уже вручную.
Автор: Тимур Хусяинов
Я использую ChatGPT для написания кода. Например, у меня есть датасет с частотностями слов в разных книгах. Я прошу нейросеть написать мне код, который делает такую визуализацию, чтобы каждая книга была трехмерным вектором трех верхних частотностей. Задача выполняется в 4 промпта.
Hey, I have data on word frequencies in certain novels in csv format (see attached). Each novel is a column, each word — a row. Write a python code to visualize novels as points in 3-dimensional space, where the dimensions would come from the frequencies of selected words.
(У меня есть данные о частоте встречаемости слов в некоторых романах в формате csv (см. вложение). Каждый роман — это столбец, каждое слово — строка. Напиши код на python для визуализации романов в виде точек в 3-мерном пространстве, где размерность будет определяться частотой выбранных слов).
Затем прошу ChatGPT использовать кодирование по цветам для визуального разграничения Толстого и Достоевского.
Can you use colors to differentiate Tolstoy and Dostoevsky?
Я попросил изменить код — так, чтобы сетка была белого, а не серого цвета.
Can we alter the code so that the grid behind is white and not grey?
Уточняю, как можно дифференцировать маркеры.
Is there also a possibility to differentiate the markers? Now both are the same shape, I’d love to change them
Автор: Даниил Скоринкин
ChatGPT выполняет задачи по разметке текста. Например, мне понадобилась разметка прямой речи в тексте с указанием говорящего и адресата реплики.
Hello. You are a native speaker of Russian and an assitant in manual text markup. You will be marking up all instances of direct speech in Russian texts. You will need assign a speaker (i.e. concrete speaking character) to each direct speech instance, and, whenever it is known, assign an addressee of the speech (i.e. the character to whom the speech is addressed). But you should not assign an addressee if there is no clear addressee or the character speaks to himself. The output should be in JSON format. Please do not omit any speech text. Here is an example input:
Раздался звонок. В дверь. Калям спрыгнул с тахты и, задрав хвост, поскакал в прихожую. Малянов аккуратно положил ручку.
– С цепи сорвались, честное слово, – произнес он.
В прихожей Калям описывал нетерпеливые круги и орал, путаясь под ногами.
– Ка-ал-лям! – сказал Малянов сдавленно-угрожающим голосом. – Да Калям, пошел вон!
Он открыл дверь. За дверью оказался плюгавый мужчина в кургузом пиджачке неопределенного цвета, небритый и потный. Слегка откинувшись всем корпусом назад, он держал перед собою большую картонную коробку. Бурча нечленораздельное, он двинулся прямо на Малянова.
– Вы… э… – промямлил Малянов, отступая.
Плюгавый был уже в прихожей – глянул направо в комнату и решительно повернул налево в кухню, оставляя за собой на линолеуме белые пыльные следы.
– Позвольте… э… – бормотал Малянов, наступая ему на пятки.
Мужчина уже поставил коробку на табурет и вытащил из нагрудного кармана пачку каких-то квитанций.
– Вы из ЖЭКа, что ли? – Малянову почему-то пришло в голову, что это водопроводчик наконец явился – чинить кран в ванной.
– Из гастронома, – сипло сказал мужчина и протянул две квитанции, сколотые булавкой. – Распишитесь вот здесь…
– А что это? – спросил Малянов и тут же увидел, что это бланки стола заказов. Коньяк – две бутылки, водка… – Подождите, – сказал он. – По-моему, мы ничего…
Он увидел сумму. Он ужаснулся. Таких денег в квартире не было. Да и вообще с какой стати? Охваченное паникой воображение мигом выстроило перед ним удручающую последовательность всевозможных сложностей, вроде необходимости оправдываться, отпираться, возмущаться, призывать к здравому смыслу… звонить, наверное, куда-нибудь придется, может быть, даже ехать… Но тут на углу квитанции он обнаружил фиолетовый штамп «Оплачено» и сразу же – имя заказчика: Малянова И.Е. Ирка!.. Ни черта понять невозможно.
– Вот тут расписывайтесь, вот тут… – бурчал плюгавый, тыча траурным ногтем. – Вот где птичка стоит…
Малянов принял от него огрызок карандаша и расписался.
– Спасибо… – сказал он, возвращая карандаш. – Большое спасибо… – обалдело повторял он, протискиваясь рядом с плюгавым через узкую прихожую. Дать ему надо бы что-нибудь, да мелочи нет… – Огромное вам спасибо, до свидания!.. – крикнул он в спину кургузому пиджачку, ожесточенно отпихивая ногой Каляма, который рвался полизать цементный пол на лестничной площадке.
Потом Малянов закрыл дверь и некоторое время постоял в сумраке. В голове было как-то все неясно.
– Странно… – сказал он вслух и вернулся на кухню.
For that example input, here is an example output:
[
{
«speaker»: «Малянов»,
«speech»: «С цепи сорвались, честное слово»
},
{
«speaker»: «Малянов»,
«speech»: «Ка-ал-лям!»,
«addressee»: «Калям»
},
{
«speaker»: «Малянов»,
«speech»: «Да Калям, пошел вон!»,
«addressee»: «Калям»
},
{
«speaker»: «Малянов»,
«speech»: «Вы… э…»,
«addressee»: «Мужчина с коробкой»
},
{
«speaker»: «Малянов»,
«speech»: «Позвольте… э…»,
«addressee»: «Мужчина с коробкой»
},
{
«speaker»: «Малянов»,
«speech»: «Вы из ЖЭКа, что ли?»,
«addressee»: «Мужчина с коробкой»
},
{
«speaker»: «Мужчина с коробкой»,
«speech»: «Из гастронома, Распишитесь вот здесь…»,
«addressee»: «Малянов»
},
{
«speaker»: «Малянов»,
«speech»: «А что это?»,
«addressee»: «Мужчина с коробкой»
},
{
«speaker»: «Малянов»,
«speech»: «Подождите, По-моему, мы ничего…»,
«addressee»: «Мужчина с коробкой»
},
{
«speaker»: «Мужчина с коробкой»,
«speech»: «Вот тут расписывайтесь, вот тут… Вот где птичка стоит…»,
«addressee»: «Малянов»
},
{
«speaker»: «Малянов»,
«speech»: «Спасибо… Большое спасибо… Огромное вам спасибо, до свидания!»,
«addressee»: «Мужчина с коробкой»
},
{
«speaker»: «Малянов»,
«speech»: «Странно…»
}
]
После этого я присылаю ChatGPT текст для создания разметки.
Автор: Даниил Скоринкин
«Системный Блокъ» выражает благодарность Анастасии Жук, Тимуру Хусяинову и Даниилу Скоринкину за предоставление промптов, текста и фотоматериалов.
Восковая скульптура Микеланджело, которую нельзя выставлять в тепле. Средневековый французский ковёр длиной 70 метров, который невозможно рассмотреть целиком. Египетские саркофаги,…
Малярия — одна из самых страшных болезней, которая веками отнимала силы и жизни у миллионов людей. Уже жителям Римской империи…
Принцип Смурфетты — это ситуация, когда среди мужских персонажей фильма есть только одна героиня. Ее образ — это стереотипное представление…
Что общего между ДНК-маркерами, прогностическими моделями и дронами с мультиспектральными камерами? Все это — инструменты селекции, которая за последние два…
Как ИИ изменит общество и образование? Что в школе будущего должен делать учитель, а что — тренажер? Почему в XXI…
Историки и биологи давно исследуют прошлое человечества вместе. С недавних пор к ним присоединились палеогенетики и биоинформатики. Их методы позволяют…
В художественных произведениях часто упоминаются исторические личности. Что будет, если посмотреть на русскую литературу XIX века через упоминания реальных людей?…
Подводим итоги и рассказываем о самых важных событиях в мире ИИ за прошедший год
За что и как наказывали людей в прошлом? Как судебные архивы превращаются в базы данных, а историки — в дата-аналитиков? Чем историкам права помогают цифровые методы? На примере проекта The…
Мы привыкли, что на месте преступления ищут отпечатки пальцев, следы обуви и человеческую ДНК. Но сегодня вещественным доказательством может стать…
Как Север может оказаться южнее Москвы? С какими сложностями сталкивается исследователь языков и народов Арктики? Где лучше искать носителей чукотского…
Прогресс больших языковых моделей через увеличение их размеров застопорился: их масштабирование уже почти не дает прироста качества. Выход ищут в…
Когда в СССР пластинки с западной музыкой оказались под запретом, меломаны нашли неожиданный выход. Вместо винила они использовали... медицинские рентген-снимки.…
Почему ваши файлы на компьютерах и смартфонах до сих пор лежат в «папках»? Все началось с бухгалтеров XIX века и…
Как «разложить» все книги мира на одной гигантской полке? 📚 Оказывается, для этого достаточно внимательно посмотреть на коды ISBN. Рассказываем,…
Драконы, духи и герои древних легенд теперь не бродят по туманным мирам — они появляются на картах. Современные базы данных…
Как работает поиск изображений по текстовым описаниям? Как это связано с генерацией изображений? Как языковые модели «понимают» не только текст,…
Искусственный интеллект повсюду: заменяет врачей, ищет нефть, а инженеры разрабатывают специальные чипы для машинного разума. Звучит как заголовки из 2025…
ЕГЭ — нервное событие, а подготовка к экзаменам — долгая и сложная. На помощь ученикам и учителям приходят сервисы на…
DeepSeek — новая китайская нейросеть, вызвавшая фурор как среди простых пользователей, так и специалистов. Некоторые даже окрестили ее «убийцей ChatGPT».…
Исследование мест массовых убийств позволяет высветить обстоятельства и корни преступление против человечности, а также делает нас свидетелями прошлого. Современные технологии…
Геоглифы Наски известны людям с XVI века — о них упоминали конкистадоры, которые проходили через пустыню. Тем не менее научное…
Средневековые студенты часто перемещались из одного университета в другой, чтобы получить всестороннее образование и ученую степень. Все это, наряду с…
Могут ли новые технологии помочь прочесть нечитаемую древнюю надпись на камне? Как трехмерные модели старинных надгробий, крестов, камней и эпиграфических…
Болезни Альцгеймера подвержены миллионы людей по всему миру, и с каждым годом число заболевших продолжает расти. Однако традиционные методы диагностики…
Борис Ярхо — один из самых недооцененных филологов знаменитого поколения «русских формалистов» 1910-х — 1920-х. В отличие от куда более…
Язык — естественная система. Он распространяется, развивается и даже мутирует, подчиняясь законам естественных наук. Можно ли с его помощью реконструировать…
Современные технологии хорошо помогают в криптоанализе: программы, перебирающие тысячу вариантов за несколько секунд, в разы превосходят возможности человека. Однако слепого…
В 2024 году «Системный Блокъ» опубликовал 180 материалов. В этом посте мы рассказываем о наших итогах года: о запуске новых…
Петроглифы — небольшие древние наскальные изображения — часто сложно датировать и атрибутировать. При этом для некоторых рисунков может быть очень…
Хотите смоделировать процесс эволюции или работу человеческого глаза? Не можете разобраться в баллистике? Тогда воспользуйтесь интерактивным симулятором. Мы собрали самые…
Куда развивается искусственный интеллект и какие новые умения он приобретет в ближайшем будущем? Что делать с тем, что коммерческие продукты…
23 года назад вышел фильм «Пароль “Рыба-меч”» — знаковая лента о хакерах с Джоном Траволтой. Это не только первый массовый…
Как Линней придумал таксономию живых организмов, в чём польза игральных карт для каталогизации знания и сколько человек нужно, чтобы описать…
Информация бесполезна, если мы не знаем, как и где её найти. С появлением книгопечатания проблема упорядочивания выпущенных книг занимала учёных…
Популярная музыка транслирует социальные нормы. Чем популярнее музыка, тем больше людей могут себя с ней соотнести. На какие детали быта…
Как в СССР возник машинный перевод? Чем нетрадиционная лингвистика отличается от традиционной? Почему эмиграция иногда становится спасением жизни? Об этом…
Эйнштейн объясняет старшеклассникам теорию относительности. Маяковский читает стихи у доски. Ученик «обменивается» телом с учителем, а у педагогов остаётся время…
По данным ООН, закрытие школ во время пандемии, сокращение и автоматизация рабочих мест отодвинули равноправие женщин и мужчин на 31…
Продолжаем наше руководство по анализу текста с помощью Voyant Tools. В прошлом материале мы рассказали, как загрузить и подготовить корпус.…
Филологи уже долгое время подозревают, что одна из пьес чешского драматурга Карела Штайгервальда на самом деле принадлежит перу Милана Кундеры.…
Может ли работа с данными помочь в борьбе с коррупцией? «Системный Блокъ» выяснил, какие цифровые сервисы и проекты занимаются антикоррупционной…
Как отделить язык от диалекта? Должна ли вся страна говорить на одном «стандартном» языке и какие преимущества есть у использования…
Где можно найти настольную игру, иронизирующую над перестройкой, матрёшку с мордой собаки Стрелки и сборник суеверий из XVIII века? Рассказываем…
Как примирить сторонников количественных и качественных исследований культуры? Как исследователям фольклора помогают цифровые базы данных? О чём могут рассказать лозунги…
Идиостиль — это авторский стиль писателя. И если на небольших стихах его изучать удобно, то вот на текстах Льва Толстого…
Стилометрия — количественный метод определения авторства, который проверен на десятках современных языков. А что там с языками древними? Историк философии…
Какие советские ученые стоят у истоков исторической информатики? Как математические методы позволяют моделировать исторические процессы? Как складывались отношения российских исторических…
Статья Агаты Холобут и Яна Рыбицкого The Stylometry of Film Dialogue: Pros and Pitfalls показывает связь между жанровыми особенностями кино…
В конце 60-х гг. не только США разрабатывали компьютерные сети. В СССР также строили грандиозные планы по созданию системы, которая…
Цифровые филологи научились «измерять стиль»: у «Системного Блока» есть подборка статей о стилометрии и гайд о том, как провести собственное…
Представляем результаты авторского цифрового исследования: граф социальных связей персоналий Серебряного века на основе материалов проекта «Устная история». Центральная фигура —…
Как связаны имена Блока и Гумилёва с историей крупнейшей коллекции этнографических аудиозаписей? Когда исполнители перестали бояться раструба фонографа? Что происходит,…
Владимир Набоков известен тем, что писал и на русском, и на английском. Сможет ли компьютер распознать его оригинальный стиль? Этот…
Стилометрический анализ позволяет определить, принадлежат ли тексты одному и тому же автору. Но что если писатель творит под несколькими литературными…
Может ли машина писать мелодии, разговаривать с музыкантом во время выступления и руководить групповым танцем? В середине прошлого столетия последователи…
Исследователи-филологи, занимающиеся древними текстами, давно используют компьютерную обработку текста. Но арабистика пока лишена многих цифровых инструментов текстового анализа. Рассказываем, почему…
Современный мир захлестнула цифровизация. Это не обошло стороной, в том числе, и институции культурного наследия, которые начали массово переводить свои…
Проблема домашнего насилия — одна из наиболее острых социальных проблем в современной России. А вопрос о достоверной статистике по этой…
За последние годы появилось много возможностей исследовать русскую культуру, не выходя из дома. Сейчас для этого нужен лишь компьютер либо…
Исторические игры регулярно попадают в десятку самых продаваемых видеоигр в разных странах, а опирающаяся на всемирную историю Assassin's Creed —…
Ранее мы рассказывали про цифровой анализ речи героев «Войны и мира». В этом материале с помощью сетевого анализа разбираемся, как…
Наверняка вы когда-нибудь слышали о группе «Король и Шут». Даже, если вы не преданный фанат, то мы почти уверены, что,…
Что такое языковая модель? Что общего между клавиатурой вашего телефона и GPT? Почему языковые модели умеют не только моделировать язык?…
Кирилл Маслинский — цифровой филолог, руководитель Лаборатории цифровых исследований литературы и фольклора в Пушкинском Доме, создатель Детского корпуса и Репозитория…
Исторические сокровища, ранее доступные лишь немногим, впервые появились в сети благодаря проекту «Книжные памятники». Мы расскажем, как и зачем происходит…
Национальный корпус русского языка (НКРЯ) — важнейший инструмент любого исследователя, который занимается русским языком, русской литературой и вообще русской словесной…
В конце 80-х годов опасения, что госструктуры будут контролировать зарождающийся интернет, привели к возникновению движения шифропанков. Эти интернет-активисты выступали за…
В России вступил в действие закон, объявляющий повестку из военкомата врученной вне зависимости от ее получения призывником. Теперь повестку достаточно…
Сайт Госуслуг «упал» после объявления в России мобилизации. Rutube обрушился 9 мая 2022 года и не работал три дня. Некоторые…
Новая нейросеть семейства GPT не только точнее, надёжнее и безопаснее GPT-3 и ChatGPT. Еще она умеет работать с изображениями. Благодаря…
Анастасия Бонч-Осмоловская ― лингвист, филолог, цифровая исследовательница, идейная вдохновительница и душа российских Digital Humanities. «Системный Блокъ» поговорил с Анастасией о…
Фантастика часто предугадывает будущие достижения науки и техники. «Системный Блокъ» уже рассказывал, как русские писатели XIX века предсказали появление генеративных…
«Пишу тебе» всегда призывает наших читателей и волонтеров делиться открытками из семейного архива. История, которой мы хотим сегодня поделиться, началась…
Сейчас историки всё чаще уделяют внимание не столько выдающимся деятелям прошлого, сколько целым группам людей, жившим в ту или иную…
Научная фантастика в русской литературе имеет давнюю историю. Писатели XIX и первой половины XX века предсказали многое: от телевидения до…
В 2022 году «Системный Блокъ» опубликовал 247 материалов. В этом посте мы сформулировали краткие итоги ушедшего года: открытие дата-отдела, оцифровка…
По сравнению с современными картографическими сервисами старинные средневековые карты выглядят загадочно и непонятно. Точно так же до недавнего времени на…
Две библейские героини — неприступная Юдифь и обольстительница Саломея — очень непохожи друг на друга. Но в истории каждой из…
23 ноября команда Tolstoy Digital запустила сайт «Слово Толстого» – первый цифровой путеводитель по необъятному наследию писателя
Людьми часто движет любопытство. Мы хотим узнать, чем кончится история, были ли мы правы, что же автор всё-таки имел в…
«Шумно, дергано, стук ужасный» — среди материалов «Пишу тебе» обнаружились открытки знаменитого советского стоматолога, отправленные из Америки и Германии. О…
Можно ли принимать участие в экологических проектах, не будучи экологом? Можно! Ведь существует гражданская наука. Рассказываем, как каждый из нас…
Знали ли вы, что слово «время» в произведениях А. П. Чехова имеет определенные схемы употребления, повторяющиеся от тома к тому?…
Каждый филолог желает знать, что такое семантическое издание. В этой статье мы расскажем вам об одном из них. В нем…
Даже если государственный террор не воздействует на человека напрямую, он влияет на формирование его представлений о государстве и отношение к…
Модель психики «Думай медленно… решай быстро» оказалась верна не только для людей, но и для больших нейросетей. Вслед за интуитивными…
Чем тексты аббатов и епископов отличались от текстов графов и королей? Рассказываем, как при помощи статистики употребления слов и анализа…
Алексей Новиков — кандидат географических наук, глава и соучредитель компании Habidatum, специализирующейся на аналитике городских данных. «Системный Блокъ» поговорил с…
Если посмотреть на голую статистику, может показаться, что женщины-ученые публикуют меньше научных статей, чем их коллеги-мужчины, а также реже получают…
Москва входит в топ-30 городов по покрытию камерами. Цифровизация наблюдения уменьшает риск преступности, но при этом и помогает государству выследить…
Лето почти закончилось, а вы все еще не отличаете сатанинского козодоя от башенного стрижа? А может, вам хотелось стать орнитологом,…
Как цифровые методы помогают понять эволюцию идеи гуманизма в Германии XIX века? Рассказываем об исследовании «гуманистического дискурса» в немецкоязычных газетах…
Системный Блокъ много писал о стилометрии: об атрибуции и верификации авторства, анализе эмоций в песнях и стиля переводчика. Теперь на…
Человеку из XXI века может быть сложно понять социальные реалии, в которых создавались пьесы Шекспира. С помощью цифрового анализа исследователи…
Полина Колозариди — интернет-исследователь, координатор Клуба любителей интернета и общества, преподавательница ИТМО и НИУ ВШЭ. «Системный Блокъ» поговорил с ней…
Дневники людей, живших в различных исторических эпохах, могут многое сказать исследователю, но анализировать их вручную — тяжело и долго. Разбираемся,…
«Привет» или «ПРИВЕТ»? А, может быть, «првиет!»? Вариантов поздороваться в онлайн-переписке, как и написать любое другое слово, множество. Причем каждый…
В наши дни подписание петиций или краудфандинговый сбор средств на чьи-нибудь нужды стали привычным делом. Кажется, постоянный фидбек прочно вошел…
Схемы, модели и другие способы наглядно представить информацию давно стали неотъемлемой частью повседневной жизни. В исторической науке к методу визуализации…
Продолжаем разгадывать вечную тайну «Беовульфа» и рассказывать о том, как цифровые филологи строят научный диалог в поисках правды.
Литература как любая сложная система развивается и эволюционирует. Какие-то произведения остаются в центре внимания читателей на десятки и даже сотни…
С начала боевых действий на Украине мы регулярно слышим о том, что за границей притесняют людей из России. Но чаще…
Нью-йоркский музей МоМА — один из старейших музеев современного искусства в мире. В MoMA хранятся работы Рене Магритта и Энди…
Пандемии, кризисы и войны бьют не только по людям, но и по культуре. Многие музеи оказываются недоступны, а то и…
Еще месяц назад мы с уверенностью смотрели в будущее, почти привыкнув к «новой нормальности» в мире с пандемией. Но оказалось,…
Международное сообщество исследователей запустило инициативу по сохранению украинского культурного наследия в цифровой форме
Рассказываем, как сделать тематическое моделирование для большого объема текста, предположить его содержание и разделить по темам
Инна Кижнер — старший преподаватель кафедры информационных технологий в креативных и культурных индустриях, научный сотрудник лаборатории «Digital Humanities» Сибирского федерального…
Алиса Яндекса, Олег Тинькофф-банка и телеграм-бот для демотиваторов — одно и то же? Или нет? Разбираемся, как работают диалоговые системы…
Gephi — самый известный инструмент для визуализации графов и сетевого анализа. С его помощью можно исследовать и население Викторианской Англии,…
Революция 1917 года — одно из крупнейших потрясений в российской истории. О чем думал Николай II в день отречения? Что…
В октябре «Системный блокъ» опубликовал корпусное исследование русской классики, в котором были проанализированы произведения школьной программы. Тогда в анализ текста…
В наше время компьютер может работать практически с чем угодно, в том числе и с музыкой: существует множество методов как…
Проект по оцифровке открыток «Пишу тебе» подготовил очередную тематическую подборку. На этот раз мы подобрали открытки, в которых есть поздравления…
По традиции 31 декабря «Системный Блокъ» публикует подборку лучших материалов уходящего года. В 2021-м в подборке оказались спецпроект в духе…
Реформы, перевороты, вооружённые конфликты, распад СССР… Все это происходило параллельно с развитием интернета и становлением массовой IT-индустрии. Как информационные технологии…
Что такое «гражданская наука» (citizen science)? Как определить редкий вид орхидеи? И зачем фотографировать углозубов? Читайте в новом материале СБъ
Системный Блокъ поговорил с психологом Ольгой Гулевич, профессором департамента психологии НИУ ВШЭ о том, как психологи изучают поведение в цифровой…
Участница НКО «Немецкая национально-культурная автономия города Ханты-Мансийска» Юлия Папанова рассказывает о цифровом проекте «История немцев ХМАО»: от замысла и сбора…
Многие говорят, что эффективный способ выучить иностранный язык – смотреть сериалы на этом языке. Если вы тоже пробовали такой метод,…
С произведениями классика в интерпретации русских авангардистов и исследователя теперь можно познакомиться на онлайн-экскурсии по мультимедийному музею
В Институте имени Пушкина создали технологию лингвистической оценки учебников. С ее помощью тексты цифрового Яндекс.Учебника сравнили с другими школьными пособиями…
«Системный Блокъ» писал об исследованиях того, как по-разному мужчины и женщины описывались в литературе XIX и XX веков. Сегодня перейдем…
Как понять, кем вам приходится сваха внучатого племянника вашей сестры? Проще всего - нарисовать генеалогическое древо, которое отразит все родственные…
1 октября — Международный день открытки. В этот день в 1869 году австрийский экономист Эммануэль Херрман написал статью о том,…
Экспрессионизм обычно ассоциируется с Джейсоном Поллоком с его красочными разводами. Но создать подобное искусство можно и не пачкая рук. Рассказываем…
Как обучить нейросеть генерировать жёлтые тексты в духе самых трешовых баннеров? Наш автор Иван Торубаров погрузился в глубины кликбейта и…
В младенчестве нам предстояло выучить незнакомый язык на основе речи вокруг себя. Как мы осваивали язык и отделяли слова друг…
Язык интернета имеет свои характерные черты. И если исследованию языка Рунета посвящено множество работ, то DarkNet все еще остается серым…
Людвиг ван Бетховен создал девять симфоний, а еще он успел набросать несколько заметок и к симфонии № 10. Рассказываем, как…
Для исторической науки важны не только битвы, революции, переселения народов, смены экономических укладов и политических режимов. Важно еще понимать, кем…
GPT-3 — самая известная из современных нейросетевых моделей языка. Вокруг нее много мифов, но модель действительно умеет впечатлить. Она отлично…
Сегодня каждая большая IT-корпорация пытается сделать «еще более умную» нейросетевую языковую модель, которая решала бы сразу множество задач: и ответы…
Сегодня в России более 1,3 млн учителей средних школ. «Системный Блокъ» решил узнать, насколько учитель средней школы в России подходит…
Сколько ваших знакомых без проблем смогут прочитать рукописи Пушкина? А петровскую скоропись? А рецепт своего лечащего врача? Чтобы разобрать написанное,…
BERT — нейросетевая модель-трансформер от Google, на которой сегодня строится большинство инструментов автоматической обработки языка. Модель появилась в начале 2018-го,…
Мы проанализировали все речи президентов, которые произносились в честь 9 мая с 2000 года. О том, как эти выступления влияют…
Ученые НИУ ВШЭ и РАН при помощи 3D-модели прочитали текст XII века на стене собора. В надписи перечисляются убийцы князя…
Со временем машины получают все больше способностей. Одной из них стало творчество. Произведения искусства, созданные автономными механизмами, существовали еще несколько…
Для чего филологу учиться программировать? Зачем учить нейросети писать стихи? Как мы опираемся на корпусные методы исследования языка в повседневной…
К грядущему 300-летию одного из самых цитируемых философов мира специалисты из Центра социально-гуманитарной информатики Балтийского федерального университета реконструируют дом своего…
Мы писали о том, как оцифровывают почти все, даже алтари. Но можно ли перевести ткани в цифровой формат? Разбираемся, как…
Может ли сеть средневековых писем рассказать исследователям о политических связях византийцев? Видно ли в ней наступление разобщенности элит, за которым…
Рассказываем, как одни ученые устанавливали авторство знаменитого древнеанглийского эпоса «Беовульф» при помощи статистики, а другие с ними спорили. Ведь научные…
Научить нейросети понимать искусство пытаются уже много лет. И хотя про «понимание» говорить рано, некоторые задачи, ранее доступные лишь искусствоведу,…
Все видели мемы «Проспал дистанционку» с траурной свечкой, «Здоровья погибшим» и «Press F to pay respect»? Кому-то они покажутся циничными,…
Проект «Дальнее чтение для европейской литературной истории» выпустил собрание старых произведений. В коллекцию вошли 884 романа на 18 языках
Визуализация возраста зданий на карте — не новая идея, в том числе для Москвы. Подобную вещь несколько лет назад сделал…
В 2020 году Системный Блокъ опубликовал примерно 400 материалов, включая статьи, интервью, подкасты, видео и мемы. Сегодня мы собрали для…
При изучении прошлого ученые часто сталкиваются с нехваткой данных о событиях. Это вызывает проблемы при проверке подлинности фактов и ведет…
Как посмотреть коллекцию одного из самых известных музеев мира, спланировать посещение или просто насладиться искусством, не тратя время на очереди…
Платформа TaQadam — пример интеграции социальных задач и IT-предпринимательства. Рожденный в стенах ООН проект направлен на помощь одному из самых…
COVID-19 изменил повседневные практики миллионов людей — и это видно по их «цифровым следам». Что говорят об эффективности весеннего карантина…
Коронавирус повысил важность цифровой трансформации для музеев. Когда физический поход на выставку становится невозможен, остается надеяться на онлайн. Мы поговорили…
Трансформер — самая модная сегодня нейросетевая архитектура. Она появилась в 2017 и перевернула всю обработку языка машинами. Мы расскажем о…
История диджитал-арта насчитывает уже не один десяток лет, но сегодня союз искусства и цифровых технологий вступает в новую фазу отношений.…
Огромное количество исторических документов США теперь доступны онлайн в архиве Гилдера-Лермана. Разбираемся, как такие архивы помогают студентам, исследователям и всем…
TEI (Text Encoding Initiative) – это формат кодирования текстов и отличная возможность перенести рукописи в удобный электронный вид. TEI используется…
Продолжаем серию постов о применении Sketch Engine в цифровой филологии на примере исследования текстов Маяковского. В прошлом материале мы узнали,…
Системный Блокъ уже рассказывал, как провести собственное корпусное исследование при помощи antconc и mystem. Теперь мы обратимся к другому инструменту…
Разбираемся в том, как излечить хронически больные картины XIX столетия. Расскажем о методах реставрации картин: от клея из пузыря осетра…
Русское искусство все быстрее переезжает в цифровой мир. Расскажем о виртуальных прогулках по Русскому музею — и о его цифровых…
Ностальгия по СССР подстерегает нас везде. Эту тему эксплуатируют многие, от эфирного ТВ до Лапенко. А мы разбираемся с механизмами…
Второй по величине гербарий в России обрел цифровую форму. В свободном доступе более одного миллиона изображений с оригинальными оцифрованными этикетками…
«Spotify опоздал» — говорят одни. «Spotify — всего лишь один из многих!», — говорят другие. «Spotify неудобен» — говорят третьи.…
Допустим, историк нашел древнюю надпись на скале — и хочет ее сохранить. Что делать? Классические методы: переписывание текста, зарисовка или…
Технологический блогер vas3k (в миру программист Василий Зубарев) известен всему просвещенному интернету как автор постов о машинном обучении, VR, машинном…
Измерение сложности текста — задача для компьютерной лингвистики не новая, и в этой области многое уже придумано. Но применимо ли…
В книге «Жизнь онлайн: исследование реального опыта в виртуальном пространстве» цифровой этнограф Аннет Маркхэм показывает, как личность, социум и отношения…
Филиал России в Америке — это не только про русскую мафию или русских на Брайтон-Бич в Нью-Йорке. Это еще и…
О том, что в Россию пришел крупнейший в мире стриминговый сервис, не сказал только ленивый. Но чем же Spotify так…
Крупнейшая в мире библиотека Конгресса США ничего не скрывает, хотя многое хранит — и это не только книги, но и…
Некоторые знают об этом художнике благодаря легенде об отрезанном ухе. Другие вспоминают его единственную проданную картину «Подсолнухи». Есть те, кто…
Каждый знакомится с литературным наследием Льва Толстого по-разному. Одни изучают его творчество одновременно с биографией, другие читают для себя, а…
Врач — профессия, отношение к которым колеблется от тотальной демонизации до безусловного обожествления, однако за этическими и нравственными вопросами жизни…
Как сочетаются компьютерные технологии и Церковь? Зачем настоятелю монастыря алгоритм дистрибутивной семантики word2vec? Исследовать церковные тексты количественными методами — это…
Кто такой русский рэпер, и о чем он читает? Пацан с района в трениках «три полоски», воспевающий «родных жульбанов»? Татуированный…
В России трудно найти семью, где не было бы родственника-участника ВОВ. Но многие почти ничего не знают о судьбе близких,…
Крафтовый техно-лонгрид издания Системный Блокъ, в котором мы разбираем по винтикам одну из самых ходовых технологий в современной компьютерной лингвистике…
Как вы проводите время на самоизоляции? Наш урбанист Оля, например, встречается с друзьями в Zoom на кулинарных пятницах, куратор Ира…
Школьники, зависающие на сайтах с краткими содержаниями, многое бы отдали за чудо-ресурс, которому можно было бы отдать какое-нибудь художественное произведение…
В истории войны много неизвестных и спорных мест. К сожалению, до сих пор многие данные засекречены, ведутся споры о количестве…
Орден иезуитов был передовым отрядом католической церкви в деле сопротивления Реформации. Иезуиты создали сеть школ и университетов по всей Европе.…
Наряду с разработкой таких ботов-гигантов, как Алекса, Сири и Алиса, за которыми стоят крупнейшие IT-корпорации, появляются и доступные инструменты для…
В 2009 году известный композитор, лауреат премии Грэмми Эрик Витакер придумал собрать людей со всего мира в виртуальный хор. Рассказываем,…
Что может рассказать об истории иудаизма социальная сеть мудрецов которые четыре века только и делали, что спорили?
С помощью алгоритмов компьютерного зрения искусствоведы подтвердили теорию о том, что Поль Сезанн в своем творчестве пользовался математическими расчетами, а…
Пока границы закрыты, изучим возможности, которые предоставляют крупнейшие онлайн-коллекции объектов культурного наследия
То место в центре Москвы, где сейчас находится Пушкинская площадь и главный в стране памятник Пушкину, почти три века занимал…
Какие общие тропы можно найти в Plague Inc., Pandemic и Left 4 Dead? Проводим сетевой анализ печально актуальной игры, в…
Если у вас есть смартфон — вы можете почувствовать себя немного биологом и внести вклад в науку. Информатика биоразнообразия —…
Брайлевский шрифт придумали для передачи военных секретов, а в итоге он пригодился незрячим. Как устроен Брайль, зачем на нем пишут…
На наших глазах происходит один из первых кибер-витков истории человечества. Виртуальные помощники выходят из зоны покорных слуг и обретают больше…
Кому и почему «важно, чтобы корпус жил»? Системный Блокъ узнал, как применяют Национальный корпус русского языка: от школьных исследований до…
Когда мобильный интернет был экзотикой, а отчёты по грантам сдавали на 3,5-дюймовых дискетах... в Рунете уже были цифровые гуманитарные проекты!…
В 2010 году «Оскар» за лучшую режиссуру впервые получила женщина — Кэтрин Бигелоу с фильмом «Повелитель бури». Стали ли после…
Как устроен шедевр Булгакова: анализируем роман «Мастер и Маргарита» с помощью методов цифрового литературоведения
Как ученые пытаются понять по активности мозга, что видит человек, и при чем тут машинное обучение
Научиться программировать мечтают многие, но как выбрать подходящий курс из сотен доступных вариантов? Мы сделали обзор курсов по Python, которые…
Тематическое моделирование — легкий способ понять смысловой состав большой коллекции текстов, которую невозможно быстро прочесть глазами. Пользоваться инструментами тематического моделирования…
Градиентный спуск — это способ поиска точек минимума или максимума в сложных функциях. Рассказываем, почему это так важно для обучения…
Научпоп стремительно обзаводится почитателями по всему миру. Какие ученые хотят рассказать о своей работе больше всего, что ресурсы и паблики…
Как, сколько и с кем общаться, чтобы стать по-настоящему главным героем пьесы — отвечает математика
Компьютерные лингвисты из Вышки, университета Тренто и университета Осло разработали vec2graph — инструмент для визуализации семантической близости слов в виде…
Нейросети научились неплохо подражать человеку в написании текста. Но теперь есть симметричный ответ: системы обнаружения текста, порожденного нейросетями. Запасаемся попкорном…
Авторский стиль тяжело определить формально — это целый комплекс деталей, которые заметны человеческому глазу, но могут ускользнуть от компьютера. Указать…
Сегодня модно исследовать художественную литературу методами анализа социальных сетей. Мы начинаем серию постов по сетевому анализу русской драматургии. В первом…
Мы продолжаем цикл постов о компьютерных языках, используемых для передачи музыки. Сегодня рассказываем о принципиальных отличиях музыки от других видов…
Как обычный «слепой тест» по отделению машинной поэзии от той, что написана людьми, приводит ученых к философскому спору об относительности…
Как соотносятся семейные связи европейских монархов начала XX века с их вероисповеданием? Сказалось ли родство на выборе стороны в Первой…
Ученые сумели перевести электрические импульсы коры мозга в звучащую речь. Это может стать прорывом в лечении речевых расстройств и поддержке…
«Лучше пешком», — говорим мы себе летом и выбираем прогулки непривычными маршрутами. А если путь не знаком — поможет приложение-навигатор.…
SpaceX, Anthropic и OpenAI готовятся стать публичными компаниями, Google и Microsoft выпустили новые модели — рассказываем, что произошло в мире…
Японская культура повседневности отличается вниманием к визуальной эстетике, типографике и деталям коммуникации. Поэтому даже самые обычные документы — билеты, рекламные…