Цифровая история Узбекистана и память о репрессиях: платформа Raqamli tarix

Узбекистан — солнечный, хлопковый, гостеприимный. Но в XX веке и тут проходили сталинские репрессии. Проект Raqamli tarix («Цифровая история») помогает сохранить память об этом периоде в истории страны. В одном месте собраны база данных о репрессированных, фотографии и видео, а также архивные материалы на трёх языках: узбекском, русском и английском.

Глазами нейросети: мир как набор стереотипов

Миром управляют белые мужчины. Они же в основном работают врачами, юристами и судьями — хотя среди них иногда встречаются и белые женщины. Преступления совершают темнокожие парни, а женщины с афроамериканскими корнями готовят бургеры в забегаловках. Ну а если в ресторан зашел русский, то он непременно возьмет стопку водки. Именно так видит наш мир нейросеть Stable Diffusion. Алгоритмы искусственного интеллекта не только генерируют изображения или тексты, но и воспроизводят общественные стереотипы. Рассказываем, как и почему они это делают.

«Нас вообще все боятся»: Александра Архипова о том, зачем фольклористы и социальные антропологи собирают слухи и считают репосты

Как примирить сторонников количественных и качественных исследований культуры? Как исследователям фольклора помогают цифровые базы данных? О чём могут рассказать лозунги митингующих и народные рецепты лечения COVID-19? Почему конспирологические теории так привлекательны? Обо всём этом «Системный Блокъ» поговорил с антропологом Александрой Архиповой.

Цвет антиутопии зелёный: цифровая рецензия на роман «Радио Мартын»

Сегодня гуманитарии стремительно осваивают цифровой мир и уже совсем по-другому смотрят на литературные произведения. В этой статье мы проанализировали книгу Филиппа Дзядко «Радио Мартын» с помощью языка программирования R и отразили в цифрах уникальность авторского стиля писателя

Цифровые коллекции японского искусства

Как технологии открывают миру богатство культурного наследия? Японские гравюры, живопись и каллиграфию можно увидеть и изучать не только вживую, но и через интернет. Исследуем платформу Google Arts & Culture, цифровой ресурс Cultural Japan, базу данных японских гравюр на дереве Ukiyo-e Search и Центр исследования искусства Университета Рицумэйкан, которые позволяют соприкоснуться с оцифрованными произведениями японской культуры из любой точки мира.

👋 Тест: какой вы жест из мультимедийного корпуса русского языка?✍️

«Закатить глаза» или «троекратный поцелуй»? Узнайте, каким жестом вы были бы во вселенной мультимедийного корпуса русского языка.

Понять Льва Толстого: как векторно-семантические модели помогают литературоведам

Идиостиль — это авторский стиль писателя. И если на небольших стихах его изучать удобно, то вот на текстах Льва Толстого — очень непросто. Рассказываем, как филолог Борис Орехов использует векторно-семантические модели для анализа идиостиля Толстого.

Как автоматически расшифровать аудио: пошаговая инструкция для Whisper

Расшифровка аудиозаписи — дело утомительное и времязатратное. К счастью, появляется всё больше сервисов, которые умеют это делать автоматически. Рассказываем, как сделать это с помощью модели Whisper от OpenAI и смотрим, насколько хорошо она справляется с русскоязычными записями

Агрессивная сеть: что мы знаем о кибербуллинге

Каковы риски стать жертвой кибербуллинга? Кто страдает от интернет-агрессии больше всех? Где искать помощи? Обо всём этом — в материале «Системного Блока»

Кто какую часть произведения написал? Выясняем с помощью Stylo

«‎Системный Блокъ» уже рассказывал, что такое стилометрия, и как сделать её своими руками с помощью библиотеки Stylo на языке программирования R. В новом гайде мы познакомим вас с функцией rolling.classify(), которая может помочь в исследований произведений, написанных в соавторстве.

О дивный «Визуальный мир»

Что такое «Визуальный мир», кто в нём живёт и причём тут яблоки? Продолжаем серию материалов про айтрекинг и рассказываем об экспериментальном методе «Визуальный мир». При помощи записи движения глаз учёные изучают, как мозг человека понимает предложения и справляется с лингвистической неоднозначностью.

Перестаньте читать книги и начните их анализировать: тест про дальнее чтение

Пройдите тест и узнайте, какую информацию можно получить из корпусов художественных текстов с помощью дальнего чтения.

«Нам надоели префиксы и инфиксы, что мы можем для людей сделать?»: Ольга Драгой о настоящем и будущем нейролингвистических исследований

Нейролингвистические исследования находятся на стыке психологии, неврологии и лингвистики: здесь изучается речь пациентов, переживших инсульт, разрабатываются приложения для определения дислексии и даже синтезируются слова по активности нейронов. О соединении нейролингвистических экспериментов с машинным обучением «Системный Блокъ» поговорил с Ольгой Драгой, директором Центра языка и мозга НИУ ВШЭ и доктором филологических наук.

Карточный активизм. Как контркартографирование помогает социальным меньшинствам

Может ли карта стать политическим инструментом? Как контркартографирование создаёт альтернативную реальность? Узнаем в материале «Системного Блока».

KuroNet: как работает модель для распознавания старых японских иероглифов

Для распознавания старинных японских иероглифов применяется OCR под названием KuroNet. В основе KuroNet лежит специальная нейросетевая модель. Пошагово разберем что делать, когда нужно распознать рукописный текст на японском языке: от выбора текста до использования приложения miwo для смартфона.

Зима бёрдвотчеру не помеха! Определите птицу по фотографии

Наблюдать за птицами можно даже зимой — время искать снегирей! Мы уже рассказывали вам о сервисах, которые помогают изучать природу и заниматься бёрдвотчингом, или наблюдением за птицами. При помощи разных сайтов и приложений можно определить вид птицы не только по внешнему виду, но и по пению и даже перу! Проверьте свои познания в орнитологии. Пройдите тест и узнайте, насколько хорошо вы разбираетесь в птицах.

Религии Африки через данные: во что и как верит самый религиозный континент Земли

Рассказываем, чем уникальны конфессии Африки — континента, где переход от этнических религий к христианству и исламу во многих сообществах произошёл всего за несколько десятилетий. Благодаря собранным датасетам изменения в вероисповеданиях можно отследить и измерить.

«Долой копирайт!»: история и философия open source

Мы привыкли, что контент, программа или информация обязательно находится в чьей-то собственности. Но всегда ли это так? Проблема повсеместной коммерциализации всегда волновала компьютерных разработчиков. Многие из них с 80-х годов XX века поддерживают идеи свободного программного обеспечения, или open source. Рассмотрим историю этого движения и разберёмся, как его философия влияет на наше общество.

Из семинарии в Совет экспертов: кто и как попадает в иранскую коллегию выборщиков

В Иране есть избираемый орган, состоящий целиком из духовенства, — Совет экспертов. Что это за совет и как он устроен? Илья Васькин, старший преподаватель и младший научный сотрудник Центра изучения Ближнего Востока, Кавказа и Центральной Азии (CSMECCA) Института Классического Востока и Античности ФГН НИУ ВШЭ, проанализировал данные о членах Совета экспертов и обнаружил, какие изменения происходили в политизированной части иранского духовенства с 1983 года.

Как устроена оцифровка дневников: Михаил Мельниченко о проекте «Прожито» и его перезапуске

Проект «Прожито» начался с небольшой группы волонтёров, собиравших и оцифровывавших личные дневники. Сегодня это крупный центр по цифровой архивации эго-документов: дневников, мемуаров, писем и других личных свидетельств времени. Основатель «Прожито» Михаил Мельниченко рассказал «Системному Блоку» о том, кто и как приносит документы для оцифровки, откуда берутся тысячи волонтёров и как изменится «Прожито» в ближайшем будущем.

Забытые голоса истории: граффити древнего храма переходят в цифру

Как лазеры и трехмерное моделирование помогают изучать древние изображения на стенах храма богини Исиды на египетском острове Филы? Рассказываем о цифровом проекте «Граффити Храма Фил».

Больше, чем энциклопедия: 4 истории о том, что такое Википедия

Почему Википедия — сообщество с иерархией? У кого она стала ассоциироваться с либеральными идеями? И в каких отношениях «свободная энциклопедия» находится с большими корпорациями? Об этом и многом другом — в новом материале «Системного Блока» к 23-летию Википедии.

Удалить из друзей: история tie-breaking («расфренживания») в соцсетях

Социальные сети позволяют установить контакт практически с любым человеком на планете. С приходом цифровой коммуникации появилась возможность не только публично зафиксировать социальный статус между людьми («Добавить в друзья»), но и отменить его («Удалить из друзей» или «Заблокировать»). «Системный Блокъ» разобрался, как за двадцать лет изменилась функция разрыва контактов в цифровой среде.

Как появились смайлики: тест на знание эмодзи ✅ ❌ 🎉

Как появились смайлики? Где их больше всего используют? Какой самый популярный? А можно ли написать и понять целое предложение только из картинок? Пройдите тест и узнайте, насколько вы разбираетесь в эмодзи.

История форматов музыки: От Эдисона до Spotify

Какой была первая песня, записанная на носитель? Что можно считать первым музыкальным альбомом? Как менялся характер прослушивания музыки по мере развития технологий? В чём сходство стримингов с радио? Рассказываем об истории звукозаписи и музыкальных форматов.

Читаем секретные письма опальной королевы: историческая криптография на примере Марии Стюарт

Расшифровка старинных кодов и древних систем письменности роднит работу историка с детективным расследованием. Это требует от учёного не только недюжинных способностей к анализу искусственных знаковых систем, но и хотя бы поверхностного знакомства с теорией вероятностей и другими математическими дисциплинами. На примере эпистолярного наследия Марии Стюарт рассказываем, как историку, который занимается разгадкой старинных шифров, могут помочь дата-инженеры и разработчики нейросетей.

Танцы, эрос и зачатие: о чем писали «Платоновские исследования» за последние 10 лет

В 2024 году исполняется 10 лет с журналу «Платоновские исследования» — первому научному изданию в России, посвященному Платону и платоновскому наследию. Историк философии, доцент НИУ ВШЭ Ольга Алиева построила тематическую модель архива журнала при помощи алгоритма LDA и узнала, какие темы на протяжении этих лет интересовали платоноведов.

Оксана Мороз, интервью для издания Системный Блокъ

Что происходит в интернете: Оксана Мороз о цифровом бессмертии и языке онлайн-скорби

Почему в онлайн-среде люди ведут себя более агрессивно? Можно ли обрести бессмертие с помощью «цифры»? В чём феномен коллективного интернет-горевания? Об этом в интервью изданию «Системный Блокъ» рассказала Оксана Мороз, культуролог, исследователь цифровой среды, академический руководитель образовательной программы НИУ ВШЭ «Практики кураторства в современном искусстве».

«Системный Блокъ»: лучшее за 2023 год

По традиции 31 декабря «Системный Блокъ» публикует подборку лучших материалов уходящего года. В 2023-м в подборке есть стилометрия Набокова, интервью об исторической информатике, открытка из варшавского гетто, дата-исследование поляризации российских СМИ, предсказание появления ChatGPT от современника Пушкина… С Новым годом!

Рецепт Нобелевской премии: исследуем открытые данные о лауреатах

10 декабря в Стокгольме Нобелевский комитет наградил лауреатов 2023 года. По этому поводу мы изучили сведения о том, кому вручали премию в течение всей её истории — с 1901 года. Теперь мы знаем, где нужно родиться, в каком университете работать и до скольких лет ждать, чтобы получить признание комитета. Эти и другие наблюдения — в нашем новом материале.

Как цифровые методы спасают людей от аварий?

Власти Нью-Йорка решили к 2024 году снизить число аварий с летальным исходом до нуля. Для этого была создана цифровая карта безопасности уличного движения Vision Zero. «‎Системный Блокъ» разобрался, как цифровые данные помогают спасать людей от аварий.

Краш-тест для любителей дешёвых драм

Применить цифровые технологии к пьесам Шекспира? Да легко! Если вы хотите проанализировать связи между персонажами драматических текстов, то в этом вам поможет интернет-ресурс DraCor. Пройдите наш тест и проверьте, насколько хорошо вы знаете, как работает DraCor!

Из России — с данными. Узнайте регион по статистике

Тест о том, как числа могут рассказывать о социальных проблемах. Узнайте, насколько хорошо вы представляете себе Россию

От корпусов до карты бомбардировок Хиросимы: Digital Humanities в Японии

Оцифровка данных о землетрясениях в Японии, эталонный корпус японского языка на DVD, интерактивная карта бомбардировки Хиросимы, изучение буддийских текстов. Посмотрим, чем сегодня занимаются цифровые гуманитарии в Японии и как они это делают.

Жизнь стала чёрно-белой: как менялся язык поэзии Сильвии Плат

Сильвия Плат — американская поэтесса, основательница жанра «исповедальной поэзии». Ее жизнь была коротка (30 лет) и трагична, и эволюция творчества Плат отражает эту печальную динамику. Рассказываем, как менялись цвета и другие составляющие поэзии Сильвии Плат

Отмыть историю Санкт-Петербурга: как энтузиасты восстанавливают памятники

Иногда памятники истории и культуры России спасают простые энтузиасты. Показываем, какие «воскрешенные» волонтерами достопримечательности Санкт-Петербурга можно увидеть на интерактивной карте «Гэнгъ».

Роботы в фильмах XX века: от ненависти к ИИ до слияния

Еще со времен второй промышленной революции человек забеспокоился, что безэмоциональная машина займет его место и на работе, и в остальных сферах жизни. Страхи и надежды людей по поводу роботов отражались и в кинематографе. Разберемся, как менялась репрезентация искусственного интеллекта в кино.

«Слово Пацана» как интернет-феномен: что ищут в поисковиках зрители сериала

«Слово Пацана. Кровь на асфальте» Жоры Крыжовникова стал самым обсуждаемым российским сериалом года. В одном только «Яндексе» его с момента выхода искали 60 миллионов раз. «Системный Блокъ» разобрался, как сериал о «казанском феномене» стал феноменом интернета и породил вал запросов в поисковиках.

Сегодня завод, завтра — футбольное поле: как по снимкам из космоса изучают эволюцию города

Студенты географического факультета МГУ изучили спутниковые снимки бельгийского города Шарлеруа и показали, как изменилась городская среда за последние 70 лет. Площадь сельскохозяйственных земель уменьшилась в четыре раза, уступив место малоэтажной застройке, а доля общественных пространств выросла с 1 до 6% территории. Рассказывает один из участников исследования.

«Злачные области науки»: Михаил Гельфанд о плагиате, лишении степени и неэффективных чиновниках 

В каких научных дисциплинах больше всего фальсификаций? Сколько депутатов лишились научных степеней из-за некорректных заимствований? Как работают фабрики по производству диссертаций? «Системный Блокъ» спросил Михаила Гельфанда, одного из основателей «Диссернета», как сегодня обстоят дела с плагиатом в российских научных работах.

Люди на ладони: биографическая база данных по истории Японии

Как соединить визуализацию и сведения об исторических личностях? Биографическая база данных Японии — пример такого проекта. Здесь можно найти родственные и иные связи, а также события и биографические факты о людях, оставивших след в японской истории.

Как понять, что кошке больно: определитель кошачьих эмоций по мимике

Как понять, что кошке больно? Пытаясь ответить на этот вопрос, учёные снимали на видео кошек после операций, измеряли углы отклонения ушей и расширение глаз, а затем проверяли результаты статистическими тестами. В итоге получилась шкала кошачьей мимики, сверяться с которой может каждый хозяин.

Возможен ли мир без СПИДа: статистика ВИЧ в России и в мире

Во Всемирный день борьбы со СПИДом изучаем данные о распространении ВИЧ в России и в мире, разбираемся, можно ли вылечить заболевание и как математическое моделирование позволяет его изучать.

Интерактивная карта художественной жизни Франции XVIII века: где жили живописцы 

Как цифровой проект Artists in Paris позволяет любому заинтересованному узнать, где селились французские художники вплоть до Великой французской революции, кто переехал в Россию, а кто жил без адреса? Изучим, как устроена интерактивная карта художественной жизни Парижа в XVIII веке

Посмотреть на мир чужими глазами: пять исследований с мобильными айтрекерами

Данные о движениях глаз можно получать не только в лаборатории, но и во время реальных жизненных ситуаций: в магазине, за рулём автомобиля, в музее, на скалодроме. На примере исследований из разных областей — от нейрофизиологии до лингвистики — мы расскажем о сферах применения мобильных айтрекеров

Эйджинг и социальное неравенство: искусственный интеллект в мире стареющих людей

ООН прогнозирует, что к 2100 году пожилые составят около трети всего мирового населения. Рост продолжительности жизни — это хорошо, но старение населения может замедлить экономический рост и сделать трудовую нагрузку на работающих непосильной. Сможет ли искусственный интеллект помочь преодолеть сложности, возникающие в связи с уменьшением рабочей силы, или он вызовет новые социальные проблемы? Разбираемся, как изменится жизнь пенсионеров и всех остальных в дивном новом мире.

Стилометрия древнегреческих текстов: работает ли Дельта — и что кроме нее

Стилометрия — количественный метод определения авторства, который проверен на десятках современных языков. А что там с языками древними? Историк философии Ольга Алиева исследовала, как работает Дельта и другие стилометрические меры на древнегреческих текстах. Разбираемся вместе с ней, может ли стилометрия отличить Аристотеля от Платона, а Геродота от Плутарха.

Кто вы для Чехова? Тест на основе писем классика

Друг, жена, а может быть, сестра? Пройдите тест и узнайте, какое письмо отправил бы вам Антон Павлович

Что ждёт искусственный интеллект в будущем: прогнозы учёных

Как будет развиваться ИИ в ближайшем будущем? Перспективно ли пытаться научить компьютер думать, как человек? Может ли не хватить данных для обучения искусственного интеллекта? Отвечаем на эти вопросы в нашем материале

Тест «Художник или нейросеть»: отличите настоящую картину от сгенерированной

Кибер-арт постоянно противопоставляют классической живописи, но между ними намного больше общего, чем нам кажется. Сможете ли вы отличить работу нейросети от картины художника? Пройдите тест и узнайте, насколько хорошо вы распознаете картины, созданные алгоритмом

Сталин, чучхе, Ким Ир Сен: о чём говорят заголовки северокорейской прессы

Северная Корея имеет совершенно заслуженную репутацию закрытого общества, труднодоступного не только для туристов, но и для специалистов. Один из немногих открытых источников, по которым исследователи могут судить о ситуации в стране, ― это пресса. Специалист по Северной Корее, ведущий научный сотрудник университета Кунмин (г. Сеул) Фёдор Тертицкий изучил заголовки главной партийной газеты КНДР и обнаружил, как в них отражались идеологические изменения и внешнеполитические приоритеты государства

«Digital Humanities — это крыша для всех, кто применяет цифровые технологии»: интервью с Леонидом Бородкиным об исторической информатике

Какие советские ученые стоят у истоков исторической информатики? Как математические методы позволяют моделировать исторические процессы? Как складывались отношения российских исторических информатиков с международным сообществом? Как они взаимодействуют с сообществом «цифровых гуманитариев» (Digital Humanities)?

«С экзамена в тюрьму с ChatGPT»: чей рассказ лучше, нейросети или писателя?

Еще до появления нашумевшей ChatGPT нейросети генерировали связные тексты на разные темы и в разных жанрах. Сейчас с помощью больших языковых моделей (LLM) можно написать мотивационное письмо, оригинальный рецепт вареников, диплом… и даже художественное произведение. Но правда ли, что нейросети скоро заменят живых писателей, или людям пока не о чем беспокоиться? Мы решили провести эксперимент при участии писателя Александра Сорге

Как это (не) работает: технологии нейросети-писателя

Как научить нейросеть писать в стиле Набокова? И насколько хорошо (или плохо) у нейросетей вообще получается писать художественные тексты? Могут ли нейросети привести филологов к мировому господству? Ответы на эти и другие вопросы нам дали цифровой филолог Борис Орехов и исследователь в области глубинного обучения Михаил Ким.

Как писать художественные тексты с ChatGPT и не облажаться: советы редактора

Может ли нейросеть заменить писателя? И да и нет. Есть творческие задачи, с которыми современные языковые модели справляются легко: например, стилизовать сказку под триллер, а трагедию Шекспира — под дворовую байку. Но есть многое, в чем им нужна помощь или хотя бы руководство человека. Разбираемся, какие литературные задачи можно делегировать ChatGPT, а какие пока не стоит.

Telegram-спектакль «Невидимый Басмач»: как чат-бот может продлить жизнь театру

Как воссоздать театральный опыт в Telegram? Поставить спектакль — затратное дело: долгая подготовка, репетиции, декорации, реквизит, потом нужно собрать труппу и публику в одном месте и в одно время. Можно ли преодолеть ограничения и создать спектакль, который всегда доступен, и как в этом могут помочь цифровые методы? Рассказывают постановщицы Telegram-спектакля «Невидимый Басмач»

Почему медицине нужны информационные технологии

Виртуальная реальность, дополненная реальность и дистанционные методы взаимодействия проникают и в медицину. VR и AR-технологии помогают хирургам проводить операции, а люди с психическими проблемами погружаются в виртуальный гипноз. Рассказываем, как медицина занимается пациентами в эпоху цифровых технологий.

Русалка села на шпагат: как нейросети генерируют картинки и подменяют понятия

Новостей о том, что уже умеет искусственный интеллект и какие профессии из-за него обречены, предостаточно. Гораздо интереснее выяснять, чего он не может. Ранее мы уже писали о том, как ChatGPT выдумывает несуществующие произведения Льва Толстого. Теперь авторы «Системного Блока» провели эксперимент, чтобы выяснить, где границы возможностей нейросетей для генерации изображений (Midjourney, DALL-E, Kandinsky), и обнаружили у них проблемы с образным и абстрактным мышлением

Как распознать тексты и сделать корпус для исследования: пошаговая инструкция 

От библиотечного каталога к машиночитаемым текстовым данным для компьютерного анализа: разбираемся, как собрать корпус, используя ресурсы цифровых библиотечных коллекций, и как преобразовать отсканированные документы в машиночитаемый текст с помощью различных инструментов оптического распознавания символов

Вы Лев Толстой на словах или на деле? Викторина по редким словам из корпуса текстов писателя

Кого Лев Толстой называл голышом и где в усадьбе тырла? Кем лучше быть ― келарем или щелкопёром? Писатель был знатоком редких и диковинных слов. Пройдите наш тест и попробуйте отгадать их значения