Обсуждая гуманизм: тематическое моделирование немецкоязычной прессы XIX в.

Как цифровые методы помогают понять эволюцию идеи гуманизма в Германии XIX века? Рассказываем об исследовании «гуманистического дискурса» в немецкоязычных газетах при помощи тематического моделирования.

Кто скрывается за псевдонимом «Элена Ферранте»: стилометрия против мистификаций

Системный Блокъ много писал о стилометрии: об атрибуции и верификации авторства, анализе эмоций в песнях и стиля переводчика. Теперь на примере известного итальянского автора рассказываем, как стилометрия помогает раскрывать литературные мистификации.

Цифровое шекспироведение: драма в трех действиях

Человеку из XXI века может быть сложно понять социальные реалии, в которых создавались пьесы Шекспира. С помощью цифрового анализа исследователи выяснили особенности национальных, гендерных и других ролей, использованных автором. Разбираемся, каким языком пользовались кельты, женщины и обманщики в шекспировских пьесах.

Тогда и сейчас: 4 статьи о том, как (не) изменился мир

В материалах по истории мы часто проводим параллели между миром сегодня и 300, 400, 500 лет назад. В этой подборке «Системный Блокъ» собрал для вас тексты, которые особенно наглядно показывают изменчивость и постоянство общества, в котором мы живём, и мира, который нас окружает.

Что такое машинное обучение?

Отвечаем на все вопросы о машинном обучении, которые вы боялись задать

Не навреди: новейшие способы изучения «Мира мертвых»

Мексиканские ученые предложили изучать древние города с помощью георадаров и томографии, чтобы не разрушить их.

Знатный борщ, голодная тетка и мужик-молодец: как менялись значения слов в русском языке на протяжении XVIII-XIX веков

За два века слово может изменить свое значение до неузнаваемости. Многие слова, которыми мы пользуемся сегодня, совершенно иначе воспринимались нашими предками. Тест на лингвистическую интуицию: сможете ли вы догадаться, когда возникла поговорка «голод не тетка», а слово «молодец» стало похвалой?

«Системному Блоку» четыре года: вспоминаем четыре главных поста последних месяцев

В последний год работы «Системный Блокъ» много писал о том, что происходит не только в мире науки, но и в мире вообще. Неудивительно, что в числе главных постов этого года — сухие страшные цифры, новые технологии и значимые исследования.

Подборка материалов по стилометрии

Сегодня филологи не только активно читают, но и активно вычисляют: авторство, особенности перевода, даже эмоции в текстах. О том, когда и почему это может быть важно, читайте в нашей подборке стилометрических исследований.

«К идее разных интернетов мы пока не привыкли»: Полина Колозариди об исследованиях интернета

Полина Колозариди — интернет-исследователь, координатор Клуба любителей интернета и общества, преподавательница ИТМО и НИУ ВШЭ. «Системный Блокъ» поговорил с ней о том, чем занимаются интернет-исследователи, как развивался и чем различается интернет в разных городах России, и как связаны интернет и демократия.

«Размечено»: как распознавать именованные сущности в исторических дневниках

Дневники людей, живших в различных исторических эпохах, могут многое сказать исследователю, но анализировать их вручную — тяжело и долго. Разбираемся, как цифровые инструменты используются для упрощения анализа дневниковых записей.

Собираем «фотолетопись» прошлого

Фотография — важный свидетель нашего культурного и исторического прошлого. Проект «История России в фотографиях» дает возможность увидеть быт людей Российской Империи, Советского Союза и России 1990-х годов: их жизнь в повседневности и в период тяжелых испытаний.

Точка, точка, запятая: как меняется язык в интернет-пространстве

«Привет» или «ПРИВЕТ»? А, может быть, «првиет!»? Вариантов поздороваться в онлайн-переписке, как и написать любое другое слово, множество. Причем каждый из них обладает своим эмоциональным оттенком и передает настроение собеседника. В интернет-пространстве смысл может быть спрятан в отдельных символах языка, будь то точка в конце сообщения или буква «а» в слове «молоко». Изучение того, как языки меняются в виртуальной сети, только начинается, но уже есть немало исследований, посвященных этим правилам.

Трекер вашего настроения может продавать данные

Анализ приложений для ментального здоровья, духовных практик и для поддержки людей в сложных жизненных ситуациях показал, что некоторые из них нарушают приватность: следят за пользователями и продают данные третьим лицам.

Какие цифровые технологии стали инструментом государственной слежки: тест по цифровому контролю

В 2003 году в Китае был введен механизм фильтрации контента, с 2014 года официально заявлена система «социального кредита», а за интернет-донос можно получить хорошее вознаграждение. Пройдите наш тест и проверьте, насколько хорошо вы знакомы с методами цифрового контроля в стране, которая вольно или невольно подает пример другим государствам.

«Фабрика публикаций»: стать ученым за деньги

Социологи обнаружили в сети организацию, в которой можно купить соавторство в научной статье. Более 400 материалов с купленным авторством были опубликованы в крупнейших журналах

Нейросеть и человек написали книгу

Команда проекта полгода обучала нейросеть ruGPT-3 на рассказах писателя Павла Пепперштейна, чтобы добиться наиболее «естественного» языка

Что такое 3D-фотограмметрия?

Археологические исследования Средних веков восстанавливают историю, осваивая глубины морей и земли. На дне моря находят артефакты: не только обломки судов, но и, к примеру, керамику, которую они перевозили. Рассказываем, как с помощью фотограмметрии с высокой точностью удалось сохранить венгерский шлем X века.

Что такое линейная регрессия?

Рассказываем об одной из классических моделей машинного обучения – линейной регрессии

Google AI Research представила новую языковую модель PaLM

Новая модель содержит 540 миллиардов параметров, за счет чего способна объяснять шутки и угадывать фильмы по эмодзи.

Midjourney

Самая известная модель для генерации изображений по текстовому описанию

DALL-E 2

Улучшение модели DALL-E, генерирующей изображения по текстовому описанию

Цифровой коллекции открыток «Пишу тебе» — 1 год!

Рассказываем, что нам удалось собрать за этот год

Что такое мешок слов

Рассказываем, что такое мешок слов и как он может помочь в задачах автоматической обработки текста

Мобилизация: что говорят цифровые следы поискового спроса

Процессы, которые происходят в обществе, оставляют много цифровых следов. Поисковый спрос достаточно подробно документирует состояние общества и его болевые точки. Рассказываем про взрывной рост интереса к мобилизации в поисковиках за последние 3 месяца

Тревоги «маленьких людей» Англии XVI-XVIII веков

В наши дни подписание петиций или краудфандинговый сбор средств на чьи-нибудь нужды стали привычным делом. Кажется, постоянный фидбек прочно вошел в нашу повседневность: прежде чем купить новую вещь или посетить мероприятие мы тщательно проверяем отзывы. В Англии XVII-XVIII веков тоже можно было подать жалобы или петицию. Новый цифровой проект английских ученых позволяет проанализировать обращения крестьян и горожан в вышестоящие инстанции.

«Метр и смысл» стихотворения: связь формы и содержания в европейской поэзии

Существует ли связь между стихотворным размером и тематикой стихотворения? Можно ли стихи, написанные одним размером, объединить в связанные по смыслу группы? Ищем ответы на эти вопросы в европейской поэзии с помощью тематического моделирования

Искусственный интеллект выберет эффективный метод лечения от рака и коронавируса

Исследователи предложили новый подход на основе деревьев решений в задаче анализа выживаемости

Отличить Святополка от Святослава: цифровая генеалогия Древней Руси

Схемы, модели и другие способы наглядно представить информацию давно стали неотъемлемой частью повседневной жизни. В исторической науке к методу визуализации часто прибегают, чтобы изобразить генеалогии династий или браков. В статье расскажем о том, что такое просопография, а также о цифровых методах, которые помогают ученым анализировать прошлое.

Цифровой тоталитаризм: как государство контролирует граждан с помощью цифровых технологий

В Туркменистане в 2021 году при подключении к сетевому интернету власти требовали от граждан давать клятву на Коране о том, что те не будут использовать обходы блокировок. В Китае «умные города» следят за уровнем преступности и антиобщественным поведением. В России на 2088% вырос спрос на сервисы VPN — по данным на 13 марта 2022 года. «Системный блок» разбирается, есть ли причины опасаться тотального цифрового контроля.

Нейросети помогают историкам восстановить древние тексты

Модель Ithaca позволила повысить точность реставрационных работ почти в три раза: с 25% до 72%

Двойной учет: как Минюст ведет списки иностранных агентов

Моргенштерн, Юрий Дудь, Екатерина Шульман, Face, Алексей Венедиктов…. Каждую неделю мы слышим о пополнении реестра «иноагентов» новыми именами. Но как устроен этот реестр и для чего в нем целых четыре списка? Мы подготовили для вас разбор системы учета «иноагентов» с понятной инфографикой.

Запрещенные в России социальные сети

Instagram и Facebook* этой весной стали запрещенными, YouTube все чаще грозятся закрыть, а Минцифры составило список отечественных аналогов Zoom и Twitter. Мы спросили экспертов Роскомсвободы, стоит ли нам ждать полностью суверенного Рунета, и разбираемся, что вообще произошло с социальными сетями и интернетом в России этой весной

Данные мобильных телефонов могут помочь живущим за чертой бедности

Ученые натренировали нейросеть определять, кто из пользователей мобильных устройств нуждается в гуманитарной помощи. Такой подход могут использовать правительства и гуманитарные группы при планировании своей социальной политики.

Ученые нашли способ предсказывать вероятность терактов

Придуман новый метод борьбы с терроризмом. Ученые натренировали алгоритм анализировать факторы, связанные с наибольшей вероятностью возникновения терактов. На повышенный риск террористической угрозы влияют высокая плотность населения и развитая транспортная инфраструктура.

Автор(ы) умер(ли), а проблемы остались

Продолжаем разгадывать вечную тайну «Беовульфа» и рассказывать о том, как цифровые филологи строят научный диалог в поисках правды.

Ученые проверили на плагиат тексты в российских научных журналах

Ученые нашли 70 тысяч случаев дублирования научных публикаций в русскоязычном сегменте электронной библиотеки eLIBRARY. Не все они являются нарушением научной этики, но это может свидетельствовать о существовании «черного рынка» статей.

Данные будут закрыты — как и границы с Европой

Российские власти скрыли данные о закупках компаний, попавших под западные санкции. «Системный Блокъ» поговорил с экспертом в области данных Иваном Бегтиным о том, как это влияет на всех нас и почему открытость данных — неотъемлемое право каждого человека и гражданина.

«Заговори, чтобы я тебя увидел»: эволюция диалога в русской литературе XIX века

Литература как любая сложная система развивается и эволюционирует. Какие-то произведения остаются в центре внимания читателей на десятки и даже сотни лет, другие забываются сразу после издания. Так работает «литературная эволюция», модель которой начинал разрабатывать русский филолог Юрий Тынянов (подробнее об этом — в нашем прошлом материале). Применима ли эта концепция к отдельным частям произведения — например, к диалогу? Исследователи пытаются дать ответ на этот вопрос.

«Изучаю историю своего народа», или Коллекция открыток Еврейского музея

Каждый день коллекция проекта «Пишу тебе» пополняется новыми открытками. На данный момент открыток в нашей базе насчитывается уже более трех тысяч. Как они попадают к нам в руки? В этой подборке расскажем об открытках из московского Еврейского музея и центра толерантности.

«У нас в культуре надо не думать, а надо прыгать»: интервью с психологом Марией Фаликман

Мария Фаликман — доктор психологических наук, профессор департамента психологии факультета социальных наук НИУ ВШЭ, специалист в области когнитивной науки. «Системный Блокъ» расспросил Марию о том, чем занимаются когнитивные исследователи, как связаны когнитивная наука и искусственный интеллект, а также почему воспоминания со временем искажаются.

Reverso Context — сервис для перевода слов с примерами использования в контексте

Reverso Context — сайт, разработанный с целью улучшения качества работы с переводом с различных языков, в том числе и с русского. Рассказываем, как работает переводчик, которым пользуется даже Департамент культуры Франции.

Был ли геноцид: статистика гибели жителей Донбасса в 2014–2021 годах

Российские власти говорят о «8 годах геноцида» на Донбассе. Именно этим объяснял необходимость «спецоперации» против Украины президент РФ. Но что говорит статистика? Был ли там геноцид? Мы изучили данные из официальных источников Донецкой народной республики и визуализировали жертвы среди ее военных и ее мирных жителей.

«Агрессии нет, сочувствие есть»: что говорят россияне об отношении к ним за рубежом

С начала боевых действий на Украине мы регулярно слышим о том, что за границей притесняют людей из России. Но чаще всего слышим это из самой России. Обычно это истории из третьих рук: «знакомому моей знакомой пробили колеса за русские номера». Чего тут больше: слухов и пропагандистских выдумок или реально возросшей русофобии? «Системный Блокъ» провел собственное расследование и опросил более 100 россиян из 15 стран. Все это реальные люди, которых мы знаем и за существование которых ручаемся. Вот что они нам рассказали.

Транспортное освоение России: как увидеть жизнь за пределами основной полосы расселения?

Обосновано ли разделение России на «освоенную» и «неосвоенную» части? Карты плотности автодорог, железнодорожного полотна и аэропортов доказывают обратное.

Нетворкинг Пикассо и Уорхола: сетевой анализ выставок в МоМА

Нью-йоркский музей МоМА — один из старейших музеев современного искусства в мире. В MoMA хранятся работы Рене Магритта и Энди Уорхола, Джексона Поллока и Марко Ротко, Марка Шагала и Казимира Малевича, Сальвадора Дали и Пабло Пикассо. А еще там постоянно проходят выставки — их было так много, что это можно изучить цифровыми методами.

Мозг меланхолика: видно ли темперамент на ЭЭГ

Мы часто слышим фразы вроде «Он не проявляет никакого интереса. Это все потому, что он флегматик!» или «У нее все время печальный вид, может быть, она меланхолик?». Но ведь эти слова придумали еще древние греки. А что говорит про темпераменты современная наука, вооруженная ЭЭГ, МРТ и прочими объективными методами познания мозга? Разбираемся, почему именно так делят людей и насколько научно это разделение.

Мумификация медиа: специалисты по веб-архивации спасают русскоязычные СМИ

С конца февраля в России заблокировали более 50 сайтов интернет-СМИ. Некоторые из них решили приостановить работу, ликвидировать сайты и удалить аккаунты в соцсетях. Но даже это не означает полное исчезновение информации из общего доступа. Специалисты по веб-архивации уже начали работу над архивами «Эха Москвы» и других медиа. Рассказываем, кто и как сегодня сохраняет независимые СМИ и как можно помочь даже если вы не IT-специалист.

Что такое дальнее чтение?

Франко Моретти пишет: «Мы умеем читать тексты, теперь нужно научиться не читать их». Возможно ли исследование литературы без детального чтения текстов? Возможно. При помощи дальнего чтения и инструментария digital humanities.

Цифровой культурный колониализм в Google Arts&Culture

Пандемии, кризисы и войны бьют не только по людям, но и по культуре. Многие музеи оказываются недоступны, а то и вовсе лишаются своих фондов. В феврале 2011 года Google запустил агрегатор изображений произведений искусства в высоком качестве — Google Art Project (GA&C) с целью сделать культуру более доступной и сохранить ее в цифровой форме. Но во всём ли многообразии культура доступна в GA&C, или там есть подвохи?

Ниоткуда с любовью: в коллекции открыток «Пишу тебе» заработал поиск

Мы оцифровали тысячи старых открыток, но до сих пор у нас не было по ним удобного поиска. Теперь можно искать по датам, местам отправления и получения, тематическим тегам и по текстам открыток.

Неизвестное будущее: как не сойти с ума в условиях неопределенности

Еще месяц назад мы с уверенностью смотрели в будущее, почти привыкнув к «новой нормальности» в мире с пандемией. Но оказалось, что впереди нас ждали внезапные события, имеющие колоссальные последствия для всех. Как в условиях неопределенности сохранить способность мыслить? Как поддерживать себя и близких? Как реагировать на острые ситуации? И что делать с планами, которые рассыпались за секунды? «Системный Блокъ» попросил психологов ответить на вопросы, которые волнуют нас сегодня.

Что такое онтология

Изучением всего сущего и категоризацией понятий и объектов занимается не только философия, но и компьютерная наука. Как это может помочь оптимизировать работу поиска, предостеречь от кибератак и построить графы знаний? В новой статье глоссария рассказываем об онтологии – формате хранения структурированных данных – и объясняем, зачем ее создавать и где применить.

Ученые спасают украинское культурное наследие и сетевые архивы

Международное сообщество исследователей запустило инициативу по сохранению украинского культурного наследия в цифровой форме