Трекер вашего настроения может продавать данные

Анализ приложений для ментального здоровья, духовных практик и для поддержки людей в сложных жизненных ситуациях показал, что некоторые из них нарушают приватность: следят за пользователями и продают данные третьим лицам.

Какие цифровые технологии стали инструментом государственной слежки: тест по цифровому контролю

В 2003 году в Китае был введен механизм фильтрации контента, с 2014 года официально заявлена система «социального кредита», а за интернет-донос можно получить хорошее вознаграждение. Пройдите наш тест и проверьте, насколько хорошо вы знакомы с методами цифрового контроля в стране, которая вольно или невольно подает пример другим государствам.

«Фабрика публикаций»: стать ученым за деньги

Социологи обнаружили в сети организацию, в которой можно купить соавторство в научной статье. Более 400 материалов с купленным авторством были опубликованы в крупнейших журналах

Нейросеть и человек написали книгу

Команда проекта полгода обучала нейросеть ruGPT-3 на рассказах писателя Павла Пепперштейна, чтобы добиться наиболее «естественного» языка

Что такое 3D-фотограмметрия?

Археологические исследования Средних веков восстанавливают историю, осваивая глубины морей и земли. На дне моря находят артефакты: не только обломки судов, но и, к примеру, керамику, которую они перевозили. Рассказываем, как с помощью фотограмметрии с высокой точностью удалось сохранить венгерский шлем X века.

Google AI Research представила новую языковую модель PaLM

Новая модель содержит 540 миллиардов параметров, за счет чего способна объяснять шутки и угадывать фильмы по эмодзи.

Цифровой коллекции открыток «Пишу тебе» — 1 год!

Рассказываем, что нам удалось собрать за этот год

Мобилизация: что говорят цифровые следы поискового спроса

Процессы, которые происходят в обществе, оставляют много цифровых следов. Поисковый спрос достаточно подробно документирует состояние общества и его болевые точки. Рассказываем про взрывной рост интереса к мобилизации в поисковиках за последние 3 месяца

Тревоги «маленьких людей» Англии XVI-XVIII веков

В наши дни подписание петиций или краудфандинговый сбор средств на чьи-нибудь нужды стали привычным делом. Кажется, постоянный фидбек прочно вошел в нашу повседневность: прежде чем купить новую вещь или посетить мероприятие мы тщательно проверяем отзывы. В Англии XVII-XVIII веков тоже можно было подать жалобы или петицию. Новый цифровой проект английских ученых позволяет проанализировать обращения крестьян и горожан в вышестоящие инстанции.

«Метр и смысл» стихотворения: связь формы и содержания в европейской поэзии

Существует ли связь между стихотворным размером и тематикой стихотворения? Можно ли стихи, написанные одним размером, объединить в связанные по смыслу группы? Ищем ответы на эти вопросы в европейской поэзии с помощью тематического моделирования

Искусственный интеллект выберет эффективный метод лечения от рака и коронавируса

Исследователи предложили новый подход на основе деревьев решений в задаче анализа выживаемости

Отличить Святополка от Святослава: цифровая генеалогия Древней Руси

Схемы, модели и другие способы наглядно представить информацию давно стали неотъемлемой частью повседневной жизни. В исторической науке к методу визуализации часто прибегают, чтобы изобразить генеалогии династий или браков. В статье расскажем о том, что такое просопография, а также о цифровых методах, которые помогают ученым анализировать прошлое.

Цифровой тоталитаризм: как государство контролирует граждан с помощью цифровых технологий

В Туркменистане в 2021 году при подключении к сетевому интернету власти требовали от граждан давать клятву на Коране о том, что те не будут использовать обходы блокировок. В Китае «умные города» следят за уровнем преступности и антиобщественным поведением. В России на 2088% вырос спрос на сервисы VPN — по данным на 13 марта 2022 года. «Системный блок» разбирается, есть ли причины опасаться тотального цифрового контроля.

Нейросети помогают историкам восстановить древние тексты

Модель Ithaca позволила повысить точность реставрационных работ почти в три раза: с 25% до 72%

Запрещенные в России социальные сети

Instagram и Facebook* этой весной стали запрещенными, YouTube все чаще грозятся закрыть, а Минцифры составило список отечественных аналогов Zoom и Twitter. Мы спросили экспертов Роскомсвободы, стоит ли нам ждать полностью суверенного Рунета, и разбираемся, что вообще произошло с социальными сетями и интернетом в России этой весной

Данные мобильных телефонов могут помочь живущим за чертой бедности

Ученые натренировали нейросеть определять, кто из пользователей мобильных устройств нуждается в гуманитарной помощи. Такой подход могут использовать правительства и гуманитарные группы при планировании своей социальной политики.

Ученые нашли способ предсказывать вероятность терактов

Придуман новый метод борьбы с терроризмом. Ученые натренировали алгоритм анализировать факторы, связанные с наибольшей вероятностью возникновения терактов. На повышенный риск террористической угрозы влияют высокая плотность населения и развитая транспортная инфраструктура.

Автор(ы) умер(ли), а проблемы остались

Продолжаем разгадывать вечную тайну «Беовульфа» и рассказывать о том, как цифровые филологи строят научный диалог в поисках правды.

Ученые проверили на плагиат тексты в российских научных журналах

Ученые нашли 70 тысяч случаев дублирования научных публикаций в русскоязычном сегменте электронной библиотеки eLIBRARY. Не все они являются нарушением научной этики, но это может свидетельствовать о существовании «черного рынка» статей.

Данные будут закрыты — как и границы с Европой

Российские власти скрыли данные о закупках компаний, попавших под западные санкции. «Системный Блокъ» поговорил с экспертом в области данных Иваном Бегтиным о том, как это влияет на всех нас и почему открытость данных — неотъемлемое право каждого человека и гражданина.

«Заговори, чтобы я тебя увидел»: эволюция диалога в русской литературе XIX века

Литература как любая сложная система развивается и эволюционирует. Какие-то произведения остаются в центре внимания читателей на десятки и даже сотни лет, другие забываются сразу после издания. Так работает «литературная эволюция», модель которой начинал разрабатывать русский филолог Юрий Тынянов (подробнее об этом — в нашем прошлом материале). Применима ли эта концепция к отдельным частям произведения — например, к диалогу? Исследователи пытаются дать ответ на этот вопрос.

«Изучаю историю своего народа», или коллекция открыток Еврейского музея

Каждый день коллекция проекта «Пишу тебе» пополняется новыми открытками. На данный момент открыток в нашей базе насчитывается уже более трех тысяч. Как они попадают к нам в руки? В этой подборке расскажем об открытках из московского Еврейского музея и центра толерантности.

«У нас в культуре надо не думать, а надо прыгать»: интервью с психологом Марией Фаликман

Мария Фаликман — доктор психологических наук, профессор департамента психологии факультета социальных наук НИУ ВШЭ, специалист в области когнитивной науки. «Системный Блокъ» расспросил Марию о том, чем занимаются когнитивные исследователи, как связаны когнитивная наука и искусственный интеллект, а также почему воспоминания со временем искажаются.

Reverso Context — сервис для перевода слов с примерами использования в контексте

Reverso Context — сайт, разработанный с целью улучшения качества работы с переводом с различных языков, в том числе и с русского. Рассказываем, как работает переводчик, которым пользуется даже Департамент культуры Франции.

«Агрессии нет, сочувствие есть»: что говорят россияне об отношении к ним за рубежом

С начала боевых действий на Украине мы регулярно слышим о том, что за границей притесняют людей из России. Но чаще всего слышим это из самой России. Обычно это истории из третьих рук: «знакомому моей знакомой пробили колеса за русские номера». Чего тут больше: слухов и пропагандистских выдумок или реально возросшей русофобии? «Системный Блокъ» провел собственное расследование и опросил более 100 россиян из 15 стран. Все это реальные люди, которых мы знаем и за существование которых ручаемся. Вот что они нам рассказали.

Транспортное освоение России: как увидеть жизнь за пределами основной полосы расселения?

Обосновано ли разделение России на «освоенную» и «неосвоенную» части? Карты плотности автодорог, железнодорожного полотна и аэропортов доказывают обратное.

Нетворкинг Пикассо и Уорхола: сетевой анализ выставок в МоМА

Нью-йоркский музей МоМА — один из старейших музеев современного искусства в мире. В MoMA хранятся работы Рене Магритта и Энди Уорхола, Джексона Поллока и Марко Ротко, Марка Шагала и Казимира Малевича, Сальвадора Дали и Пабло Пикассо. А еще там постоянно проходят выставки — их было так много, что это можно изучить цифровыми методами.

Мозг меланхолика: видно ли темперамент на ЭЭГ

Мы часто слышим фразы вроде «Он не проявляет никакого интереса. Это все потому, что он флегматик!» или «У нее все время печальный вид, может быть, она меланхолик?». Но ведь эти слова придумали еще древние греки. А что говорит про темпераменты современная наука, вооруженная ЭЭГ, МРТ и прочими объективными методами познания мозга? Разбираемся, почему именно так делят людей и насколько научно это разделение.

Мумификация медиа: специалисты по веб-архивации спасают русскоязычные СМИ

С конца февраля в России заблокировали более 50 сайтов интернет-СМИ. Некоторые из них решили приостановить работу, ликвидировать сайты и удалить аккаунты в соцсетях. Но даже это не означает полное исчезновение информации из общего доступа. Специалисты по веб-архивации уже начали работу над архивами «Эха Москвы» и других медиа. Рассказываем, кто и как сегодня сохраняет независимые СМИ и как можно помочь даже если вы не IT-специалист.

Цифровой культурный колониализм в Google Arts&Culture

Пандемии, кризисы и войны бьют не только по людям, но и по культуре. Многие музеи оказываются недоступны, а то и вовсе лишаются своих фондов. В феврале 2011 года Google запустил агрегатор изображений произведений искусства в высоком качестве — Google Art Project (GA&C) с целью сделать культуру более доступной и сохранить ее в цифровой форме. Но во всём ли многообразии культура доступна в GA&C, или там есть подвохи?

Ниоткуда с любовью: в коллекции открыток «Пишу тебе» заработал поиск

Мы оцифровали тысячи старых открыток, но до сих пор у нас не было по ним удобного поиска. Теперь можно искать по датам, местам отправления и получения, тематическим тегам и по текстам открыток.

Неизвестное будущее: как не сойти с ума в условиях неопределенности

Еще месяц назад мы с уверенностью смотрели в будущее, почти привыкнув к «новой нормальности» в мире с пандемией. Но оказалось, что впереди нас ждали внезапные события, имеющие колоссальные последствия для всех. Как в условиях неопределенности сохранить способность мыслить? Как поддерживать себя и близких? Как реагировать на острые ситуации? И что делать с планами, которые рассыпались за секунды? «Системный Блокъ» попросил психологов ответить на вопросы, которые волнуют нас сегодня.

Ученые спасают украинское культурное наследие и сетевые архивы

Международное сообщество исследователей запустило инициативу по сохранению украинского культурного наследия в цифровой форме

Пожар в Киото и коллекционер марок из будущего: проект «Пишу тебе» принял участие в SPB DHWeek 2022

24 января команда проекта «Пишу тебе» приняла участие в мероприятиях Недели цифровой гуманитаристики в Санкт-Петербурге и провела воркшоп по расшифровке дореволюционных почтовых открыток. Мероприятие было организовано DH-центром Университета ИТМО. Рассказываем о некоторых открытках, расшифрованных в рамках проекта.

Как сделать тематическое моделирование

Рассказываем, как сделать тематическое моделирование для большого объема текста, предположить его содержание и разделить по темам

«Буду кормить вшей и блох»: подборка открыток с фронтов

Война отражается не только в перемещениях войск, сражениях и потерях. Война проникает глубоко в быт, и затем историки находят ее следы в самых личных вещах. Например, в переписках солдат и офицеров с семьями. Рассказываем о том, что писали в открытках с фронтов мировых войн.

Вышел интерактивный учебник по Python для гуманитарных исследований

Первое полное пособие по использованию Python в гуманитарных науках доступно в онлайн-формате

Пушкинский дом обновил корпус нарративной прозы XIX века

С ноября 2021 года пользователям доступна вторая, улучшенная версия датасета.

Культура в цифровом сите: что остается за кадром

Инна Кижнер — старший преподаватель кафедры информационных технологий в креативных и культурных индустриях, научный сотрудник лаборатории «Digital Humanities» Сибирского федерального университета. В интервью «Системному Блоку» она рассказала, каким искажениям подвержены цифровые коллекции музеев, какие культурные явления можно исследовать благодаря оцифровке и как должна выглядеть идеальная цифровая коллекция.

Нейроцензура: генератор стихов Пушкина отказался писать о России, самовластье и царе

Бот «AI да Пушкин» дописывает любую предложенную ему фразу до четверостишия в стиле А.С. Пушкина — но только если в ней нет «запретных» слов

Как работают диалоговые системы и чем они отличаются

Алиса Яндекса, Олег Тинькофф-банка и телеграм-бот для демотиваторов — одно и то же? Или нет? Разбираемся, как работают диалоговые системы и почему одни могут рассказать анекдот и поддержать диалог о жизни, а другие — сводить в кино и заказать пиццу.

Выдающиеся «писатели» Госдумы: изучаем KPI депутатов с помощью Python

Разбираемся, как законотворческая деятельность депутатов сказывается на их внутрипартийном рейтинге. Может ли «активный» депутат рассчитывать на попадание в следующий созыв Государственной Думы РФ?

Хмурый граф или Как заменить узлы в Gephi на эмодзи

Визуализация сетей — хороший способ наглядно представить данные, в которых много связей. Разбираемся, как с помощью программы Gephi сделать визуализацию нескучной — например, заменить узлы на эмодзи

Пушкинский дом обновил Корпус текстов детской прозы

Институт русской литературы (Пушкинский дом) РАН пополнил ДетКорпус и сделал его доступным не только для онлайн-поиска, но и в качестве датасета

Как плести виртуальные сети с помощью Gephi

Gephi — самый известный инструмент для визуализации графов и сетевого анализа. С его помощью можно исследовать и население Викторианской Англии, и отношения героев «Войны и мира», и странички друзей Вконтакте. Рассказываем максимально просто, как пользоваться Gephi

Непарадоксальные парадоксы канона. «Дальнее чтение» Франко Моретти

В необычном для «Системного блока» формате book review рассказываем о книге Франко Моретти «Дальнее чтение» и разбираемся, почему в «Гамлете» погибают только персонажи, связанные с Гамлетом и Клавдием, а литература Парижа и Буэнос-Айреса в XIX в. имеет больше общего, чем литература Парижа и французских провинций

Студенчество сквозь столетие: подборка открыток ко Дню студента

Студенчество – сложный период, о котором часто вспоминают с трепетом и теплом. Учиться всегда было непросто: бессонные ночи, стресс, бесконечные сессии. Начинались и заканчивались войны и эпидемии, менялся алфавит и технологии коммуникаций, но люди, несмотря ни на что, стремились к образованию. Ведь университет – это целая экосистема, внутри которой студент становится взрослым человеком. Об этом пишут книги и снимают фильмы, а мы собрали для вас самые интересные открытки студентов и о студентах со времен Российской империи до начала XXI века.

«Мы заставили нейронную сеть креативить»: как алгоритмы моделируют химические реакции

Учёные придумали систему, которая поможет в поиске синтеза новых лекарств. В разработке участвовали исследователи из университетов Страсбурга, Казани и Хоккайдо. Один из руководителей проекта, Тимур Маджидов из Казанского федерального университета, подробно рассказал об истории и работе нейросети и будущем химии

Нейросеть не потечет: можно ли накраситься цифровым макияжем

Маски в Инстаграме и ТикТоке способны изменить лицо до неузнаваемости или вообще превратить его в зайчика/оленя/волдеморта. Создание таких масок не обходится без нейросетей и играет в цифровом мире в основном развлекательную роль. Но что если те же технологии можно применить в образовательных целях?

Как Джордж Вашингтон стал эмо: Google N-grams в ТикТок трендах

Если вы были в ТикТок, то знаете, что тренд там можно сделать из чего угодно. Пару месяцев назад сотни тысяч просмотров начали набирать записи экрана с сайта Google Books Ngram Viewer, показывающем популярность слова в определенный период времени. Пользователи находят слово «эмо» в 1803 году или упоминание «Звёздных войн» — в 1696

Современный урок математики в цифровую эпоху

Всеобщая цифровизация повлияла и на школьные уроки математики. Интерактивная доска Miro, программа для визуализации графов Gephi и другие цифровые инструменты помогают разобраться с абстрактными понятиями и побороть математическую тревожность

«Впереди сущий сахарный голод»: что говорит о дневниках 1917 года анализ данных

Революция 1917 года — одно из крупнейших потрясений в российской истории. О чем думал Николай II в день отречения? Что волновало простых граждан? Какие темы поднимали в газетах? Мы проанализировали дневники очевидцев, которые собрал проект «1917. Свободная история», и выяснили, о чем в революцию писали чаще всего

Русские классики – сексисты или все-таки нет? Корпусный анализ текста Пушкина

В октябре «Системный блокъ» опубликовал корпусное исследование русской классики, в котором были проанализированы произведения школьной программы. Тогда в анализ текста Пушкина вошли «Евгений Онегин» и «Руслан и Людмила». Внимательные читатели заметили, что исследователи упустили не менее важные произведения классика – «Повести покойного Ивана Петровича Белкина» и «Капитанскую дочку», которые также входят в школьную программу. Мы посчитали такие замечания справедливыми и решили провести дополнительный анализ

Идеальная формула депрессивной песни на примере Radiohead

В наше время компьютер может работать практически с чем угодно, в том числе и с музыкой: существует множество методов как преобразовать её в формат, понятный компьютеру, так и проанализировать полученные данные по разным параметрам. В анализе песни текст не менее важен, чем мелодия. В этом материале мы расскажем, как с помощью цифровых методов можно измерить депрессивность вашей любимой песни.

Рекомендательные системы плохо работают для музыки андеграунд

Если вы слушаете не мейнстрим, скорее всего, стриминги подбирают вам музыку не очень удачно

Китайский ИИ на страже порядка: автоматизация цензуры

Об искусственном интеллекте часто говорят как о технологии, которая поведет мир в светлое демократическое будущее, но далеко не всегда она используется в демократических целях. Разбираемся, как в Китае ИИ служит цензуре.

Тайна стихов декабриста Батенькова: стилометрия на страже истины

Стилометрия — метод анализа текста, который сейчас проводится с помощью компьютеров и сложных вычислений. Благодаря современной стилометрии можно изучить не только стиль произведения, но и установить авторство текста. «Системный Блокъ» рассказывает об одном из самых крупных стилометрических расследований — о загадке стихов декабриста Батенькова.

Русская классика глазами нейросети ruDALLE

Как видит русскую классику нейросеть ruDALLE? Пройдите тест и попробуйте угадать, что скрывается под изображениями

«Желаю в веселье и радости провести и не нажить, опохмелившись, головной боли»: как поздравляли с Рождеством 100, 50 и 10 лет назад

Проект по оцифровке открыток «Пишу тебе» подготовил очередную тематическую подборку. На этот раз мы подобрали открытки, в которых есть поздравления с Рождеством Христовым. В наши дни традиция поздравления открыткой уже не так распространена. Однако среди наших прабабушек и прадедушек начала прошлого столетия такой жест был довольно популярен. Почитаем, что же они там писали.

«Шуточная попытка похищения пирожка»

Исследователи оцифровали похороны, объятия и выпас скота