

Пожар в Киото и коллекционер марок из будущего: проект «Пишу тебе» принял участие в SPB DHWeek 2022
24 января команда проекта «Пишу тебе» приняла участие в мероприятиях Недели цифровой гуманитаристики в Санкт-Петербурге и провела воркшоп по расшифровке дореволюционных почтовых открыток. Мероприятие было организовано DH-центром Университета ИТМО. Рассказываем о некоторых открытках, расшифрованных в рамках проекта.

Как сделать тематическое моделирование
Рассказываем, как сделать тематическое моделирование для большого объема текста, предположить его содержание и разделить по темам

Knowledge Graph, или граф знаний: что это такое и где применяется
Порой поисковик понимает нас лучше, чем мы сами. Например, по запросу «фильм, в котором был грунт» он ответит верно и выдаст «Стражей галактики». Это возможно благодаря Knowledge Graph – семантической сети, которая умеет выявлять взаимосвязи между разными объектами. В новой статье глоссария рассказываем, что такое граф знаний, как он устроен и чем помогает поисковикам.

Что такое нейросеть GPT-3 и зачем она нужна
Общение с чат-ботами и голосовыми помощниками стало частью повседневного опыта. Мы спрашиваем у нейросетей о погоде и пробках, просим переводить и сочинять тексты, проверяем их способности стихосложения и иногда даже делимся сокровенными секретами. СБъ уже не раз рассказывал о работе языковых моделей, которые делают боты более человечными. Предлагаем освежить знания и прочитать материал из глоссария про наиболее крупную и продвинутую языковую модель в мире – GPT-3

«Буду кормить вшей и блох»: подборка открыток с фронтов
Война отражается не только в перемещениях войск, сражениях и потерях. Война проникает глубоко в быт, и затем историки находят ее следы в самых личных вещах. Например, в переписках солдат и офицеров с семьями. Рассказываем о том, что писали в открытках с фронтов мировых войн.

Вышел интерактивный учебник по Python для гуманитарных исследований
Первое полное пособие по использованию Python в гуманитарных науках доступно в онлайн-формате

Пушкинский дом обновил корпус нарративной прозы XIX века
С ноября 2021 года пользователям доступна вторая, улучшенная версия датасета.

Культура в цифровом сите: что остается за кадром
Инна Кижнер — старший преподаватель кафедры информационных технологий в креативных и культурных индустриях, научный сотрудник лаборатории «Digital Humanities» Сибирского федерального университета. В интервью «Системному Блоку» она рассказала, каким искажениям подвержены цифровые коллекции музеев, какие культурные явления можно исследовать благодаря оцифровке и как должна выглядеть идеальная цифровая коллекция.

Нейроцензура: генератор стихов Пушкина отказался писать о России, самовластье и царе
Бот «AI да Пушкин» дописывает любую предложенную ему фразу до четверостишия в стиле А.С. Пушкина — но только если в ней нет «запретных» слов

Обратный тест Тьюринга
Тест Тьюринга придумали в середине 20 века, чтобы измерить интеллект машин и проверить, насколько он схож с человеческим. Сегодня мы все еще используем этот тест, но чаще с обратной целью: теперь компьютер проверяет наш интеллект. Рассказываем про обратный тест Тьюринга, популярные капчи и объясняем, зачем нам все это нужно

Как работают диалоговые системы и чем они отличаются
Алиса Яндекса, Олег Тинькофф-банка и телеграм-бот для демотиваторов — одно и то же? Или нет? Разбираемся, как работают диалоговые системы и почему одни могут рассказать анекдот и поддержать диалог о жизни, а другие — сводить в кино и заказать пиццу.

Выдающиеся «писатели» Госдумы: изучаем KPI депутатов с помощью Python
Разбираемся, как законотворческая деятельность депутатов сказывается на их внутрипартийном рейтинге. Может ли «активный» депутат рассчитывать на попадание в следующий созыв Государственной Думы РФ?

Пушкинский дом обновил Корпус текстов детской прозы
Институт русской литературы (Пушкинский дом) РАН пополнил ДетКорпус и сделал его доступным не только для онлайн-поиска, но и в качестве датасета

Как плести виртуальные сети с помощью Gephi
Gephi — самый известный инструмент для визуализации графов и сетевого анализа. С его помощью можно исследовать и население Викторианской Англии, и отношения героев «Войны и мира», и странички друзей Вконтакте. Рассказываем максимально просто, как пользоваться Gephi

Что такое геоданные
Сегодня с геоданными взаимодействует практически каждый. Мы заказываем такси и еду, используем навигацию, изучаем цифровые карты, чтобы понять местность или найти нужное заведение. С помощью геоданных наука может предсказать экологические проблемы, а бизнес и государство – строить логистику компаний, контролировать строительство, нефтяную отрасль, развивать сельское хозяйство. Всё это возможно благодаря геоинформационной системе с огромным количеством данных о местности, инфраструктуре, экологии. В этой статье мы коротко расскажем о видах геоданных, для чего они нужны и где применяются

Непарадоксальные парадоксы канона. «Дальнее чтение» Франко Моретти
В необычном для «Системного блока» формате book review рассказываем о книге Франко Моретти «Дальнее чтение» и разбираемся, почему в «Гамлете» погибают только персонажи, связанные с Гамлетом и Клавдием, а литература Парижа и Буэнос-Айреса в XIX в. имеет больше общего, чем литература Парижа и французских провинций

Студенчество сквозь столетие: подборка открыток ко Дню студента
Студенчество – сложный период, о котором часто вспоминают с трепетом и теплом. Учиться всегда было непросто: бессонные ночи, стресс, бесконечные сессии. Начинались и заканчивались войны и эпидемии, менялся алфавит и технологии коммуникаций, но люди, несмотря ни на что, стремились к образованию. Ведь университет – это целая экосистема, внутри которой студент становится взрослым человеком. Об этом пишут книги и снимают фильмы, а мы собрали для вас самые интересные открытки студентов и о студентах со времен Российской империи до начала XXI века.

«Мы заставили нейронную сеть креативить»: как алгоритмы моделируют химические реакции
Учёные придумали систему, которая поможет в поиске синтеза новых лекарств. В разработке участвовали исследователи из университетов Страсбурга, Казани и Хоккайдо. Один из руководителей проекта, Тимур Маджидов из Казанского федерального университета, подробно рассказал об истории и работе нейросети и будущем химии

Нейросеть не потечет: можно ли накраситься цифровым макияжем
Маски в Инстаграме и ТикТоке способны изменить лицо до неузнаваемости или вообще превратить его в зайчика/оленя/волдеморта. Создание таких масок не обходится без нейросетей и играет в цифровом мире в основном развлекательную роль. Но что если те же технологии можно применить в образовательных целях?

Как Джордж Вашингтон стал эмо: Google N-grams в ТикТок трендах
Если вы были в ТикТок, то знаете, что тренд там можно сделать из чего угодно. Пару месяцев назад сотни тысяч просмотров начали набирать записи экрана с сайта Google Books Ngram Viewer, показывающем популярность слова в определенный период времени. Пользователи находят слово «эмо» в 1803 году или упоминание «Звёздных войн» — в 1696

Современный урок математики в цифровую эпоху
Всеобщая цифровизация повлияла и на школьные уроки математики. Интерактивная доска Miro, программа для визуализации графов Gephi и другие цифровые инструменты помогают разобраться с абстрактными понятиями и побороть математическую тревожность

«Впереди сущий сахарный голод»: что говорит о дневниках 1917 года анализ данных
Революция 1917 года — одно из крупнейших потрясений в российской истории. О чем думал Николай II в день отречения? Что волновало простых граждан? Какие темы поднимали в газетах? Мы проанализировали дневники очевидцев, которые собрал проект «1917. Свободная история», и выяснили, о чем в революцию писали чаще всего

Русские классики – сексисты или все-таки нет? Корпусный анализ текста Пушкина
В октябре «Системный блокъ» опубликовал корпусное исследование русской классики, в котором были проанализированы произведения школьной программы. Тогда в анализ текста Пушкина вошли «Евгений Онегин» и «Руслан и Людмила». Внимательные читатели заметили, что исследователи упустили не менее важные произведения классика – «Повести покойного Ивана Петровича Белкина» и «Капитанскую дочку», которые также входят в школьную программу. Мы посчитали такие замечания справедливыми и решили провести дополнительный анализ

Идеальная формула депрессивной песни на примере Radiohead
В наше время компьютер может работать практически с чем угодно, в том числе и с музыкой: существует множество методов как преобразовать её в формат, понятный компьютеру, так и проанализировать полученные данные по разным параметрам. В анализе песни текст не менее важен, чем мелодия. В этом материале мы расскажем, как с помощью цифровых методов можно измерить депрессивность вашей любимой песни.

Рекомендательные системы плохо работают для музыки андеграунд
Если вы слушаете не мейнстрим, скорее всего, стриминги подбирают вам музыку не очень удачно

Китайский ИИ на страже порядка: автоматизация цензуры
Об искусственном интеллекте часто говорят как о технологии, которая поведет мир в светлое демократическое будущее, но далеко не всегда она используется в демократических целях. Разбираемся, как в Китае ИИ служит цензуре.

Тайна стихов декабриста Батенькова: стилометрия на страже истины
Стилометрия — метод анализа текста, который сейчас проводится с помощью компьютеров и сложных вычислений. Благодаря современной стилометрии можно изучить не только стиль произведения, но и установить авторство текста. «Системный Блокъ» рассказывает об одном из самых крупных стилометрических расследований — о загадке стихов декабриста Батенькова.

Русская классика глазами нейросети ruDALLE
Как видит русскую классику нейросеть ruDALLE? Пройдите тест и попробуйте угадать, что скрывается под изображениями

«Желаю в веселье и радости провести и не нажить, опохмелившись, головной боли»: как поздравляли с Рождеством 100, 50 и 10 лет назад
Проект по оцифровке открыток «Пишу тебе» подготовил очередную тематическую подборку. На этот раз мы подобрали открытки, в которых есть поздравления с Рождеством Христовым. В наши дни традиция поздравления открыткой уже не так распространена. Однако среди наших прабабушек и прадедушек начала прошлого столетия такой жест был довольно популярен. Почитаем, что же они там писали.

Айтрекинг и сканпафы: как движения глаз выдают неуверенного читателя
Движения глаз при чтении исследуется еще с шестидесятых годов двадцатого века. Однако лишь недавно исследователи из Центра языка и мозга Высшей школы экономики и Городского университета Нью-Йорка перешли от описания локальных параметров движений глаз при чтении отдельных слов в предложении к описанию глобального рисунка чтения целых предложений в разных русскоязычных группах. Помог им в этом новый метод анализа.
ChatGPT
GPT-3, обученная понимать и исполнять текстовые запросы и доступная всем желающим через веб сайт

«Системный Блокъ»: лучшее за 2021 год
По традиции 31 декабря «Системный Блокъ» публикует подборку лучших материалов уходящего года. В 2021-м в подборке оказались спецпроект в духе «Намедни» к 30-летию крушения СССР, дата-исследование зарплат учителей в России, выпуск подкаста о том, как врет искусственный интеллект, тесты о средневековых студентах и о цифровых гуманитариях и видео о людях, из которых состоит сам «Системный Блокъ». С новым годом!

Программа для поиска рифмы: как она работает и когда ломается
В 2018 году был разработан метод автоматической разметки рифм. В 2021 его автор представил RhymeTagger — общедоступную библиотеку на Python , которая позволяет вам анализировать рифмовку стихотворения. Рассказываем, как работает инструмент, и тестируем его на лесенках от Маяковского

«Виртуальные НКО — это будущее»: интервью с руководителем красноярского «Мемориала»
Алексей Бабий — руководитель красноярского общества «Мемориал», а также один из первопроходцев Рунета. Последние три десятилетия Алексей занимается сохранением памяти о жертвах репрессий в Красноярском крае и развитием цифровой инфраструктуры красноярского «Мемориала». В интервью изданию «Системный Блокъ» Алексей рассказал, что может дать интернет гражданским активистам, как опыт работы на советских ЭВМ 70-х годов помогает ему обеспечивать сохранность данных о репрессиях и почему современным «облачным НКО» не страшны угрозы ликвидации.

Госдума разогнала бешеный принтер
Независимые исследователи и аналитики ОВД-Инфо* измерили скорость принятия законов депутатами разных созывов. *Внесен в реестр СМИ-иноагентов

Как автоматизация труда и гендерные стереотипы повлияют на ваш успех (особенно если вы женщина)
Замена работников роботами вполне реальна в век автоматизации. Квалификацию можно подтянуть самостоятельно и до прихода робота на твое рабочее место, а вот решить проблему гендерной дискриминации на рынке труда гораздо сложнее. Разбираемся, какие гендерные стереотипы встречаются в рабочей среде и как на них влияет автоматизация

Знаете ли вы, как информационные технологии повлияли на общественно-политические процессы?
Реформы, перевороты, вооружённые конфликты, распад СССР… Все это происходило параллельно с развитием интернета и становлением массовой IT-индустрии. Как информационные технологии изменили общество после крушения Советского Союза? Пройдите тест и узнайте, насколько точно вы помните события, сформировавшие лик современности.

Музейные технологии и роботы в искусстве: рассказываем про Art & Science
Видели когда-нибудь музыкальный синтезатор, сделанный из живых нервных клеток? А старые лампы, которые общаются на языке Достоевского? Рассказываем о технологиях в современных музеях — и это уже давно не только интерактивные экраны

Мне нужны твоя геолокация, камера и телефон: для чего ученым ваши фото птиц и растений
Что такое «гражданская наука» (citizen science)? Как определить редкий вид орхидеи? И зачем фотографировать углозубов? Читайте в новом материале СБъ

Насколько хорошо вы знаете историю цифрового литературоведения?
Методы, которыми пользуются цифровые филологи, изобретены совсем недавно. Или так только кажется? Предлагаем вам пройти тест и узнать побольше об истории цифровой филологии и некоторых ее методах.

Джон Донн уснул: Кем были англиканские священники в XVI-XIX вв.?
Возникшая в период Реформации англиканская церковь была и остаётся сложной и разветвлённой организацией. Разобраться во всём многообразии священнослужителей, их перемещениях и особенностях церкви изнутри было нереально, пока не была создана база данных. Разбираемся, как она устроена

Отмороженный искусственный интеллект: зима (не) близко
Многие представляют себе искусственный интеллект по фантастике. Альтрон из «Железного человека», ВИКИ Азимова, «Мир Дикого запада» и «Апгрейд» — все это выглядит, как торжество развития технологии, способной и улучшить жизнь человечества, и положить ему конец. Правда, реальный искусственный интеллект пока далек от того, что показывают нам в фильмах и книгах. Но это не повод расстраиваться — ведь в истории ИИ были и куда более тёмные времена

Алгоритмы и дискриминация на рынке труда. Чему мы научили искусственный интеллект?
В 2014 году Amazon разработал технологию с ИИ, которая присваивала рейтинг каждому отклику на вакансии. Вскоре обнаружилось, что при этом робот занижал баллы женщинам. Выясняем, как часто происходит такая дискриминация, и что можно с этим сделать