Фото автора

Даниил Скоринкин

Главный редактор

Цифровой литературовед, программирующий гуманитарий

Блог автора

Горький урок ABBYY: как лингвисты проиграли последнюю битву за NLP

Недавно СМИ облетела новость об увольнении всех российских программистов из компании ABBYY (тоже в прошлом российской, а теперь уже совсем нет). Теперь, когда страсти вокруг обсуждения дискриминации сотрудников по паспорту улеглись, хочется поговорить о более глубокой истории. Закат ABBYY — это фиксация проигрыша последней битвы лингвистов за автоматическую обработку языка. Мир Data Science победил. Главный редактор «Системного Блока» Даниил Скоринкин, работавший ABBYY в 2013–2017, подводит итоги и пытается сформулировать уроки из этой истории, начало которой — еще в 1990-х годах. С мемасами и метафорами.

Нейросети и коммунистическая революция в интернете

Призрак революции снова бродит вокруг нас — и борьба с ним все так же бесплодна. К 175-летию «Манифеста коммунистической партии» Карла Маркса и Фридриха Энгельса

Сокровища с барахолки: как мы искали старые открытки в Узбекистане

Команда проекта «Пишу тебе» уже устраивала экспедиции за открытками в музеи Петербурга и Москвы. Но найти послания из прошлого можно не только в учреждениях культуры. Недавно мы оцифровали около 60 открыток на крупнейшем блошином рынке Средней Азии — базаре Янгиабад в Ташкенте. Рассказываем об этой случайной экспедиции.

Редактор статей

Тайны древней ДНК: как палеогенетика и биоинформатика помогают археологам

Можно ли узнать, чем болели люди в каменном веке, изучив остатки ДНК из их зубов? Да, если на помощь придут палеогенетика в связке с биоинформатикой. Палеогенетика изучает древнюю ДНК, чтобы понять, куда и откуда мигрировали древние люди, какие возбудители вызывали эпидемии, какие виды гибризовались, чтобы получился современный человек. Об этих подходах рассказывает Андрей Макашов, преподаватель специалитета в Высшей школе биомедицинских систем и технологий петербургского Политеха.

Новые открытые языковые модели, критика OpenAI от бывшего сотрудника и большой отчёт об опасностях общего ИИ

Новые открытые языковые модели, бывший сотрудник OpenAI раскритиковал компанию за безответственный подход к разработке, детальный отчёт о будущем общего ИИ и последствиях его появления. Рассказываем, что произошло в мире ИИ за прошедшие две недели.

«Нас вообще все боятся»: Александра Архипова о том, зачем фольклористы и социальные антропологи собирают слухи и считают репосты

Как примирить сторонников количественных и качественных исследований культуры? Как исследователям фольклора помогают цифровые базы данных? О чём могут рассказать лозунги митингующих и народные рецепты лечения COVID-19? Почему конспирологические теории так привлекательны? Обо всём этом «Системный Блокъ» поговорил с антропологом Александрой Архиповой.

«Слово Пацана» как интернет-феномен: что ищут в поисковиках зрители сериала

«Слово Пацана. Кровь на асфальте» Жоры Крыжовникова стал самым обсуждаемым российским сериалом года. В одном только «Яндексе» его с момента выхода искали 60 миллионов раз. «Системный Блокъ» разобрался, как сериал о «казанском феномене» стал феноменом интернета и породил вал запросов в поисковиках.

Стилометрия древнегреческих текстов: работает ли Дельта — и что кроме нее

Стилометрия — количественный метод определения авторства, который проверен на десятках современных языков. А что там с языками древними? Историк философии Ольга Алиева исследовала, как работает Дельта и другие стилометрические меры на древнегреческих текстах. Разбираемся вместе с ней, может ли стилометрия отличить Аристотеля от Платона, а Геродота от Плутарха.

Как распознать тексты и сделать корпус для исследования: пошаговая инструкция 

От библиотечного каталога к машиночитаемым текстовым данным для компьютерного анализа: разбираемся, как собрать корпус, используя ресурсы цифровых библиотечных коллекций, и как преобразовать отсканированные документы в машиночитаемый текст с помощью различных инструментов оптического распознавания символов

История рока, рэпа и поп-музыки на каждый день: «Этот день в музыке»

Приближается конец месяца, а это значит, что сентябрь горит! А пока убийца плачет, предлагаем посмотреть, что происходило в мире музыки в один из заключительных дней сентября с помощью портала This Day In Music. На сайте можно узнать о событиях, произошедших в любую дату в истории западной музыки двух последних столетий: информацию о релизах альбомов, синглов, концертных турах, рождении и смерти известных музыкантов и многое другое

Государственный музей Востока оцифровал Коран{ы}

«Московские Кораны» — digital-коллекция оцифрованных списков Корана XI–XIX вв., проект Государственного музея Востока. Все файлы доступны для скачивания, а тем, кто мало знает об арабской культуре, будет интересно заглянуть в лекторий и глоссарий

Что мы узнали об ударении в русском языке и о наивной поэзии из корпуса stihi.ru

Подкорпус Национального корпуса русского языка, в котором можно изучать ударения русских слов, содержит произведения поэтов-любителей с сайта Стихи.ру. Каким образом они могут быть полезны для науки — читайте в нашем материале

Восток, пираты и митрополит: что происходит на книжном рынке

Ковидный локдаун ударил по многим сферам экономики, книжный рынок не был исключением — типографии практически прекратили свою работу. Но пандемия закончилась, полиграфия активно наращивала темпы, и показатели книжного рынка росли, приближаясь к доковидным значениям. Всё изменилось с началом военных действий: новая волна кризиса накрыла издателей и книготорговцев. Мы постарались разобраться с основными проблемами книжного рынка и тенденциями его развития в сложные времена.

От аналогового к цифровому: как происходит оцифровка в архивах, музеях и библиотеках

Современный мир захлестнула цифровизация. Это не обошло стороной, в том числе, и институции культурного наследия, которые начали массово переводить свои коллекции в цифровой формат. Рассказываем, что и зачем оцифровывают библиотеки, музеи, архивы, а также каким образом культурное наследие обрабатывается компьютерной техникой.

Домашнее и партнерское насилие в России: сколько у него жертв и как им помочь

Проблема домашнего насилия — одна из наиболее острых социальных проблем в современной России. А вопрос о достоверной статистике по этой теме — один из самых болезненных. Разбираемся в том, кто становится авторами насилия, кто от него страдает и куда обращаться.

Как управлять аккаунтами в соцсетях после смерти человека? Цифровое виртуальное наследство.

Как подготовить цифровое наследство, пока я жив?

Разбираемся, какие цифровые активы можно завещать в интернет-пространстве.

Как хорошо вы знаете песни «Короля и Шута»?

Пройдите тест и узнайте, разбираетесь ли вы в творчестве «КиШ»а лучше «Системного Блока»!

«Не он первый, не он последний»: как особо тяжкая статья УК РФ спустя 10 лет снова стала хедлайнером новостей

Вечером 23 июня глава неофициальной военной организации «Группа Вагнера» Евгений Пригожин объявил о «Марше Справедливости» — практически рейде по захвату российских городов с целью добиться отставки руководства Министерства обороны. В ответ на это ФСБ возбудила уголовное дело против Пригожина, однако в тот же день пообещала от него отказаться. О новых делах, связанных с «вооруженным мятежом», в России не было слышно с 2013-2014 годов. Тогда отставной полковник ГРУ пытался захватить власть, а террористы устроили взрыв в Грозном. Рассказываем, что происходит с такими делами на практике.

От кыргызского эпоса до ChatGPT: что обсуждали на круглом столе «Digital Humanities в Центральной Азии» 

15 марта 2023 года прошёл круглый стол «Digital Humanities в Центральной Азии» — серия панельных дискуссий, на которых учёные из стран Центральной Азии обсудили цифровые гуманитарные исследования и проекты в регионе. Участница Системного Блока сходила на мероприятие и рассказывает, о чем там говорилось.

24000 оцифрованных старых открыток: проекту «Пишу тебе» два года

В июне 2021 года команда «Системного блока» презентовала проект открытого цифрового архива отправленных почтовых открыток. Имя этого проекта — «Пишу тебе». Два года спустя мы хотим рассказать про интересные открытки, которые мы собрали, и обозначить планы на будущее.

Как живет SexTech-индустрия и что ее ожидает в будущем?

По итогам 2022 года рынок SexTech оценивается в $21млрд с ежегодным ростом в 16.71% до 2030 года. О том, как устроена эта индустрия, на какие запросы она отвечает и как связана с развитием феминизма, рассказывает Таня Дмитриева — секс-просветительница, соосновательница вечеринок нового опыта Kinky Party и международной платформы для познания своей сексуальности Deep. По ее мнению, забота о сексуальном удовольствии скоро станет частью здорового образа жизни: люди будут изучать свои оргазмы, удовлетворенность отношениями и новые телесные практики так же, как сейчас свое питание, ментальное и физическое здоровье.

«Открытые данные против мракобесия и пренебрежения реальностью»: интервью с Кириллом Маслинским 

Кирилл Маслинский — цифровой филолог, руководитель Лаборатории цифровых исследований литературы и фольклора в Пушкинском Доме, создатель Детского корпуса и Репозитория открытых данных по русской литературе и фольклору. «Системный Блокъ» узнал у Кирилла, что можно найти в тысячах оцифрованных детских книг, когда в детской литературе было допустимо употреблять слово «какашка», зачем филологам репозиторий открытых данных и может ли этот репозиторий как-то помочь в борьбе с мракобесием и войнами.

«Цифровой концлагерь»: как закон о повестках через «Госуслуги» взбудоражил россиян

В России вступил в действие закон, объявляющий повестку из военкомата врученной вне зависимости от ее получения призывником. Теперь повестку достаточно выслать заказным письмом, разместить в электронном реестре или направить гражданину через «Госуслуги». Россияне отреагировали на новый закон повышенным интересом к «цифровым повесткам», «цифровому концлагерю» и удалению аккаунта на «Госуслугах».

Что умеет GPT-4 — новая и самая совершенная языковая модель от OpenAI

Новая нейросеть семейства GPT не только точнее, надёжнее и безопаснее GPT-3 и ChatGPT. Еще она умеет работать с изображениями. Благодаря этому GPT-4 лучше понимает окружающий мир, а самое главное — способна объяснять мемы ¯\_(ツ)_/¯

«Коктейль Молотова» массового производства: как судят за поджоги военкоматов

В 2022 году поджоги военкоматов стали частью антивоенного движения в России. Поджигатели протестовали против отправки военнообязанных на передовую, а с сентября еще и против мобилизации. В ответ на прямое действие партизан, власти ужесточили наказание за поджоги. Дата-отдел «Системного Блока» проанализировал судебные дела и рассказал о том, как государство расправляется с поджигателями.

Год войны в цифрах: жертвы, потери, разрушения, беженцы 

Год назад российские войска вошли в Украину, начав самые масштабные боевые действия в Европе со времен Второй мировой войны. К годовщине начала вторжения «Системный Блокъ» подготовил карточки с перечислением его последствий.

Петр I как зеркало милитаризации и централизации РФ: дата-исследование СБъ

В 2022 году Россия широко отмечала 350-летие Петра I. Дата была вплетена в новостную повестку: например, Владимир Путин сопоставил боевые действия в Украине и походы Петра в Прибалтику: «Чего он полез-то туда? Возвращал. И укреплял. <...> на нашу долю тоже, значит, выпало возвращать и укреплять». Позже Путин сравнивал Азовские походы Петра и свою «спецоперацию». Рассказываем, как по-разному отмечали 350-летие Петра I российские регионы и что это может говорить об устройстве РФ.

Голос Холокоста в «Пишу тебе»: как мы получили открытку из гетто

«Пишу тебе» всегда призывает наших читателей и волонтеров делиться открытками из семейного архива. История, которой мы хотим сегодня поделиться, началась с комментария под постом: «У меня есть не очень красивая открытка, отправленная в мае 41 года из варшавского гетто в Смоленск моему прадеду его матерью и сестрой».

Любит или не любит? Гадаем по открыткам

Пройдите тест и найдите свою валентинку из коллекции «Пишу тебе»!

«Путешествие с открыткой» от «Пишу тебе»: паровая мельница на берегу Оки

На этой почтовой открытке изображена известная в Нижнем Новгороде мельница купца Башкирова и пристань на р. Оке рядом с ней. Более ста лет назад здесь активно развивался мукомольный промысел, а сегодня место вновь приобретает значимость из-за реновации. Начинаем «Путешествие с открыткой» на набережной р. Оки в Нижнем Новгороде.

Собери их всех: как record linkage помогает обогащать большие биографические данные

Сейчас историки всё чаще уделяют внимание не столько выдающимся деятелям прошлого, сколько целым группам людей, жившим в ту или иную эпоху. Это неудивительно — ведь с появлением больших исторических баз данных стало проще анализировать множество биографий одновременно. Автоматизировать обработку данных об одних и тех же людях в разных базах помогает сопоставление данных, или record linkage.

Что говорит о разных частях России их нематериальное наследие

Министерство культуры РФ ведет цифровой реестр объектов нематериального культурного наследия народов России. Реестр включает 450 объектов, географически относимых к одному из федеральных округов. Здесь можно найти очень разные примеры народного творчества, обрядов, культурных практик и ремесел: от «Искусства игры на балалайке Антонины Ивановой из деревни Лисьи Горки» до «Обряда укладывания в колыбель у кубанских ногайцев».

«Персоналистские диктатуры чаще начинают войны»: Эрика Франц об автократиях, Украине и поводах для оптимизма

Системный Блокъ поговорил с политологом Эрикой Франц о недемократических режимах, диктаторах и возможностях перехода к демократии. Спойлер: наши шансы на демократический транзит невысоки, но они есть.

Продуктовая подушка безопасности: как россияне отреагировали на «спецоперацию»

В экономическом поведении россиян есть две традиции: закупаться в декабре перед Новым годом и запасать сахар на заготовки в июле. Но внешние потрясения вносят свои коррективы. Мы посмотрели, как потребители отреагировали на карантин в 2020 и объявление «спецоперации» в 2022 году.

Тест: что загадать под бой курантов?

Нет поздравления лучше, чем красивая открытка. Команда «Пишу тебе» поздравляет вас с наступающим новым годом!

«Говорить о войне небесполезно»: Динара Гагарина о Digital Humanities в России после 24 февраля

Динара Гагарина — основательница магистратуры по цифровым методам в гуманитарных науках в Пермском филиале НИУ ВШЭ, а также один из главных популяризаторов Digital Humanities в России. В октябре из-за антивоенных постов Динару Гагарину отстранили от руководства магистратурой, а саму магистратуру попытались закрыть. В этом интервью мы обсудили с Динарой, как ей удалось отстоять магистратуру, удастся ли властям милитаризация образования и что будет с Digital Humanities в России после 24 февраля 2022.

Закат кинопериодики в России

Министерство культуры РФ регулярно публикует данные о выдаче прокатных удостоверений фильмам. Дата-отдел «Системного Блока» решил изучить эти данные и посмотреть, что изменилось за последние 30 лет.

«Пузырь фильтров» знает о вас всё: что это такое и как он формирует медиапотребление

За последние месяцы русскоязычная аудитория СМИ и соцсетей резко поделилась на два лагеря ― на тех, кто поддерживает СВО и тех, кто выступает против. Люди получают и воспроизводят совершенно разную информацию о боевых действиях в Украине. Одна из причин ― «пузырь фильтров» . Рассказываем, что такое эффект пузыря и как его можно «проткнуть»

«Наповал из револьвера» и укус кролика: любимые открытки расшифровщиков «Пишу тебе»

Любовные и дружеские стихотворения, поздравления и рассказ об убийстве во время отдыха, счастливое спасение с парохода и кролики, прейскурант и тоска по родине… Каждый день волонтеры проекта «Пишу тебе» трудятся над расшифровкой открыток и знакомятся с удивительными историями жизни людей разных эпох, с их маленькими и большими радостями и даже трагедиями. Представляем вам подборку самых интересных находок от участников проекта.

Юдифь vs Саломея: какой библейский сюжет всему голова?

Две библейские героини — неприступная Юдифь и обольстительница Саломея — очень непохожи друг на друга. Но в истории каждой из них фигурирует голова погубленного мужчины. Поэтому в живописи их изображали удивительно похоже. C помощью викиданных мы выяснили, какая из двух героинь пользуется большей популярностью, и попытались понять почему.

Что такое взлиза и кто носил чаплыжку: цифровое «Слово Толстого»

23 ноября команда Tolstoy Digital запустила сайт «Слово Толстого» – первый цифровой путеводитель по необъятному наследию писателя

О чем поет Родина: 40% реестра «патриотической музыки» посвящено войне

В 2016 году Министерство культуры открыло официальный «каталог патриотической музыки». «Системный Блокъ» изучил, какие произведения туда включили и что это может сказать о российском понимании патриотизма.

Что такое векторные представления слов?

Если спросить, какое слово ближе к слову «король»: «правитель» или «рабочий», почти все ответят, что «правитель», конечно же, ближе. Это кажется очевидным почти всякому человеку, но как можно объяснить это компьютеру? Сегодня это легко решается представлением значений слов с помощью векторов. Векторные представления слов позволяют хранить семантику слов в понятном для компьютера виде.

«Скорого конца войны не предвидится»: русско-японская война в открытках

Уже восьмой месяц длятся полномасштабные боевые действия на территории Украины. Так называемая «специальная военная операция» превратилась в затяжной позиционный конфликт. В историческом контексте ситуация отчасти напоминает ход русско-японской войны 1904-05 гг. Именно с ней и связано крылатое выражение «маленькая победоносная война».

Что такое морфологический анализ

Слово «морфологический» может быть знакомо вам с уроков русского языка в школе — иногда там дают задания на морфологический разбор слов. В них нужно выписать слово и его часть речи, а также различные грамматические характеристики: род, число, падеж у существительного, спряжение, вид, время у глагола, разряд у местоимения. Такой разбор является одним из этапов компьютерной обработки текста, и современные методы позволяют делать его автоматически.

Тест: какой вы герой с открытки?

Пройдите тест и узнайте, какая открытка из коллекции проекта «Пишу тебе» отражает вас!

Подборка любимых открыток редакции

Сегодня, 9 октября, отмечается День почты. Именно в этот день в 1874 году был основан Всемирный почтовый союз. Его цель — продвигать почтовые услуги, делать их удобными и доступными на всей планете. В честь этой даты команда «Пишу тебе» поделилась любимыми открытками.

Мобилизация после репрессий. Как Большой террор повлиял на участников ВОВ

Даже если государственный террор не воздействует на человека напрямую, он влияет на формирование его представлений о государстве и отношение к нему. Нашел ли Большой террор отражение в действиях солдат на фронтах Великой Отечественной? Ответ поможет найти анализ данных. Спойлер: статистика показывает, что солдаты из «более репрессивных» регионов чаще подвергались уголовному преследованию в годы войны и реже сдавались в плен. В исследовании использованы данные «Международного Мемориала», получившего 7 октября 2022 года Нобелевскую премию мира.

памятники архитектуры россии

От жилых домов до Ипатьевского монастыря: ученые создали электронный свод памятников архитектуры России

Ученые из Государственного института искусствознания создали электронный свод памятников архитектуры и монументального искусства России. В нем содержится информация о всех исторических постройках трех областей страны. Помимо этого на сайте проекта можно найти архивные и современные фотографии, чертежи этих памятников и много другой полезной для людей, интересующихся историей и искусством, информации.

Куда бегут россияне: какие направления актуальны после начала мобилизации

В первую неделю мобилизации в России из страны уехало много военнообязанных и их семей. На границах образовываются пробки, КПП переходят на самокатах, а по ту сторону соседи помогают бегущим. Мы исследовали, откуда и куда уезжают россияне.

О любви, семье, друзьях и хобби: где черпать силы

Даже в самые тяжелые времена не стоит забывать о том, что нас радует. Мы отобрали самые жизнеутверждающие открытки о простом и человеческом: любви, семье, друзьях и хобби. Авторы всех писем, которые мы выбрали, верят в лучшее (или даже не думают о плохом).

Что происходит с наймом в силовых структурах после 24 февраля

За последние 20 лет силовики стали одним из самых влиятельных объединений в государственном секторе, а заодно и важнейшим работодателем. В последние месяцы число силовых вакансий в РФ ожидаемо возросло. «Системный Блокъ» изучил, какие навыки необходимы для работы в силовых ведомствах, а также проанализировал новые возможности и риски по вакансиям на HeadHunter

Что такое дерево решений

Поговорим о деревьях решений – простом и популярном методе машинного обучения.

Найди пару: однофамильцы-спойлеры на московских выборах 2022

В Москве прошли выборы муниципальных депутатов. Мы изучили списки кандидатов по округам и нашли неслучайные совпадения.

Иллюстратор статей

GPT-4 больше не лучшая языковая модель, суперкомпьютер за 100 млрд долларов и новые открытые модели

OpenAI и Microsoft строят суперкомпьютер для нейросетей, модель Claude 3 Opus от Anthropic обошла GPT-4 в одном из основных рейтингов, Илон Маск опубликовал свою большую языковую модель без цензуры.

По дорогам Великого Шелкового пути: виртуальное путешествие по древним маршрутам 

В древности не было интернета, и люди обменивались информацией другими путями. Самая грандиозная дорога древности — Великий шелковый путь, соединяла Восток и Запад с помощью торговли и культурных связей. Благодаря японским исследователям по этим маршрутам теперь можно совершить виртуальное путешествие.

Автор статей

Языковые модели — это адронный коллайдер для языка: интервью с Татьяной Шавриной

Куда развивается искусственный интеллект и какие новые умения он приобретет в ближайшем будущем? Что делать с тем, что коммерческие продукты вроде ChatGPT созданы на основе украденной интеллектуальной собственности? Есть ли внутри современных нейросетевых моделей что-то вроде физической модели мира? (Спойлер: кажется, нет.) Об этом «Системный Блокъ» поговорил с Татьяной Шавриной, руководительницей исследовательской команды в проекте LLAMA.

«В России история интернета не написана никем»: Леонид Юлдашев об изучении интернета, кибернетике, Starlink и Чебурнете

Как исследователи пишут историю интернета? Почему глобальная сеть вытеснила национальные проекты вроде французского Minitel? Почему достижения советской кибернетики не привели к созданию работающих сетей? Кто стоял у истоков Рунета и куда Рунет движется сегодня? Обо всём этом «Системному Блоку» рассказал Леонид Юлдашев, социолог, исследователь истории интернета, в прошлом координатор клуба любителей интернета и общества.

«Меня интересует знать, а не уметь»: Игорь Мельчук о нетрадиционной лингвистике, машинном переводе и жизни в Канаде

Как в СССР возник машинный перевод? Чем нетрадиционная лингвистика отличается от традиционной? Почему эмиграция иногда становится спасением жизни? Об этом в интервью изданию «Системный Блокъ» рассказал Игорь Мельчук, лингвист, заслуженный профессор Монреальского университета, один из основоположников российской математической лингвистики и Московской семантической школы.

«Нас вообще все боятся»: Александра Архипова о том, зачем фольклористы и социальные антропологи собирают слухи и считают репосты

Как примирить сторонников количественных и качественных исследований культуры? Как исследователям фольклора помогают цифровые базы данных? О чём могут рассказать лозунги митингующих и народные рецепты лечения COVID-19? Почему конспирологические теории так привлекательны? Обо всём этом «Системный Блокъ» поговорил с антропологом Александрой Архиповой.

Как устроена оцифровка дневников: Михаил Мельниченко о проекте «Прожито» и его перезапуске

Проект «Прожито» начался с небольшой группы волонтёров, собиравших и оцифровывавших личные дневники. Сегодня это крупный центр по цифровой архивации эго-документов: дневников, мемуаров, писем и других личных свидетельств времени. Основатель «Прожито» Михаил Мельниченко рассказал «Системному Блоку» о том, кто и как приносит документы для оцифровки, откуда берутся тысячи волонтёров и как изменится «Прожито» в ближайшем будущем.

«Злачные области науки»: Михаил Гельфанд о плагиате, лишении степени и неэффективных чиновниках 

В каких научных дисциплинах больше всего фальсификаций? Сколько депутатов лишились научных степеней из-за некорректных заимствований? Как работают фабрики по производству диссертаций? «Системный Блокъ» спросил Михаила Гельфанда, одного из основателей «Диссернета», как сегодня обстоят дела с плагиатом в российских научных работах.

«С экзамена в тюрьму с ChatGPT»: чей рассказ лучше, нейросети или писателя?

Еще до появления нашумевшей ChatGPT нейросети генерировали связные тексты на разные темы и в разных жанрах. Сейчас с помощью больших языковых моделей (LLM) можно написать мотивационное письмо, оригинальный рецепт вареников, диплом… и даже художественное произведение. Но правда ли, что нейросети скоро заменят живых писателей, или людям пока не о чем беспокоиться? Мы решили провести эксперимент при участии писателя Александра Сорге

Как писать художественные тексты с ChatGPT и не облажаться: советы редактора

Может ли нейросеть заменить писателя? И да и нет. Есть творческие задачи, с которыми современные языковые модели справляются легко: например, стилизовать сказку под триллер, а трагедию Шекспира — под дворовую байку. Но есть многое, в чем им нужна помощь или хотя бы руководство человека. Разбираемся, какие литературные задачи можно делегировать ChatGPT, а какие пока не стоит.

«И пусть все читают “Одумайтесь”»: Анастасия Бонч-Осмоловская о цифровом Толстом и пересборке DH после 24 февраля

Анастасия Бонч-Осмоловская ― лингвист, филолог, цифровая исследовательница, идейная вдохновительница и душа российских Digital Humanities. «Системный Блокъ» поговорил с Анастасией о работе над цифровым изданием 90-томника Л.Н.Толстого и пересборке российского DH-сообщества после 24 февраля 2022.

Петр I как зеркало милитаризации и централизации РФ: дата-исследование СБъ

В 2022 году Россия широко отмечала 350-летие Петра I. Дата была вплетена в новостную повестку: например, Владимир Путин сопоставил боевые действия в Украине и походы Петра в Прибалтику: «Чего он полез-то туда? Возвращал. И укреплял. <...> на нашу долю тоже, значит, выпало возвращать и укреплять». Позже Путин сравнивал Азовские походы Петра и свою «спецоперацию». Рассказываем, как по-разному отмечали 350-летие Петра I российские регионы и что это может говорить об устройстве РФ.

«Говорить о войне небесполезно»: Динара Гагарина о Digital Humanities в России после 24 февраля

Динара Гагарина — основательница магистратуры по цифровым методам в гуманитарных науках в Пермском филиале НИУ ВШЭ, а также один из главных популяризаторов Digital Humanities в России. В октябре из-за антивоенных постов Динару Гагарину отстранили от руководства магистратурой, а саму магистратуру попытались закрыть. В этом интервью мы обсудили с Динарой, как ей удалось отстоять магистратуру, удастся ли властям милитаризация образования и что будет с Digital Humanities в России после 24 февраля 2022.

Куда бежать, если больше нельзя в Россию: к 100-летию «философского парохода»

29 сентября 2022 года исполняется сто лет «философскому пароходу» — массовой высылке большевиками интеллигенции, не принявшей революцию. Сегодня годовщина выглядит актуально как никогда: из России уже полгода вылетают «философские самолеты», а в последние дни на границах РФ можно встретить и «философский самокат». Размышляя о судьбах страны, мы решили вспомнить, как сложились пути эмигрантов сто лет назад, наложив их жизненные траектории на электронную карту.

«У нас в культуре надо не думать, а надо прыгать»: интервью с психологом Марией Фаликман

Мария Фаликман — доктор психологических наук, профессор департамента психологии факультета социальных наук НИУ ВШЭ, специалист в области когнитивной науки. «Системный Блокъ» расспросил Марию о том, чем занимаются когнитивные исследователи, как связаны когнитивная наука и искусственный интеллект, а также почему воспоминания со временем искажаются.

Русская классика глазами нейросети ruDALLE

Как видит русскую классику нейросеть ruDALLE? Пройдите тест и попробуйте угадать, что скрывается под изображениями

Подборка материалов о русском языке ко дню рождения Владимира Даля

22 ноября 1801 года родился Владимир Даль — создатель знаменитого словаря, а до того писатель, этнограф, моряк и профессиональный хирург, из записок которого мы знаем подробности смерти Пушкина. Ко дню рождения Даля мы подготовили подборку материалов о русском языке, его эволюции и его изучении.

Тупой пофигизм вместо преглупого индифферентизма: как изменился русский язык за 100 лет

Знаете ли вы, кто такой филистер? А кого можно назвать рамольным? Часто ли вам приходится пикироваться или охорашиваться? Все эти слова — примеры уходящей лексики. Они активно использовались 100 лет назад, но сегодня практически вышли из употребления. Рассказываем об исследовании, в котором такие изменения языка выявлялись при помощи статистики и семантических векторов.

язык произведений русской литературы

Опознаете ли вы Пушкина из параллельного мира: тест по векторной литературе

Сможем ли мы отличить «Мастера и Маргариту» от «12 стульев»? Скорее всего, не ошибемся. А что если заменить некоторые слова из оригинальных произведений на близкие по значению с помощью векторной модели на базе word2vec? Предлагаем вам пройти наш тест и проверить, насколько хорошо получится опознать классические тексты, если некоторые слова в них будут модифицированы.

Программирование для филологов и нейропоэзия: интервью с Борисом Ореховым

Для чего филологу учиться программировать? Зачем учить нейросети писать стихи? Как мы опираемся на корпусные методы исследования языка в повседневной жизни, даже не замечая этого? Системный Блокъ поговорил с цифровым филологом Борисом Ореховым — доцентом школы лингвистики НИУ ВШЭ и постоянным ведущим нашей рубрики «Нейростихи».

дата-журналист

От данных — к людям: что такое дата-журналистика

Анализ смертей от алкоголизма в России и визуализация травм протестующих в Беларуси, изучение статистики наркопреступлений и расследование пыток в силовых структурах на основе тысяч приговоров — все это примеры журналистики данных. Разбираемся, чем занимаются data-журналисты и что в их работе главное. Спойлер: главное — не данные!

что такое стилометрия

Стилометрия: как в разное время люди искали авторов текстов

Сегодня для того, чтобы понять, кто написал текст под псевдонимом, у исследователей есть количественные методы анализа, в основе которых – подсчет служебных слов в тексте. О том, как люди к этому пришли, рассказываем в материале об истории стилометрии

Иллюстратор: Анна Руденко

«Цифровой антрополог отличается от Data Scientist’а вниманием к деталям»: интервью с Дарьей Радченко (КБ «Стрелка»)

COVID-19 изменил повседневные практики миллионов людей — и это видно по их «цифровым следам». Что говорят об эффективности весеннего карантина данные Инстаграма и других соцмедиа, как люди на самоизоляции «переоткрыли» заново свои спальные районы, а также каковы ограничения Data Science в социальных исследованиях — рассказывает Дарья Радченко, заместитель руководителя Центра городской антропологии КБ «Стрелка».

Над пропастью поржи: интервью с техноблогером Вастриком

Технологический блогер vas3k (в миру программист Василий Зубарев) известен всему просвещенному интернету как автор постов о машинном обучении, VR, машинном переводе, цифровой фотографии, блокчейне и других хайповых технологиях. Посты Вастрика — это панк-версия журнала «Юный техник» для читателей 18+. «Системный Блокъ» поговорил с Вастриком о вдохновении для постов, зацикленности IT на себе же и о том, почему в закрытых сообществах не работает демократия

Цифровая этнография и «дьявольский значок» уведомлений

В книге «Жизнь онлайн: исследование реального опыта в виртуальном пространстве» цифровой этнограф Аннет Маркхэм показывает, как личность, социум и отношения между людьми трансформируются под действием виртуальной среды, насколько реален цифровой опыт и что с этим делать исследователю. В интервью «Системному Блоку» Маркхэм рассказала, какие социальные стереотипы мы переносим в нашу виртуальную жизнь и другие этические проблемы будущего, что меняют в нашем поведении и восприятии Google и Netflix, а еще — как можно изучать самого себя в цифровой среде (и почему после этого люди начинают ненавидеть уведомления)

«Если бы по Евангелию жили бездумные роботы, они были бы одноглазые, однорукие и одноногие»

Как сочетаются компьютерные технологии и Церковь? Зачем настоятелю монастыря алгоритм дистрибутивной семантики word2vec? Исследовать церковные тексты количественными методами — это вообще нормально? Системный Блокъ поговорил об этом с настоятелем Свято-Троицкого Данилова монастыря игуменом Пантелеимоном

Мы вытаскиваем людей из небытия: интервью с техническим руководителем ОБД «Мемориал» Виктором Тумаркиным

В России трудно найти семью, где не было бы родственника-участника ВОВ. Но многие почти ничего не знают о судьбе близких, побывавших на войне. К 22 июня «Системный Блокъ» подготовил интервью с Виктором Тумаркиным — техническим руководителем проектов ОБД «Мемориал» и «Подвиг народа», на которых можно узнать о судьбах миллионов участников войны.

Сети Чехова: откуда вырос «Вишневый сад»

А.П. Чехов переизобрел драматический театр. Его роль в истории драматургии сравнима с ролью Эйнштейна в физике и Джобса — в мобильной электронике. В день 160-летия Чехова рассказываем о том, как посмотреть на его творчество через цифровую оптику — и что может дать такой взгляд.

Ищем смыслы: как сделать тематическое моделирование корпуса текстов

Тематическое моделирование — легкий способ понять смысловой состав большой коллекции текстов, которую невозможно быстро прочесть глазами. Пользоваться инструментами тематического моделирования может каждый — а научиться можно в нашем тьюториале. Здесь вы найдете пошаговое руководство с решением основных технических трудностей

Семантические сети: как представить значения слов в виде графа

Компьютерные лингвисты из Вышки, университета Тренто и университета Осло разработали vec2graph — инструмент для визуализации семантической близости слов в виде сети. Воспользоваться vec2graph может любой желающий. Рассказываем, как это работает и зачем нужно

"Объединить классических филологов и специалистов по цифре"

Какие возможности даёт историческому лингвисту программирование? Об этом в интервью Системному Блоку рассказал Йоханн-Маттис Лист — исследователь в области исторической лингвистики и разработчик цифровых методов для сравнительного анализа языков

Под зонтиком Digital Humanities

Ученый и писатель Роман Лейбов о том, что делать с корпусом, учить ли гуманитарию математику и чем заниматься в Рунете, если ты его пионер

Электронный след Анны Ахматовой

Учимся визуализировать открытые геоданные на примере Ахматовских мест в Москве. К 130-летию Анны Ахматовой.

Цифровая история польских евреев

Последний путь Януша Корчака и 200 детей из дома сирот, истребление Варшавского гетто, истории обычных людей — на карте, в скетчах и комиксах. Изучаем, как прошлое можно оживить цифровыми инструментами

«Хочу сделать Sci-Hub легальной платформой»

Создатель Sci-Hub Александра Элбакян — о том, как работает Sci-Hub, что нужно, чтобы этот ресурс стал легальным, и чем грозит изоляция Рунета.

Москва, мэрия, миллиарды: что расследовал Иван Голунов

Инфографика по расследованиям арестованного спецкора «Медузы» Ивана Голунова

Гуманитарии должны прогнозировать культуру

Лев Манович — о будущем соцсетей, смещении глобальных культурных центров и экспорте русского страдания

Сгоревший Нотр-Дам может спасти компьютерная игра (на самом деле нет)

Assassin’s Creed снова был готов выручить мировую культуру, но на этот раз не сложилось

Цифра на службе у филолога

“Гумилёва считали?”: лингвист и популяризатор Александр Пиперски рассказывает, как открыл для себя количественные методы, что из этого получилось и зачем они нужны филологу-исследователю

Смерть у Шекспира

Шекспир не щадил своих персонажей — каждая вторая пьеса кончалась горой трупов. Но как именно они умерли? Какие виды смерти предпочитал Шекспир?

Жутко громко, запредельно тихо: звуки в романах

Крик, рёв, бормотание, шепот: измеряем громкость в литературе

Бандитский Лондон: интерактивная карта

«Два гребца забили человека веслами», «священник из ревности заколол соперника» — криминальная хроника средневекового Лондона с привязкой к координатам

5 лучших новогодних инфографик

Зачем елке аспирин, что говорят политики в новогодних обращениях и как правильно приготовить селедку под шубой

Рембрандт к успеху шел — не фартануло

Как анализ данных предсказывает успех художника

Как нейросеть пишет песни

Языковую модель на основе рекуррентной нейросети научили подбирать тексты под мелодию с учетом пауз и длительности нот. Разбираемся, как это сделано

Не бездушная машина

Могут ли роботы сострадать? Искусственный интеллект для тяжелых эмоций и сложных ситуаций

Искусственный интеллект смотрит сериалы

Распознавание лиц используют не только в камерах слежения. Можно следить и за героями сериалов! Зачем — читайте в нашей статье!

Большой Брат узнает по походке

Прятать лицо от камеры слежения скоро станет бесполезно

Нейросеть вернула Хану Соло лицо

Технология deepfake подходит не только для создания поддельного порно со знаменитостями

Большие данные Большого террора

Каждый год у Соловецкого камня в Москве читают имена жертв репрессий — 12 часов подряд, без остановки. Но сможем ли мы когда-нибудь перечислить всех? Рассказываем о базах данных «Международного Мемориала»

Мозг против компьютера

Идею нейросетевых алгоритмов люди подсмотрели в устройстве мозга. Но современный искусственный интеллект — вовсе не копия человеческого. Разбираемся, в чем главные отличия

Как впечатлить робота: собеседование с искусственным интеллектом

Как машинное обучение и нейро-игры оценивают кандидатов при приеме на работу — и почему в интервью с бездушной машиной все еще важна внешность

Во что превращается жизнь без любви

Как компьютеры сравнивают значения слов, и почему это бывает смешно

Нейросеть научилась диагностировать депрессию

Скоро у тебя в смартфоне появится автоматический диагност, который первым заметит, что ты чот приуныл

Лампочка светит, а лапочка — нет: как компьютеры «вычисляют» значения слов

Откуда поисковики знают, что «пожрать», «поесть» и «кафе» — это близкие вещи? Как можно научить алгоритм различать слова по смысловой близости?

Праздник или смерть? Драма в сети!

Чем отличаются социальные сети трагедий и комедий?

Жарим стейк онлайн — с учеными из MIT

Веб-сервис от физиков из Массачуссетса для прожарки мяса по-научному

Зомбоящик опасен для вашего (искусственного) интеллекта

Нейросеть научилась проходить компьютерные игры благодаря имитации «любопытства». Но когда в один из уровней добавили телевизор — алгоритм залип над его просмотром и остановился...