Фото автора

Даниил Скоринкин

Главный редактор

Цифровой литературовед, программирующий гуманитарий

Блог автора

Горький урок ABBYY: как лингвисты проиграли последнюю битву за NLP

Недавно СМИ облетела новость об увольнении всех российских программистов из компании ABBYY (тоже в прошлом российской, а теперь уже совсем нет). Теперь, когда страсти вокруг обсуждения дискриминации сотрудников по паспорту улеглись, хочется поговорить о более глубокой истории. Закат ABBYY — это фиксация проигрыша последней битвы лингвистов за автоматическую обработку языка. Мир Data Science победил. Главный редактор «Системного Блока» Даниил Скоринкин, работавший ABBYY в 2013–2017, подводит итоги и пытается сформулировать уроки из этой истории, начало которой — еще в 1990-х годах. С мемасами и метафорами.

Нейросети и коммунистическая революция в интернете

Призрак революции снова бродит вокруг нас — и борьба с ним все так же бесплодна. К 175-летию «Манифеста коммунистической партии» Карла Маркса и Фридриха Энгельса

Сокровища с барахолки: как мы искали старые открытки в Узбекистане

Команда проекта «Пишу тебе» уже устраивала экспедиции за открытками в музеи Петербурга и Москвы. Но найти послания из прошлого можно не только в учреждениях культуры. Недавно мы оцифровали около 60 открыток на крупнейшем блошином рынке Средней Азии — базаре Янгиабад в Ташкенте. Рассказываем об этой случайной экспедиции.

Редактор статей

Смысл спецоперации и спецоперация смыслов: как пропаганда «денацификации» и «демилитаризации» Украины отражается в поиске

Тезис «Россия проводит специальную военную операцию по демилитаризации и денацификации Украины» будет справедливо дополнить фразой «в российских СМИ». Системный Блокъ проанализировал архив СМИ за первое полугодие 2022 года и узнал, какие смыслы (и сколько) транслируют медиа по поводу «спецоперации».

«Отмена русской культуры»: что показывает статистика цифровых следов?

С февраля 2022 года в новостях и разговорах можно услышать про «отмену русской культуры» в рамках «культуры отмены». Что это такое, можно ли отменить культуру и как любопытство пользователей интернета может помочь в этом разобраться? «Системный Блокъ» посчитал упоминания в СМИ и проанализировал поисковые запросы.

Что такое глубинное обучение?

Как связаны глубинное обучение и машинное обучение? На что влияет «глубина» нейронной сети? Рассказываем о важнейшей области машинного обучения.

«Будь умницей, а то приеду и налуплю»: подборка открыток к 1 сентября

Казалось бы: времена идут, столько всего должно поменяться… Но отношения к учебе это как будто не касается — о ней всегда говорят похожие вещи. Кто-то жалуется на загрузку, кому-то не нравятся соседи в общежитии, а у кого-то обучение проходит за границей и он/она страдает от непривичных и суровых правил. Ко дню знаний делимся подборкой открыток о школе, университете и даже учебных курсах!

«Игнорируется и не ценится»: вклад женщин в науку через цифры

Если посмотреть на голую статистику, может показаться, что женщины-ученые публикуют меньше научных статей, чем их коллеги-мужчины, а также реже получают гранты и патенты. Исследование Мэтью Росса из Северо-восточного университета в Бостоне и его коллег показало, что реальное положение дел может быть куда сложнее: женщинам в науке бывает нелегко добиться указания их авторства из-за дискриминации.

Камера на сотню: как развивается видеонаблюдение в Москве

Москва входит в топ-30 городов по покрытию камерами. Цифровизация наблюдения уменьшает риск преступности, но при этом и помогает государству выследить любого гражданина.

Что такое кластеризация?

Разберём, что такое кластеризация, поговорим об известных ее методах и расскажем, зачем она используется в реальных задачах

«Системному Блоку» четыре года: вспоминаем четыре главных поста последних месяцев

В последний год работы «Системный Блокъ» много писал о том, что происходит не только в мире науки, но и в мире вообще. Неудивительно, что в числе главных постов этого года — сухие страшные цифры, новые технологии и значимые исследования.

Подборка материалов по стилометрии

Сегодня филологи не только активно читают, но и активно вычисляют: авторство, особенности перевода, даже эмоции в текстах. О том, когда и почему это может быть важно, читайте в нашей подборке стилометрических исследований.

Куда едут украинские беженцы: изучаем данные

Более 7 миллионов человек покинули Украину за три месяца боевых действий. Смотрим на данные самого масштабного миграционного кризиса с середины XX века

Нейросети помогают историкам восстановить древние тексты

Модель Ithaca позволила повысить точность реставрационных работ почти в три раза: с 25% до 72%

Двойной учет: как Минюст ведет списки иностранных агентов

Моргенштерн, Юрий Дудь, Екатерина Шульман, Face, Алексей Венедиктов…. Каждую неделю мы слышим о пополнении реестра «иноагентов» новыми именами. Но как устроен этот реестр и для чего в нем целых четыре списка? Мы подготовили для вас разбор системы учета «иноагентов» с понятной инфографикой.

Запрещенные в России социальные сети

Instagram и Facebook* этой весной стали запрещенными, YouTube все чаще грозятся закрыть, а Минцифры составило список отечественных аналогов Zoom и Twitter. Мы спросили экспертов Роскомсвободы, стоит ли нам ждать полностью суверенного Рунета, и разбираемся, что вообще произошло с социальными сетями и интернетом в России этой весной

Нетворкинг Пикассо и Уорхола: сетевой анализ выставок в МоМА

Нью-йоркский музей МоМА — один из старейших музеев современного искусства в мире. В MoMA хранятся работы Рене Магритта и Энди Уорхола, Джексона Поллока и Марко Ротко, Марка Шагала и Казимира Малевича, Сальвадора Дали и Пабло Пикассо. А еще там постоянно проходят выставки — их было так много, что это можно изучить цифровыми методами.

Ниоткуда с любовью: в коллекции открыток «Пишу тебе» заработал поиск

Мы оцифровали тысячи старых открыток, но до сих пор у нас не было по ним удобного поиска. Теперь можно искать по датам, местам отправления и получения, тематическим тегам и по текстам открыток.

Неизвестное будущее: как не сойти с ума в условиях неопределенности

Еще месяц назад мы с уверенностью смотрели в будущее, почти привыкнув к «новой нормальности» в мире с пандемией. Но оказалось, что впереди нас ждали внезапные события, имеющие колоссальные последствия для всех. Как в условиях неопределенности сохранить способность мыслить? Как поддерживать себя и близких? Как реагировать на острые ситуации? И что делать с планами, которые рассыпались за секунды? «Системный Блокъ» попросил психологов ответить на вопросы, которые волнуют нас сегодня.

Что такое онтология

Изучением всего сущего и категоризацией понятий и объектов занимается не только философия, но и компьютерная наука. Как это может помочь оптимизировать работу поиска, предостеречь от кибератак и построить графы знаний? В новой статье глоссария рассказываем об онтологии – формате хранения структурированных данных – и объясняем, зачем ее создавать и где применить.

Knowledge Graph или граф знаний: что это такое и где применяется

Порой поисковик понимает нас лучше, чем мы сами. Например, по запросу «фильм, в котором был грунт» он ответит верно и выдаст «Стражей галактики». Это возможно благодаря Knowledge Graph – семантической сети, которая умеет выявлять взаимосвязи между разными объектами. В новой статье глоссария рассказываем, что такое граф знаний, как он устроен и чем помогает поисковикам.

«Буду кормить вшей и блох»: подборка открыток с фронтов

Война отражается не только в перемещениях войск, сражениях и потерях. Война проникает глубоко в быт, и затем историки находят ее следы в самых личных вещах. Например, в переписках солдат и офицеров с семьями. Рассказываем о том, что писали в открытках с фронтов мировых войн.

Культура в цифровом сите: что остается за кадром

Инна Кижнер — старший преподаватель кафедры информационных технологий в креативных и культурных индустриях, научный сотрудник лаборатории «Digital Humanities» Сибирского федерального университета. В интервью «Системному Блоку» она рассказала, каким искажениям подвержены цифровые коллекции музеев, какие культурные явления можно исследовать благодаря оцифровке и как должна выглядеть идеальная цифровая коллекция.

Нейроцензура: генератор стихов Пушкина отказался писать о России, самовластье и царе

Бот «AI да Пушкин» дописывает любую предложенную ему фразу до четверостишия в стиле А.С. Пушкина — но только если в ней нет «запретных» слов

Обратный тест Тьюринга

Тест Тьюринга придумали в середине 20 века, чтобы измерить интеллект машин и проверить, насколько он схож с человеческим. Сегодня мы все еще используем этот тест, но чаще с обратной целью: теперь компьютер проверяет наш интеллект. Рассказываем про обратный тест Тьюринга, популярные капчи и объясняем, зачем нам все это нужно

Как плести виртуальные сети с помощью Gephi

Gephi — самый известный инструмент для визуализации графов и сетевого анализа. С его помощью можно исследовать и население Викторианской Англии, и отношения героев «Войны и мира», и странички друзей Вконтакте. Рассказываем максимально просто, как пользоваться Gephi

Что такое геоданные

Сегодня с геоданными взаимодействует практически каждый. Мы заказываем такси и еду, используем навигацию, изучаем цифровые карты, чтобы понять местность или найти нужное заведение. С помощью геоданных наука может предсказать экологические проблемы, а бизнес и государство – строить логистику компаний, контролировать строительство, нефтяную отрасль, развивать сельское хозяйство. Всё это возможно благодаря геоинформационной системе с огромным количеством данных о местности, инфраструктуре, экологии. В этой статье мы коротко расскажем о видах геоданных, для чего они нужны и где применяются

Студенчество сквозь столетие: подборка открыток ко Дню студента

Студенчество – сложный период, о котором часто вспоминают с трепетом и теплом. Учиться всегда было непросто: бессонные ночи, стресс, бесконечные сессии. Начинались и заканчивались войны и эпидемии, менялся алфавит и технологии коммуникаций, но люди, несмотря ни на что, стремились к образованию. Ведь университет – это целая экосистема, внутри которой студент становится взрослым человеком. Об этом пишут книги и снимают фильмы, а мы собрали для вас самые интересные открытки студентов и о студентах со времен Российской империи до начала XXI века.

«Мы заставили нейронную сеть креативить»: как алгоритмы моделируют химические реакции

Учёные придумали систему, которая поможет в поиске синтеза новых лекарств. В разработке участвовали исследователи из университетов Страсбурга, Казани и Хоккайдо. Один из руководителей проекта, Тимур Маджидов из Казанского федерального университета, подробно рассказал об истории и работе нейросети и будущем химии

Нейросеть не потечет: можно ли накраситься цифровым макияжем

Маски в Инстаграме и ТикТоке способны изменить лицо до неузнаваемости или вообще превратить его в зайчика/оленя/волдеморта. Создание таких масок не обходится без нейросетей и играет в цифровом мире в основном развлекательную роль. Но что если те же технологии можно применить в образовательных целях?

«Желаю в веселье и радости провести и не нажить, опохмелившись, головной боли»: как поздравляли с Рождеством 100, 50 и 10 лет назад

Проект по оцифровке открыток «Пишу тебе» подготовил очередную тематическую подборку. На этот раз мы подобрали открытки, в которых есть поздравления с Рождеством Христовым. В наши дни традиция поздравления открыткой уже не так распространена. Однако среди наших прабабушек и прадедушек начала прошлого столетия такой жест был довольно популярен. Почитаем, что же они там писали.

«Системный Блокъ»: лучшее за 2021 год

По традиции 31 декабря «Системный Блокъ» публикует подборку лучших материалов уходящего года. В 2021-м в подборке оказались спецпроект в духе «Намедни» к 30-летию крушения СССР, дата-исследование зарплат учителей в России, выпуск подкаста о том, как врет искусственный интеллект, тесты о средневековых студентах и о цифровых гуманитариях и видео о людях, из которых состоит сам «Системный Блокъ». С новым годом!

Знаете ли вы, как информационные технологии повлияли на общественно-политические процессы?

Реформы, перевороты, вооружённые конфликты, распад СССР… Все это происходило параллельно с развитием интернета и становлением массовой IT-индустрии. Как информационные технологии изменили общество после крушения Советского Союза? Пройдите тест и узнайте, насколько точно вы помните события, сформировавшие лик современности.

Скажи «да» по-русски: зачем нужен «Прагматикон»

Многие говорят, что эффективный способ выучить иностранный язык – смотреть сериалы на этом языке. Если вы тоже пробовали такой метод, то наверняка обращали внимание, как какой-нибудь герой из сериала Netflix вместо простых «нет» или «да» произносит не всем знакомые выражения типа no way или you bet. Что это такое и почему об этом почти не говорили на уроках в школе? Рассказываем о дискурсивных формулах и новом цифровом ресурсе для их изучения в русском языке, а также поиска аналогов в английском

Компьютерное моделирование психических процессов: как компьютеры имитируют человека

В 1950 году Алан Тьюринг написал работу Computing Machinery and Intelligence («Вычислительные машины и разум»). Уже тогда, на заре развития кибернетики, люди задумывались о создании компьютера, который бы мог думать подобно человеку. Вслед за инженерами к проблеме и подключились психологи. Моделирование психических процессов до сих пор остается одной из самых разрабатываемых областей когнитивной науки.

Что видела Зоя в пещере: эксперт — о дореволюционных пермских открытках

В коллекции проекта «Пишу тебе» есть старинные открытки, которые хранят сведения о локальной истории, архитектуре и повседневной жизни ушедших эпох. Сегодня рассказываем о двух открытках, отправленных в Пермской губернии в 1915 году. Открытки комментирует эксперт Юлия Бушмакина

Путешествие во времени: подборка дореволюционных открыток из будущего в прошлое

Сегодня 15 октября. И в любой стране Европы тоже 15 октября. Правда, к такому единогласию в календарях мы пришли недавно: чуть больше ста лет назад. До этого Россия и Европа жили буквально в разных временах. Как эта разница отразилась в почтовых открытках, читайте в нашем новом материале от проекта «Пишу тебе»

Как превратить текст в генеалогическое древо с помощью Python

Как понять, кем вам приходится сваха внучатого племянника вашей сестры? Проще всего - нарисовать генеалогическое древо, которое отразит все родственные связи. А еще лучше - написать код на Python, который сделает это за вас

Тест: что говорит статистика о выборах в регионах России

17–19 сентября 2021 года в России прошли выборы в Государственную Думу. Независимый электоральный аналитик Сергей Шпилькин* построил графики, которые отражают результаты голосования в разных регионах. По ним можно предположить, были ли на выборах фальсификации. Пройдите наш тест и проверьте, сможете ли вы понять, какой регион на каждом графике?

«Кладмен мудак»: анализ тональности отзывов о запрещенных веществах

Язык интернета имеет свои характерные черты. И если исследованию языка Рунета посвящено множество работ, то DarkNet все еще остается серым пятном в этом плане. С помощью анализа тональности текстов выясняем, какая лексика характерна для отзывов о запрещенных веществах.

Веселое Рождество для великой княжны: как поздравляли друг друга в старых открытках

Наш проект по оцифровке открыток «Пишу тебе» продолжает исследовать свою постоянно растущую коллекцию. На этот раз мы изучили поздравительные открытки, написанные как до, так и после революции. Некоторые популярные поздравления сегодня выглядят неожиданно, хотя раньше были распространены повсеместно.

Подборка летних открыток дореволюционного и советского времени

Уже минула середина лета, кто-то еще только в предвкушении отпуска, а кто-то возвращается из поездок, путешествий, приключений. Такие моменты хочется разделять с близкими людьми. В дореволюционное и советское время популярным способом поделиться впечатлениями из поездки было отправление почтовых открыток с изображением городских достопримечательностей. Проект «Пишу тебе» сделал подборку летних почтовых открыток, где люди рассказывают об отдыхе и путешествиях.

«Это имитация интеллекта»: Константин Воронцов — о настоящем и будущем машинного обучения

Сможет ли человечество построить искусственный интеллект, не уступающий человеческому, и надо ли его строить? «Системный Блокъ» обсудил это с Константином Воронцовым, одним из известнейших специалистов по машинному обучению в России. Публикуем его ответы на наши вопросы

«Желаю быть паинькой»: как поздравляли с днем рождения в дореволюционных открытках

Сегодня Системный Блокъ отмечает свой третий день рождения. День рождения - очень добрый праздник. В этот день именинник получает приятные пожелания от близких людей. И никакие расстояния не помеха чтобы сказать теплые слова дорогому человеку. Сейчас нам не составит труда позвонить имениннику или отправить ему пожелания в мессенджере. А в начале XX века единственным способом поздравить на расстоянии человека было отправление почтовых открыток или писем.

зарплаты учителей в россии

«Марь Иванна, у вас воротничок сине́ет»: исследование СБъ о зарплатах учителей

Сегодня в России более 1,3 млн учителей средних школ. «Системный Блокъ» решил узнать, насколько учитель средней школы в России подходит под критерий среднего класса. Говоря геймерским языком: насколько трудно «проходить Россию» на уровне сложности «medium teacher»

Байкал

Нейросеть проследит за чистотой Байкала

Российские ученые начали разработку нейросетевого алгоритма для мониторинга экосистемы озера Байкал. Он будет делать анализ проб воды, автоматически распознавать и классифицировать живущие в ней микроорганизмы. Раньше это делалось вручную.

Привет с фронта: военные открытки

80 лет назад, 22 июня 1941 года, началась Великая Отечественная война. В военное время было особенно важно сообщить вести о себе своим близким, друзьям, знакомым. Проект «Пишу тебе» отобрал фронтовые открытки, посвященные тем временам. Эти открытки наполнены любовью, заботой и надеждой на встречу с родными

Как видят мир беспилотники и почему «обучение с учителем» сломано. Расшифровка подкаста с Борисом Янгелем

Эта страничка — дополнение к XI выпуску подкаста «Неопознанный Искусственный Интеллект». В этом выпуске мы общались с Борисом Янгелем из команды разработки беспилотных автомобилей в Яндексе. Здесь вы найдете полную расшифровку, оглавление выпуска и полезные ссылки

документы ВОВ

Что можно найти в цифровом архиве «Документы Победы»

Цифровой архив «Документы Победы» хранит свидетельства о том, как управлялись войска, оборонная промышленность и прочие отрасли хозяйства во время Великой Отечественной войны.

Рыбий жир полнит: о чем писали дети в открытках

1 июня — международный день защиты детей. К этому дню проект «Пишу тебе» собрал подборку старых открыток, написанных детьми. Юные авторы открыток рассказывают родителям о понравившихся игрушках, школьных отметках и последствиях употребления рыбьего жира.

Виден ли конец «нейронного блицкрига»: компьютерные лингвисты между вычислениями и теорией. Расшифровка подкаста с Денисом Кирьяновым

Публикуем материалы к восьмому выпуску подкаста «Неопознанный Искусственный Интеллект»: текст расшифровки выпуска, оглавление, полезные ссылки и термины.

цифровой гуманитарий

Тест: какой вы цифровой гуманитарий?

Пройдите тест, который покажет, кто вы в мире цифровых гуманитарных исследований. А заодно — познакомьтесь с известными цифровыми гуманитариями.

В пространстве текстов: детоксикация комментариев, подделка отзывов и нейроцензура

Как работают современные методы переноса стиля? Могут ли они быть полезны или опасны? И при чём здесь «бутылочное горлышко» нейросети?

дата-журналист

От данных — к людям: что такое дата-журналистика

Анализ смертей от алкоголизма в России и визуализация травм протестующих в Беларуси, изучение статистики наркопреступлений и расследование пыток в силовых структурах на основе тысяч приговоров — все это примеры журналистики данных. Разбираемся, чем занимаются data-журналисты и что в их работе главное. Спойлер: главное — не данные!

Как работают нейросети: подборка постов с пошаговыми разборами

Разбираем сложные технологии глубокого обучения, чтобы они становились понятны каждому

Почему искусственный интеллект врет и как его его от этого отучить. Расшифровка подкаста с Давидом Дале

Публикуем материалы к седьмому выпуску подкаста «Неопознанный Искусственный Интеллект»: текст расшифровки выпуска, оглавление, полезные ссылки и термины.

тест по средневековым университетам

Кто такой педель и как получить матпомощь в XIV веке? Тест по cредневековым университетам

Быть студентом в Средние века — это вам не с айфона шпоры списывать. Но многие знакомые современным студентам вещи были в университетах уже тогда. Например, землячества или материальная помощь для малообеспеченных. Проверьте ваши знания об университетской жизни в Средневековье.

Автор статей

Геоинформационный анализ поэтического вдохновения

Анализ маршрутов путешествий английских литераторов XVIII века средствами современной геоинформатики

Смертельный твит

Смертность от сердечно-сосудистых болезней можно предсказать с помощью лингвистического анализа сообщений в Twitter

Государевы потехи и «чюланы с вином» у Кремля

Изучаем старые карты России в современном веб-сервисе с геопривязкой — и испытываем эстетический оргазм

Ночь перед дедлайном или Рамадан: жизнь ученых в разных странах по логам Sci-Hub

Французские ученые любят пообедать, их русские коллеги жертвуют работе воскресенье, а Москва иногда все-таки спит. Но Новосибирск спит больше

Что такое N-граммы и с чем их едят?

Вы могли уже встречать термин N-грамма. Если вас пугало или вы хотели получше разобраться, что это, то этот пост для вас

Смерть в сети: зачем литературоведам графы

Как анализ социальных сетей Гамлета и Наташи Ростовой помогает филологам проникать в структуру произведения и делать открытия