Фото автора

Системный Блокъ

Маскот

Коллективный автор

Редактор статей

Автономный ИИ-инженер и новое о Sora: дайджест новостей в мире искусственного интеллекта

Создатели Sora рассказали, откуда брали видео для обучения, но кое о чем умолчали. Компания Cohere — один из главных конкурентов OpenAI/ChatGPT — выпустила модель с 35 млрд параметров. Вышла сопоставимая с трансформерами RNN-модель EagleX — неужели рекуррентные нейросети рано хоронить? Рассказываем, что произошло в мире ИИ за прошедшую неделю

Интернет-эстетика Dark Academia в исторической перспективе 2010–2020-х гг.

Почему COVID-19 сделал популярной Dark Academia? Рассказываем, как романтизация мрачности связана с самоизоляцией.

Sora: как работает модель для генерации видео по тексту

Недавно компания OpenAI, создавшая модели GPT и сервис ChatGPT, выпустила новую модель Sora, которая генерирует видео по текстовому описанию. Такие модели были и раньше, но здесь произошёл качественный скачок. Во-первых, Sora умеет генерировать реалистичные видео в высоком разрешении (вплоть до FullHD), во-вторых, объекты в видео консистентны в течение всего времени. Рассказываем, как работает Sora, какие у неё есть ограничения и неожиданные особенности.

Что такое capta и чем отличается от больших данных?

Рассказываем про вид данных, отличающийся от привычных big data, и чем малые данные похожи на археологический раскоп.

Как устроена оцифровка дневников: Михаил Мельниченко о проекте «Прожито» и его перезапуске

Проект «Прожито» начался с небольшой группы волонтёров, собиравших и оцифровывавших личные дневники. Сегодня это крупный центр по цифровой архивации эго-документов: дневников, мемуаров, писем и других личных свидетельств времени. Основатель «Прожито» Михаил Мельниченко рассказал «Системному Блоку» о том, кто и как приносит документы для оцифровки, откуда берутся тысячи волонтёров и как изменится «Прожито» в ближайшем будущем.

Правда глаза колет: 150 лет истории айтрекеров

В психологии и психолингвистике айтрекинг — давно известная и популярная технология. Рассмотрим, как она появилась и почему первым испытуемым приходилось терпеть тупую иглу на веке или присоску с радиоантенной на глазу. Но не пугайтесь: сейчас для исследования движений глаз применяют бесконтактные технологии. И об инвазивных методах, и о новых способах айтрекинга расскажем в нашем материале

Научим любить Родину… и мать твою: о чём говорят на «Разговорах о важном»

С сентября 2022 года в российских школах идут «Разговоры о важном». Это внеклассные уроки, направленные, по словам авторов идеи, на «укрепление традиционных российских духовно-нравственных ценностей» и «воспитание патриотизма» среди российских школьников. Ко дню учителя «Системный Блокъ» изучил содержание этих уроков, применив метод тематического моделирования.

Научный журналист должен быть аутсайдером: Ольга Добровидова о научной коммуникации и научной журналистике

Научный и экологический журналист Ольга Добровидова — о разнице между научными журналистами и научными коммуникаторами, о конфликте интересов между научным сообществом и общественным благом, а также о том, как вырос запрос на медицинскую журналистику.

Почтовая открытка «Генеральская дача» из Екатеринбурга в Камышлов.

«Генеральская дача» в Екатеринбурге

Исторические здания и территории имеют разную судьбу: некоторым из них суждено украшать обложки книг и журналов, а другие становятся малозаметными и ненужными, оставаясь за рамками новых городских пространств и туристических маршрутов. К таким забытым историческим территориям относится Генеральская дача в Екатеринбурге. В дореволюционное время летом здесь жили начальники горных заводов и гуляли жители города, а находящаяся тут плотина была уникальным инженерным объектом своего времени. Как Вы уже поняли, рубрика «Путешествие с открыткой» сегодня в Екатеринбурге, в месте под названием Генеральская дача.

Как провести стилометрический эксперимент с помощью stylo?

Системный Блокъ уже рассказывал о том, что такое стилометрия, и о многих стилометрических исследованиях. Читайте подробный гайд, как самому провести такой эксперимент — с помощью stylo, библиотеки языка R и самого популярного инструмента для стилометрии.

Что такое цифровое наследство?

Разбираемся, что такое цифровое имущество и как подготовить свои цифровые активы к передаче по наследству.

Русско-китайский корпус НКРЯ, или как превратить ботвинью в гаспачо

Параллельный корпус — это коллекция текстов, где для каждого текста хранятся его переводы на другой язык (или языки). Параллельные корпуса позволяют узнать, какие приемы и стратегии использовал переводчик для передачи слов, у которых нет эквивалентов в другом языке. В этой статье мы расскажем про русско-китайский параллельный корпус в составе Национального корпуса русского языка.

Как это устроено: мастерские «Пишу тебе»

Как правильно расшифровывать почтовые открытки? Команда проекта «Пишу тебе» каждый месяц проводит специальные мастерские, во время которых все желающие постигают премудрости расшифровки открыток под присмотром Тимура Хусяинова, куратора отдела добычи открыток проекта. Участники мастерских получают возможность не только расшифровать предоставленные им открытки, но и узнать историю живых людей, стоящих за их отправкой: отправителя и получателя. Некоторые участники мастерских приносят и свои открытки, которые пополняют коллекцию «Пишу тебе».

Что такое визуализация данных?

Зачастую данные содержат полезную информацию — от цен на «Биг Мак» в разных странах, по которым можно оценить стоимость валюты, до коррупционных схем высших должностных лиц и свидетельств военных преступлений. Поэтому существует множество способов извлечения важной информации из большого и сложно устроенного массива данных. В этом материале мы расскажем об одном из таких методов — о визуализации данных.

Гулливер и нейросети: интернет-банкинг и онлайн-торговля в произведениях писателей XVIII-XIX века

Фантастика часто предугадывает будущие достижения науки и техники. «Системный Блокъ» уже рассказывал, как русские писатели XIX века предсказали появление генеративных нейросетей, мессенджеров, соцсетей и компьютеров. Теперь посмотрим на предсказания зарубежных писателей: онлайн-торговлю, интернет-банкинг, дистанционное образование, искусственный интеллект и новостные агрегаторы.

Виртуальные кладбища: от кладбищ геймеров до кладбищ домашних животных

Разбираемся, какие есть виды виртуальных кладбищ и почему некоторые виды приобретают отклоняющиеся формы.

Виртуальные кладбища: можно ли создать себе цифровой памятник?

Разбираемся, что такое виртуальные кладбища и пробуем понять, как трансформируется отношение к кладбищам в новой реальности.

Что такое генеральная совокупность и выборка?

Наша жизнь полна разных событий, и иногда на их основе нам хочется сделать какой-то определенный вывод или отыскать закономерность в происходящем. Всем известная фраза «Все мужики козлы» — один из таких случаев. У человека, который говорит эту фразу, скорее всего, имеется неудачный опыт общения с определенной группой лиц мужского пола (в статистике это называют экспериментами), и на основе этого неудачного опыта был сделан такой вывод. Почему это утверждение в корне неверное с точки зрения статистики? Когда можно делать выводы, основываясь на неполных данных, а когда нет? В этой статье постараемся ответить на эти вопросы.

Лазеры, GPS и камера на 360 градусов: как студенты сделали 3D-тур по церкви X века

Тотальная станция, GPS, лазерный сканер, камера на 360 градусов, термокамера — что это за приборы, как ими пользоваться и зачем они нужны? Участники летней школы в Италии за неделю с помощью этих приборов создали виртуальную прогулку по монастырю Сан Саба, 3D-модель части здания и виртуальную реконструкцию фресок. Одна из участниц проекта рассказала подробности «Системному Блоку».

Обсуждая гуманизм: тематическое моделирование немецкоязычной прессы XIX в.

Как цифровые методы помогают понять эволюцию идеи гуманизма в Германии XIX века? Рассказываем об исследовании «гуманистического дискурса» в немецкоязычных газетах при помощи тематического моделирования.

Что такое машинное обучение?

Отвечаем на все вопросы о машинном обучении, которые вы боялись задать

«К идее разных интернетов мы пока не привыкли»: Полина Колозариди об исследованиях интернета

Полина Колозариди — интернет-исследователь, координатор Клуба любителей интернета и общества, преподавательница ИТМО и НИУ ВШЭ. «Системный Блокъ» поговорил с ней о том, чем занимаются интернет-исследователи, как развивался и чем различается интернет в разных городах России, и как связаны интернет и демократия.

Что такое мешок слов

Рассказываем, что такое мешок слов и как он может помочь в задачах автоматической обработки текста

Автор(ы) умер(ли), а проблемы остались

Продолжаем разгадывать вечную тайну «Беовульфа» и рассказывать о том, как цифровые филологи строят научный диалог в поисках правды.

«У нас в культуре надо не думать, а надо прыгать»: интервью с психологом Марией Фаликман

Мария Фаликман — доктор психологических наук, профессор департамента психологии факультета социальных наук НИУ ВШЭ, специалист в области когнитивной науки. «Системный Блокъ» расспросил Марию о том, чем занимаются когнитивные исследователи, как связаны когнитивная наука и искусственный интеллект, а также почему воспоминания со временем искажаются.

Что такое нейросеть GPT-3 и зачем она нужна

Общение с чат-ботами и голосовыми помощниками стало частью повседневного опыта. Мы спрашиваем у нейросетей о погоде и пробках, просим переводить и сочинять тексты, проверяем их способности стихосложения и иногда даже делимся сокровенными секретами. СБъ уже не раз рассказывал о работе языковых моделей, которые делают боты более человечными. Предлагаем освежить знания и прочитать материал из глоссария про наиболее крупную и продвинутую языковую модель в мире – GPT-3

Отмороженный искусственный интеллект: зима (не) близко

Многие представляют себе искусственный интеллект по фантастике. Альтрон из «Железного человека», ВИКИ Азимова, «Мир Дикого запада» и «Апгрейд» — все это выглядит, как торжество развития технологии, способной и улучшить жизнь человечества, и положить ему конец. Правда, реальный искусственный интеллект пока далек от того, что показывают нам в фильмах и книгах. Но это не повод расстраиваться — ведь в истории ИИ были и куда более тёмные времена

В российскую медицину приходит ИИ: чего ждать и где он появится раньше

В России в апреле официально зарегистрирован первый искусственный интеллект в медицине. Неужели из-за COVID? (Спойлер: нет; но к борьбе с коронавирусом его все равно привлекли)

Сейчас вылетит птичка: что внутри у платформ для изучения языка?

Мы часто воспринимаем платформы для изучения языка как волшебные инструменты, с помощью которых и вправду можно выучить японский за тридцать дней. Приложения типа Lingualeo или Memrise добросовестно напоминают нам о необходимости пройти новый раздел грамматики или повторить слова, сопровождают каждый урок смешными примерами и вообще предлагают довольно широкий выбор тем — интересно будет и маленькому ребёнку, и начинающему новый язык взрослому. Но как именно организовать такой обширный материал? Давайте разберёмся на примере всем известного Duolingo

Цифровое окно в природу

Миллионы людей по всему миру помогают науке, собирая фотографии живых организмов и пополняя гигантскую базу iNaturalist. Из-за пандемии снимать стало сложнее, но помочь науке все равно можно. Рассказываем, как это сделать

Zoom ему пухом

Разбираемся, как прямые трансляции похорон в Zoom и Facebook спасают ритуальную индустрию и влияют на участников церемонии

Стали ли современные поп-песни грустнее за последние 50 лет?

Поп-музыка — практически неограниченное пространство для исследователя. Можно попробовать изучать ее инструментами социологии, теории музыки, культурологии и еще десятка дисциплин, но самый простой способ — проверить, как меняются тексты в самом распространенном музыкальном стиле последнего столетия

Белкография: кто и зачем считает белок в Центральном парке?

Если вы учитесь на картографа и не знаете, чем заняться в жизни, не переживайте: всегда есть вероятность, что вас попросят нанести на карту пару тысяч белок. Подробнее о потенциальном рабочем месте — в этой статье

Есть ли стиль у переводчика? А если найдем?

Как инструменты стилометрии помогают исследовать относительную силу стилистического отпечатка автора и переводчика в художественном тексте

На распутье Digital Humanities

Недотехнари, псевдоученые, шарлатаны — как только не называли цифровых гуманитариев (и как они сами себя только не называли). Представители этого направления проводят исследования, выигрывают гранты, и при этом Digital Humanities все еще не имеет до конца сформированной методологии и научной базы. Так кто же такие дигитальные гуманитарии и что их ждет в будущем?

Как GPS делает нас тупее — и как этому противостоять

Все еще пользуетесь навигатором, катаясь на машине по родному городу? Постоянно заглядываете в Google.Карты во время пеших прогулок? Альцгеймер уже идет к вам!

Невидимые кинозвезды: как Голливуд не замечает женщин-режиссеров

В 2010 году «Оскар» за лучшую режиссуру впервые получила женщина — Кэтрин Бигелоу с фильмом «Повелитель бури». Стали ли после этого режиссеры женского пола более заметными фигурами в киноиндустрии? Редакция «Системного Блока» провела исследование, проследив динамику упоминаний женщин-режиссеров в статьях популярных киножурналов

Вавилонская нейросеть для многоязычного перевода

Не так давно заговорили о том, что система нейронного машинного перевода от Google сама научилась переводить в языковых парах, для которых у неё нет параллельных корпусов. Действительно ли онлайн-переводчик изобрел собственный универсальный язык, машинную интерлингву?

Роботы вступают в гонку вооружений: военные применения ИИ

Военные используют искусственный интеллект с момента его появления. Самонаводящиеся ракеты с компьютерным зрением поступили на вооружение еще в разгар Холодной войны, с начала 2000-х активно применяются беспилотные ударные дроны, обретающие все больше самостоятельности в решении вопросов жизни и смерти... Что дальше?

Зачем нужны гуманитарии в эпоху машинного обучения?

Если ты гуманитарий — не отчаивайся. Если технарь — дружи с гуманитариями!

Роботы-симпатяжки втираются в доверие

Как стать больше, чем просто роботом-доставщиком, и научиться коммуницировать с людьми? Надо быть милым, выучить «словарь поведения» и уступать человекам дорогу

Полезные ресурсы для digital гуманитариев. Документы и слайды

Этот материал для вас, если вы до сих пор пользуетесь пакетом Microsoft Office и носите презентации на флешке

Нейросеть и ведьма Винни: алгоритмы добрались до детских книжек

Искусственный интеллект научился разбираться в художниках

Земля ему пуховик. Как работает Т9?

Почти всё, что мы называем Т9, на самом деле не Т9

Нейросеть вернула Хану Соло лицо

Технология deepfake подходит не только для создания поддельного порно со знаменитостями

Нейровоскрешение великого битника

Писатель-призрак и писатель-робот создали «посмертную» книгу Джека Керуака

Спасительный луч для поехавшей крыши

Знаменитому итальянскому собору грозит разрушение. Космическое излучение может его спасти

Иллюстратор статей

Новый реагент — новый яд или спасение улиц? Дата-расследование «Системного Блока»

Испорченная обувь, обожжённые собачьи лапы, гололёд… «Да лучше бы просто песком посыпали, и всё», — думаем каждую зиму мы, стараясь не убиться и ругая коммунальщиков за щедро посоленные дороги. «Теперь не соль, а “Бионорд”», — поправляют нас власти, убеждая, что это безвредно. В опыте использования разными регионами нового чудо-средства попытался разобраться «Системный Блокъ».

Тест: какое будущее вам подходит?

Писатели-фантасты представляли будущее по-разному. Мы уже рассказывали о том, как им удалось предвидеть современные информационные технологии от мессенджеров до генеративных нейросетей. Теперь пришла ваша очередь подобрать себе грядущее по душе. Тест подскажет, какое будущее из фантастических книг разных столетий подойдет вам лучше всего.

«Коктейль Молотова» массового производства: как судят за поджоги военкоматов

В 2022 году поджоги военкоматов стали частью антивоенного движения в России. Поджигатели протестовали против отправки военнообязанных на передовую, а с сентября еще и против мобилизации. В ответ на прямое действие партизан, власти ужесточили наказание за поджоги. Дата-отдел «Системного Блока» проанализировал судебные дела и рассказал о том, как государство расправляется с поджигателями.

Что такое визуализация данных?

Зачастую данные содержат полезную информацию — от цен на «Биг Мак» в разных странах, по которым можно оценить стоимость валюты, до коррупционных схем высших должностных лиц и свидетельств военных преступлений. Поэтому существует множество способов извлечения важной информации из большого и сложно устроенного массива данных. В этом материале мы расскажем об одном из таких методов — о визуализации данных.

Что такое нейросеть GPT-3 и зачем она нужна

Общение с чат-ботами и голосовыми помощниками стало частью повседневного опыта. Мы спрашиваем у нейросетей о погоде и пробках, просим переводить и сочинять тексты, проверяем их способности стихосложения и иногда даже делимся сокровенными секретами. СБъ уже не раз рассказывал о работе языковых моделей, которые делают боты более человечными. Предлагаем освежить знания и прочитать материал из глоссария про наиболее крупную и продвинутую языковую модель в мире – GPT-3

Нейроцензура: генератор стихов Пушкина отказался писать о России, самовластье и царе

Бот «AI да Пушкин» дописывает любую предложенную ему фразу до четверостишия в стиле А.С. Пушкина — но только если в ней нет «запретных» слов

Пушкинский дом обновил Корпус текстов детской прозы

Институт русской литературы (Пушкинский дом) РАН пополнил ДетКорпус и сделал его доступным не только для онлайн-поиска, но и в качестве датасета

Автор статей

Новый реагент — новый яд или спасение улиц? Дата-расследование «Системного Блока»

Испорченная обувь, обожжённые собачьи лапы, гололёд… «Да лучше бы просто песком посыпали, и всё», — думаем каждую зиму мы, стараясь не убиться и ругая коммунальщиков за щедро посоленные дороги. «Теперь не соль, а “Бионорд”», — поправляют нас власти, убеждая, что это безвредно. В опыте использования разными регионами нового чудо-средства попытался разобраться «Системный Блокъ».

«Системный Блокъ»: лучшее за 2023 год

По традиции 31 декабря «Системный Блокъ» публикует подборку лучших материалов уходящего года. В 2023-м в подборке есть стилометрия Набокова, интервью об исторической информатике, открытка из варшавского гетто, дата-исследование поляризации российских СМИ, предсказание появления ChatGPT от современника Пушкина… С Новым годом!

Возможен ли мир без СПИДа: статистика ВИЧ в России и в мире

Во Всемирный день борьбы со СПИДом изучаем данные о распространении ВИЧ в России и в мире, разбираемся, можно ли вылечить заболевание и как математическое моделирование позволяет его изучать.

Почему медицине нужны информационные технологии

Виртуальная реальность, дополненная реальность и дистанционные методы взаимодействия проникают и в медицину. VR и AR-технологии помогают хирургам проводить операции, а люди с психическими проблемами погружаются в виртуальный гипноз. Рассказываем, как медицина занимается пациентами в эпоху цифровых технологий.

Фонограммархив для науки: Светлана Подрезова о коллекции аудиозаписей Пушкинского Дома и работе с источниками

Как связаны имена Блока и Гумилёва с историей крупнейшей коллекции этнографических аудиозаписей? Когда исполнители перестали бояться раструба фонографа? Что происходит, если идеология вмешивается в научный процесс? Как происходит цифровизация аудио, записанного некогда на восковые валики? Об этом в интервью «Системному Блоку» рассказала Светлана Подрезова, заведующая Фонограммархивом Пушкинского Дома (ИРЛИ РАН).

9988 слов о последнем десятилетии

Мы прочитали новый школьный учебник по истории России для 11 класса и проанализировали параграфы, относящиеся к последнему десятилетию. Выясняем, чему будут учить в новом учебном году, и как официально осмысляются и оцениваются события, свидетелями которых мы были.

«Открытые данные против мракобесия и пренебрежения реальностью»: интервью с Кириллом Маслинским 

Кирилл Маслинский — цифровой филолог, руководитель Лаборатории цифровых исследований литературы и фольклора в Пушкинском Доме, создатель Детского корпуса и Репозитория открытых данных по русской литературе и фольклору. «Системный Блокъ» узнал у Кирилла, что можно найти в тысячах оцифрованных детских книг, когда в детской литературе было допустимо употреблять слово «какашка», зачем филологам репозиторий открытых данных и может ли этот репозиторий как-то помочь в борьбе с мракобесием и войнами.

Миссия России, деградация Европы: какие патриотические фильмы заказывает Минкульт РФ  

С 2014 года Министерство культуры России публикует приоритетные для кинопроизводства темы, у которых есть все шансы получить господдержку. Следуя этим рекомендациям, режиссеры сняли, например, «Крым» и новые «А зори здесь тихие….». Рейтинг у этих фильмов на Кинопоиске низкие, но это не останавливает «патриотический продакшн» в РФ. Разбираемся, что для нас снимут в 2023 и насколько это будет в духе времени.

«Цифровой концлагерь»: как закон о повестках через «Госуслуги» взбудоражил россиян

В России вступил в действие закон, объявляющий повестку из военкомата врученной вне зависимости от ее получения призывником. Теперь повестку достаточно выслать заказным письмом, разместить в электронном реестре или направить гражданину через «Госуслуги». Россияне отреагировали на новый закон повышенным интересом к «цифровым повесткам», «цифровому концлагерю» и удалению аккаунта на «Госуслугах».

«Присоединение на паузе»: как российских военных перенаправили из Южной Осетии в Украину

Российские военнослужащие — это люди, которые, согласно статистике погранслужб, крайне редко покидают пределы страны. Но с 2014 года военные из РФ активно въезжали в Южную Осетию, которая пока не решила, готова ли она входить в состав России. В 2021-2022 на фоне подготовки и начала вторжения в Украину этих поездок стало гораздо меньше.

GPT-4

Четвёртое поколение генеративных языковых моделей GPТ. Модель решает задачи качественнее GPT-3, а также умеет работать с изображениями.

«Коктейль Молотова» массового производства: как судят за поджоги военкоматов

В 2022 году поджоги военкоматов стали частью антивоенного движения в России. Поджигатели протестовали против отправки военнообязанных на передовую, а с сентября еще и против мобилизации. В ответ на прямое действие партизан, власти ужесточили наказание за поджоги. Дата-отдел «Системного Блока» проанализировал судебные дела и рассказал о том, как государство расправляется с поджигателями.

LLaMa

Семейство эффективных языковых моделей от Meta, доступное для некоммерческого использования всем желающим

Год после 24 февраля: главные материалы «Системного Блока» о войне

Уже год продолжаются боевые действия на территории Украины. За этот год «Системный Блокъ» рассказывал о пропаганде войны в России и бегстве людей из Украины, об уклонении от мобилизации и том, как диктатуры начинают войны, о сохранении украинского культурного наследия и о сохранении рассудка у россиян. Сегодня предлагаем перечитать наши главные материалы

Год войны в цифрах: жертвы, потери, разрушения, беженцы 

Год назад российские войска вошли в Украину, начав самые масштабные боевые действия в Европе со времен Второй мировой войны. К годовщине начала вторжения «Системный Блокъ» подготовил карточки с перечислением его последствий.

Собери их всех: как record linkage помогает обогащать большие биографические данные

Сейчас историки всё чаще уделяют внимание не столько выдающимся деятелям прошлого, сколько целым группам людей, жившим в ту или иную эпоху. Это неудивительно — ведь с появлением больших исторических баз данных стало проще анализировать множество биографий одновременно. Автоматизировать обработку данных об одних и тех же людях в разных базах помогает сопоставление данных, или record linkage.

«Системный Блокъ»: лучшее за 2022 год

В 2022 году «Системный Блокъ» опубликовал 247 материалов. В этом посте мы сформулировали краткие итоги ушедшего года: открытие дата-отдела, оцифровка новых открыток, свежие интервью, тесты и инфографики, а также подборка лучших постов за весь год. Но самое главное в тяжелом 2022-м — это наша поддержка друг друга. Лучи этой поддержки мы шлем читателям и в новый 2023 год!

«Персоналистские диктатуры чаще начинают войны»: Эрика Франц об автократиях, Украине и поводах для оптимизма

Системный Блокъ поговорил с политологом Эрикой Франц о недемократических режимах, диктаторах и возможностях перехода к демократии. Спойлер: наши шансы на демократический транзит невысоки, но они есть.

Война и клир: разрушения храмов и раскол церквей Украины

Конфликт между Россией и Украиной с 2014 года повлек за собой изменения не только в социально-политической жизни страны, но и в религиозной сфере. Рассказываем, как за 8 лет прихожане теряли доверие к церкви Московской патриархии, и анализируем, сколько религиозных организаций пострадали после 24 февраля.

Найди пару: однофамильцы-спойлеры на московских выборах 2022

В Москве прошли выборы муниципальных депутатов. Мы изучили списки кандидатов по округам и нашли неслучайные совпадения.

Что такое мешок слов

Рассказываем, что такое мешок слов и как он может помочь в задачах автоматической обработки текста

Был ли геноцид: статистика гибели жителей Донбасса в 2014-2021 годах

Российские власти говорят о «8 годах геноцида» на Донбассе. Именно этим объяснял необходимость «спецоперации» против Украины президент РФ. Но что говорит статистика? Был ли там геноцид? Мы изучили данные из официальных источников Донецкой народной республики и визуализировали жертвы среди ее военных и ее мирных жителей.

«Агрессии нет, сочувствие есть»: что говорят россияне об отношении к ним за рубежом

С начала боевых действий на Украине мы регулярно слышим о том, что за границей притесняют людей из России. Но чаще всего слышим это из самой России. Обычно это истории из третьих рук: «знакомому моей знакомой пробили колеса за русские номера». Чего тут больше: слухов и пропагандистских выдумок или реально возросшей русофобии? «Системный Блокъ» провел собственное расследование и опросил более 100 россиян из 15 стран. Все это реальные люди, которых мы знаем и за существование которых ручаемся. Вот что они нам рассказали.

Мумификация медиа: специалисты по веб-архивации спасают русскоязычные СМИ

С конца февраля в России заблокировали более 50 сайтов интернет-СМИ. Некоторые из них решили приостановить работу, ликвидировать сайты и удалить аккаунты в соцсетях. Но даже это не означает полное исчезновение информации из общего доступа. Специалисты по веб-архивации уже начали работу над архивами «Эха Москвы» и других медиа. Рассказываем, кто и как сегодня сохраняет независимые СМИ и как можно помочь даже если вы не IT-специалист.

Ученые спасают украинское культурное наследие и сетевые архивы

Международное сообщество исследователей запустило инициативу по сохранению украинского культурного наследия в цифровой форме

Культура в цифровом сите: что остается за кадром

Инна Кижнер — старший преподаватель кафедры информационных технологий в креативных и культурных индустриях, научный сотрудник лаборатории «Digital Humanities» Сибирского федерального университета. В интервью «Системному Блоку» она рассказала, каким искажениям подвержены цифровые коллекции музеев, какие культурные явления можно исследовать благодаря оцифровке и как должна выглядеть идеальная цифровая коллекция.

ChatGPT

GPT-3, обученная понимать и исполнять текстовые запросы и доступная всем желающим через веб сайт

InstructGPT

GPT-3, которая обучена понимать и исполнять текстовые запросы

«Системный Блокъ»: лучшее за 2021 год

По традиции 31 декабря «Системный Блокъ» публикует подборку лучших материалов уходящего года. В 2021-м в подборке оказались спецпроект в духе «Намедни» к 30-летию крушения СССР, дата-исследование зарплат учителей в России, выпуск подкаста о том, как врет искусственный интеллект, тесты о средневековых студентах и о цифровых гуманитариях и видео о людях, из которых состоит сам «Системный Блокъ». С новым годом!

«Виртуальные НКО — это будущее»: интервью с руководителем красноярского «Мемориала»

Алексей Бабий — руководитель красноярского общества «Мемориал», а также один из первопроходцев Рунета. Последние три десятилетия Алексей занимается сохранением памяти о жертвах репрессий в Красноярском крае и развитием цифровой инфраструктуры красноярского «Мемориала». В интервью изданию «Системный Блокъ» Алексей рассказал, что может дать интернет гражданским активистам, как опыт работы на советских ЭВМ 70-х годов помогает ему обеспечивать сохранность данных о репрессиях и почему современным «облачным НКО» не страшны угрозы ликвидации.

Тест: что говорит статистика о выборах в регионах России

17–19 сентября 2021 года в России прошли выборы в Государственную Думу. Независимый электоральный аналитик Сергей Шпилькин* построил графики, которые отражают результаты голосования в разных регионах. По ним можно предположить, были ли на выборах фальсификации. Пройдите наш тест и проверьте, сможете ли вы понять, какой регион на каждом графике?

«Я совсем без денег»: о чем писали в открытках 120 лет назад

1 октября — Международный день открытки. В этот день в 1869 году австрийский экономист Эммануэль Херрман написал статью о том, что написание письма и его упаковка в конверт — слишком сложные операции для маленьких сообщений. Его идея вдохновила австрийскую почту ввести новый тип открытого письма. Так появилась почтовая открытка. Специально к этому дню мы публикуем рассказ о самых старых открытках в коллекции нашего проекта «Пишу тебе». Открыток 1869 года у нас пока нет, но есть те, которым больше ста лет — и в них много интересного.

Почем голосование и сколько самовыдвиженцев прорвалось: тест к выборам в Госдуму

17–19 сентября пройдут выборы в Государственную Думу. Однако заметить это нелегко: власти явно выбрали стратегию «тихого» голосования, в котором поучаствуют только подневольные бюджетники и пенсионеры. Всем остальным эти выборы должны быть неинтересны. Нам не нравится такое засушивание политики, поэтому мы сделали тест с интересными фактами о выборах в Госдуму. А поскольку наше издание — про цифровое, то и в тесте у нас — любопытные цифры думской кампании 2021.

«Это имитация интеллекта»: Константин Воронцов — о настоящем и будущем машинного обучения

Сможет ли человечество построить искусственный интеллект, не уступающий человеческому, и надо ли его строить? «Системный Блокъ» обсудил это с Константином Воронцовым, одним из известнейших специалистов по машинному обучению в России. Публикуем его ответы на наши вопросы

Как видят мир беспилотники и почему «обучение с учителем» сломано. Расшифровка подкаста с Борисом Янгелем

Эта страничка — дополнение к XI выпуску подкаста «Неопознанный Искусственный Интеллект». В этом выпуске мы общались с Борисом Янгелем из команды разработки беспилотных автомобилей в Яндексе. Здесь вы найдете полную расшифровку, оглавление выпуска и полезные ссылки

Виден ли конец «нейронного блицкрига»: компьютерные лингвисты между вычислениями и теорией. Расшифровка подкаста с Денисом Кирьяновым

Публикуем материалы к восьмому выпуску подкаста «Неопознанный Искусственный Интеллект»: текст расшифровки выпуска, оглавление, полезные ссылки и термины.

Пообедать у Канта: калининградские ученые воссоздают дом философа в 3D

К грядущему 300-летию одного из самых цитируемых философов мира специалисты из Центра социально-гуманитарной информатики Балтийского федерального университета реконструируют дом своего земляка в Кёнигсберге XVIII в. Виртуальная реконструкция ведется на основе письменных источников, а также единичных старых фотографий и картин

Почему искусственный интеллект врет и как его его от этого отучить. Расшифровка подкаста с Давидом Дале

Публикуем материалы к седьмому выпуску подкаста «Неопознанный Искусственный Интеллект»: текст расшифровки выпуска, оглавление, полезные ссылки и термины.

авторский текст

По словам их узнаете их: как вычисляли автора «Беовульфа»

Рассказываем, как одни ученые устанавливали авторство знаменитого древнеанглийского эпоса «Беовульф» при помощи статистики, а другие с ними спорили. Ведь научные споры цифровых филологов — это интересно!

Математика протестов: тест о штрафах и задержаниях митингующих в России

Сколько городов охватили протесты? А на какую сумму уже оштрафовали всех задержанных на акциях? Пройдите наш тест по статистике протестов — и узнайте, насколько хорошо вы представляете ключевые «протестные цифры».

Что не так с современным машинным обучением. Расшифровка подкаста с Дмитрием Ветровым

Публикуем материалы к шестому выпуску подкаста «Неопознанный Искусственный Интеллект»: текст расшифровки выпуска, оглавление, полезные ссылки и термины.

rucompromat

Токсичный Путин: что видно в соцсети русского компромата

Рассказываем, что увидели ученые, построив «социальную сеть русского компромата» на 11 тысяч человек. Спойлер: Путин официально самый токсичный! Но ведь если ваши связи помогают вам прятать деньги и возводить на них дворцы, то «токсичность» можно и потерпеть? Ради комнаты для грязи — годятся любые связи. Подробности — в нашей статье

Неопознанный искусственный интеллект

Взгляд на ИИ из Кремниевой долины. Расшифровка подкаста с Николаем Любимовым

Дополнение к пятому выпуску подкаста «Неопознанный Искусственный Интеллект». Здесь вы найдете полную расшифровку, оглавление выпуска и полезные ссылки

GPT-3

Третье поколение генеративных языковых моделей GPТ. Значительно больше GPT-2, умеет решать новые задачи без обучения

«Системный Блокъ» 2020: лучшие посты

В 2020 году Системный Блокъ опубликовал примерно 400 материалов, включая статьи, интервью, подкасты, видео и мемы. Сегодня мы собрали для вас лучшее. Крутейшие исследования, интервью, визуализации и мемы 2020 года от «СБъ» — в одной статье

Как строить искусственный интеллект и не погубить человеческую цивилизацию. Расшифровка подкаста с Константином Воронцовым

Эта страничка — дополнение к третьему выпуску подкаста «Неопознанный Искусственный Интеллект». Здесь вы найдете полную расшифровку, оглавление выпуска и полезные ссылки.

Как обучать датасаентистов, играя в шляпу, и запускать космические корабли будущего. Подкаст НИИ с Виктором Кантором

Эта страничка — дополнение к третьему выпуску подкаста «Неопознанный Искусственный Интеллект». Здесь вы найдете полную расшифровку, оглавление выпуска и полезные ссылки.

Как лингвисты делают искусственный интеллект, а компьютер решает ЕГЭ. Подкаст НИИ с Татьяной Шавриной

Эта страничка — дополнение ко второму у выпуску подкаста «Неопознанный Искусственный Интеллект». Здесь мы опубликовали текст расшифровки выпуска, с оглавлением и ссылками, для удобства

Как прийти к «сильному» искусственному интеллекту. Первый выпуск подкаста НИИ

Эта страничка — дополнение к первому выпуску подкаста «Неопознанный Искусственный Интеллект». Здесь вы найдете полную расшифровку, оглавление выпуска и полезные ссылки.

Системный Блокъ на самоизоляции

Как вы проводите время на самоизоляции? Наш урбанист Оля, например, встречается с друзьями в Zoom на кулинарных пятницах, куратор Ира ходит на британские онлайн-спектакли, а главред Даня путешествует по району до самой дальней мусорки. Во втором интервью с участниками проекта Системный Блокъ мы расскажем о том, как карантин изменил нашу жизнь, что нового мы узнали о себе и чем еще можно заняться, чтобы скрасить последние недели самоизоляции

Как измеряют эффект Вертера

Но не тот, о котором вы подумали. Мы расскажем не о последствиях трагической любви, которые заставляют молодых людей с разбитым сердцем сводить счеты с жизнью, а о том, как «Страдания юного Вертера» перекликаются с окружающими его текстами

Цифровые актеры: фантастика и реальность (к 80-летию Аль Пачино)

Аль Пачино знают по «Крестному отцу» и «Лицу со шрамом», но в его репертуаре есть и кино, связанное с тематикой искусственного интеллекта и симуляции разума. В 2002 году Аль Пачино сыграл кинорежиссера, создавшего виртуальную актрису. В день 80-летия актера мы решили узнать, не стала ли эта фантазия реальностью в наш век дипфейков

Как знание языков прокачивает мозг: 5 бонусов многоязычия

Быть полиглотом круто не только потому, что вам будет проще заказать пиво в отпуске за границей. У многоязычного сознания есть и более глубокие внутренние преимущества. Исследования показывают, что использование нескольких языков может отсрочить старческую деменцию и болезнь Альцгеймера, помогает усваивать новые знания и лучше справляться с некоторыми когнитивными тестами. Правда, эти бонусы подтверждаются не во всех экспериментах

Нейронные сети придумал Леонардо да Винчи

На самом деле нет. Но возможность стилизовать современную статью по Data Science под рукописи титана Возрождения — это круто. Спасибо сверточным нейросетям и исследователю из Вышки Борису Орехову.

Зомби против вируса: как игры помогают пережить карантин

Самоизоляция в Fortnite, пары по программированию в Minecraft, обитаемые 3D-модели университетов и мемы про военку в Counter-Strike: как игровая среда заменяет людям реальность в дни пандемии

Как управлять мамонтом: генерируем нужные тексты с помощью моделей Plug and Play

Нейросети хорошо порождают правдоподобный текст. Но как заставить их писать на нужную тему, да еще и с нужным отношением к этой теме (положительным, нейтральным или отрицательным)? Рассказываем про решение, которое позволяет «донастраивать» языковую модель под себя

5 дизайн-вдохновений Стива Джобса

Сегодня, 24 февраля 2020, исполнилось бы 65 лет Стиву Джобсу — создателю Apple, эстету, скандалисту и визионеру. Джобс сделал почти невозможное: он стал глобальным технологическим революционером, не будучи технарем. Гений Джобса всегда был в области дизайна, эргономики и общей эстетики. Но оказалось, что в XXI веке именно это отличает великого производителя электроники — от заурядных и просто хороших