Фото автора

Системный Блокъ

Маскот

Коллективный автор

Редактор статей

Midjourney научилась генерировать видео, Meta* инвестирует в Scale AI, Mistral сделала рассуждающую LLM

Видеогенерация в Midjourney, инвестиции Meta в компанию по разметке данных, новая модель Mistral — что нового в мире ИИ произошло за последнее время.

Обновление DeepSeek R1, суперкомпьютер OpenAI в ОАЭ, Grok в Telegram

DeepSeek R1 обновился, OpenAI строит суперкомпьютер в ОАЭ, в Telegram появятся ИИ-функции на основе Grok — что произошло в мире ИИ за последнее время.

Google выпускает новые продукты, Claude 4 шантажирует пользователей, OpenAI покупает компанию Джони Айва

Компания Google представила новые AI-продукты, Anthropic выпустила свежие версии своих моделей, бывший главный дизайнер Apple разработает новое устройство для OpenAI — что произошло в мире ИИ за последнее время.

ИИ-поиск от Google, третья Qwen и модель-подхалим GPT-4o

Google открыла доступ к ИИ-поиску американским пользователям, вышло третье поколение языковой модели Qwen, OpenAI после жалоб пользователей вернула менее подобострастную версию GPT — что произошло в мире ИИ за последнее время.

Помогают ли пуш-уведомления учиться?

Пуш-уведомления в сфере образования: друг или враг? Мотивируют ли студентов всплывающие напоминания на повторение материала? В этой статье мы расскажем о неоднозначных результатах двух исследований.

Новые версии GPT, прогнозы развития ИИ

OpenAI представила сразу несколько обновленных моделей (GPT-4.1, o3 и o4-mini), вышел детальный прогноз развития ИИ до 2027 года — что произошло в мире ИИ за последнее время.

Такая разная лингвистика: подборка интервью «Системного Блока»

Политизированные споры вокруг разграничения русского, украинского и белорусского языков, междисциплинарные исследования нейролингвистов, аудиозаписи Александра Блока. В фокусе новой подборки интервью «Системного Блока» — лингвистика. Наши собеседники рассказали о языковой смерти, компьютерных методах для церковных текстов, дистрибутивной семантике и о лингвистических экспедициях.

Новая Llama 4, новый лидер Gemini 2.5 Pro, новые картинки от GPT

Вышло новое поколение Llama, Gemini 2.5 Pro стала лучшей LLM, а GPT сильно улучшила генерацию изображений — что произошло в мире ИИ за последнее время.

OpenAI против китайского ИИ, новая open-source модель от Google и Mistral Small

OpenAI выступила за ужесточение доступа к чипам, экспортируемым из США, Google и Mistral обновили свои открытые модели — что произошло в мире ИИ за последнее время.

Стилометрия и древнескандинавская литература: определение авторства исландских саг

Можно ли применять алгоритмы определения авторства к текстам древних исландских саг? Какие гипотезы о создателях этих текстов помогает подтвердить метод дельты, который ранее применяли для поиск поддельных стихов XIX века и раскрытия псевдонима Джоан Роулинг? Рассказываем про исследование исландского лингвиста Хёйка Торгейрссона.

Огромная GPT, новая модель от Anthropic и OCR от Mistral

Более человечная GPT-4.5, новая флагманская модель от Anthropic и OCR от Mistral — что произошло в мире ИИ за последнее время.

Шум вокруг DeepSeek, «глубокий ресерч» от OpenAI, новые LLM от Google

Что происходит после выхода нашумевших моделей от DeepSeek, как работает новый автономный исследователь от OpenAI, какие обновления получили LLM семейства Gemini от Google — рассказываем, что произошло в мире ИИ за последнее время.

Дата-центры стоимостью 500 млрд долларов, ИИ-агенты и открытый конкурент OpenAI o1

OpenAI и SoftBank должны создать инфраструктуру для ИИ стоимостью 500 млрд долларов по предложению Дональда Трампа, сразу несколько компаний выпустили ИИ-системы для автоматического выполнения задач на компьютере, китайская DeepSeek выложила конкурента модели o1 от OpenAI в открытый доступ — что произошло в мире ИИ за последнее время.

Тест: угадайте, Путин или нейросеть

Мы попросили нейросети сгенерировать новогодние обращения Владимира Путина, стилизуя их под разные года и события. Пройдите тест и проверьте, сможете ли вы отличить настоящее обращение президента России от созданного нейросетью.

Новые рассуждающие модели от OpenAI и Google, open-source-конкурент GPT и Claude

Новая модель o3 от OpenAI вырывается вперёд, китайская DeepSeek создала конкурента для лучших LLM, Google выпустила свою первую рассуждающую модель — что произошло в мире ИИ за последнее время.

Как изучать наскальные изображения оленей Чукотки с помощью нейросетей

Петроглифы — небольшие древние наскальные изображения — часто сложно датировать и атрибутировать. При этом для некоторых рисунков может быть очень много однотипных образцов — например, таковы петроглифы с изображениями оленей в долине чукотской реки Пегтымель. Выпускница магистратуры Digital Humanities НИУ ВШЭ рассказывает, как можно классифицировать петроглифы по типам при помощи нейросети.

Иллюстрация: Надя Луценко

Как провести анализ тональности текста

Эмоции и их выражение в тексте — важная часть человеческой коммуникации. Но как зафиксировать эти тонкие и динамичные изменения, особенно в больших текстах? Как формально визуализировать эмоциональное содержание текста, превратив его в график? Ответы на эти и многие другие вопросы можно получить, построив кривые эмоциональной тональности выбранных текстов. О том, как это сделать, вам расскажет этот гайд!

Новинки от OpenAI, новая LLM от Google, модель для генерации изображений от лаборатории Маска

OpenAI составляет «адвент-календарь» из новых релизов, Google обновил свою LLM, а xAI Илона Маска выпустила нейросеть для генерации изображений — что произошло в мире ИИ за последнее время.

Что такое косинусная близость?

Как онлайн-кинотеатры определяют, какой фильм вам порекомендовать, а маркетплейсы — какой похожий товар предложить? Как интернет-поисковики находят темы, которые отвечают теме запроса? И, наконец, может ли компьютер отличить мем с пёсиком от мема с котиком? Разбираем, что такое косинусная близость и как с помощью неё машина сравнивает объекты.

Утечка доступа к Sora, открытые аналоги OpenAI o1, протокол общения между LLM и приложениями от Anthropic

Художники, получившие доступ к модели для генерации видео Sora от OpenAI, слили доступ в сеть, китайские лаборатории выпустили модели-аналоги OpenAI o1, Anthropic представила открытый протокол общения между LLM и приложениями — что произошло в мире ИИ за последнее время.

«Все мы немножко более дикие, чем могли бы быть»: интервью с Даниилом Скоринкиным

Что важнее: наука, преподавание или популяризация науки? Чем отличаются Digital Humanities в России и за рубежом? Какова цель существования «Системного Блока»? Свои ответы на эти вопросы дал главный редактор нашего издания Даниил Скоринкин.

Языковые модели упёрлись в потолок, AlphaFold3 в открытом доступе, новые LLM для генерации кода

Компаниям, работающим над языковыми моделями, стало сложнее их улучшать, нейросеть для расшифровки белков AlphaFold3 теперь доступна исследователям, новые версии моделей от Qwen для генерации кода — что произошло в мире ИИ за последнее время.

Поисковики с ChatGPT и Gemini, новые релизы от Anthropic, открытые модели для генерации видео

OpenAI и Google объединяют LLM и поисковые системы, Anthropic обновила свои языковые модели, а компания Genmo выпустила самую большую на сегодня открытую модель для генерации видео с 10 млрд параметров.

Нобелевские премии за нейросети, ИИ-функции в приложениях Adobe, новые модели от Mistral

Две нобелевские премии вручены за работы, связанные с машинным обучением, Adobe добавила новые ИИ-функции в свои продукты, Mistral представила новые компактные языковые модели — рассказываем, что произошло в мире ИИ за последнее время.

10 слов машинного обучения

Что такое языковые модели, как их обучают и зачем нужна тестовая выборка? Объясняем основные термины машинного обучения.

Запрограммированная сюита: взлёт и падение механического пианино на перфоленте

Мы уже рассказывали о роли перфолент в истории компьютеров. А какую роль они сыграли в истории музыкальных технологий? Исследователь истории науки и техники, сотрудник Центра непрерывного образования факультета компьютерных наук НИУ ВШЭ Антон Басов рассказывает, как появилось механическое фортепиано и зачем в нём перфолента.

Новые модели от OpenAI, Mistral делает ИИ доступнее и запаздывающий Apple Intelligence

OpenAI представила модель, способную «рассуждать», француский стартап Mistral снизил цены на свои модели, Apple отстаёт в гонке за ИИ машинного обучения в смартфонах — что произошло за последнее время в мире ИИ.

Телеграф, телетайп, компьютер: всемирная история перфолент

Хотя перфолента появилась раньше перфокарт, применение ей нашлось не сразу. Исследователь истории науки и техники, сотрудник Центра непрерывного образования факультета компьютерных наук НИУ ВШЭ Антон Басов рассказывает о том, как с помощью перфолент постепенно удалось улучшить телеграф, а затем и компьютерные интерфейсы 1960-х годов.

AlphaProteo, стартап Ильи Суцкевера привлёк огромные инвестиции и самый мощный кластер для компаний Илона Маска

Нейросеть для генерации белков от Google DeepMind, экс-исследователь OpenAI привлекает миллиард долларов, Илон Маск обзавелся самым мощным кластером для обучения нейросетей — что прошло в мире ИИ за последнее время.

Может ли робот прочитать папирус: как ИИ помогает восстанавливать утраченные тексты

Кажется, история из «‎Гостьи из будущего», где один из героев спасал рукописи из Александрийской библиотеки, стала реальностью. В начале 2024 года исследователям удалось прочитать сгоревший папирус из Геркуланума с помощью искусственного интеллекта.

Цифровая охота: как «поймать» всех животных в тексте

Что влияет на распределение содержательных слов в тексте сильнее: литературная традиция или внешние факторы? Кирилл Маслинский, исследователь литературы, сотрудник Пушкинского дома и создатель Деткорпуса, изучает процесс создания контента. Он использует модель роста словаря, чтобы оценить разнообразие концептов семантической области «‎‎животные»‎ в разных жанрах детской литературы, и вычисляет, какие животные вероятнее встретятся в каждом жанре. В ужастиках, конечно, на первом месте — змеи, а вот в научной фантастике частыми гостями неожиданно становятся морские обитатели. Расскажем о методе и результатах этого исследования.

Исход людей из OpenAI, новые модели для решения математических задач и SAM 2

Сооснователь OpenAI ушёл к конкурентам, а технический директор объявил о длительном отпуске, релиз семейства математических моделей Qwen и новая модель для сегментации объектов на изображениях и видео от Meta*. Рассказываем, что произошло в мире ИИ за последние две недели.

Новые модели от OpenAI, Mistral и Meta*: дайджест новостей ИИ

OpenAI выпустила компактную дешёвую версию GPT-4, Meta* обновила семейство моделей LLama 3, релиз четырёх новых LLM от Mistral. Рассказываем, что произошло в мире ИИ за последние две недели.

Новая модель для дизайна белков, скорый выход самой большой LLama и FlashAttention 3

Llama 3 с 405 миллиардами параметров выйдет в конце июля. Компания EvolutionaryScale представила большую модель для дизайна белков. В главный блок всех языковых моделей на трансформерной архитектуре — блок внимания (attention) — добавили новые оптимизации. Рассказываем, что произошло в мире ИИ за последние две недели.

Новый лидер среди LLM, «безопасный сверхинтеллект» от бывшего топ-исследователя OpenAI и конкуренты Sora

Большая языковая модель от Anthropic обходит последнюю GPT, компания бывшего ведущего исследователя OpenAI обещает «безопасный сверхинтеллект», у Sora появились новые конкуренты в генерации видео. Рассказываем, что произошло в мире ИИ за последние две недели.

Google встраивает языковую модель в поиск, Скарлетт Йоханссон обвиняет OpenAI, исследователи стали лучше понимать и контролировать ИИ

Google начала использовать свою языковую модель Gemini для суммаризации информации из поисковой выдачи. OpenAI подозревают в несанкционированном использовании голоса актрисы Скарлетт Йоханссон. Anthropic выпустили большое исследование интерпретируемости нейронных сетей. Рассказываем, что произошло в мире ИИ за прошедшие две недели.

GPT-4o научилась смеяться и петь, LSTM-нейросети наносят ответный удар, ChatGPT встроят в iPhone: дайджест ИИ-новостей

OpenAI выпустила новую версию GPT-4. Apple и OpenAI завершают сделку о сотрудничестве. Авторы архитектуры LSTM выпустили её обновление, которое не хуже Transformer. Google DeepMind анонсировала AlphaFold 3 — нейросеть, способную моделировать широкий спектр биомолекул. Рассказываем, что произошло в мире ИИ за прошедшие две недели.

Какие слова отличают один корпус от другого? Продолжаем изучать Stylo

В исследованиях по определению авторства и количественному анализу стиля широко используется метод Дельта филолога Джона Бёрроуза. Однако Дельта — не единственная придуманная им стилометрическая мера. Дж. Бёрроуз также является автором меры зета, с помощью которой можно сравнивать корпуса текстов. Расчёты на её основе встроены в одну из функций пакета Stylo — oppose().

Подборка статей о точных методах в лингвистике

В Москве на 95-м году жизни скончался лингвист Ю. Д. Апресян — основатель Московской семантической школы, соавтор множества словарей, один из первых исследователей машинного перевода. Мы решили почтить память Ю. Д. Апресяна подборкой статей о прошлом и настоящем точных методов в лингвистике и машинного перевода.

Дневники, письма, конспекты: что такое эго-документ?

Историю можно изучать не только по летописям или книгам, но и по частным источникам, или эго-документам: письмам, дневникам, записным книжкам. Рассказываем об эго-документах и связанных с ними цифровых исследованиях.

Две новых языковых модели и обучающая выборка в 15 триллионов токенов: дайджест новостей из мира ИИ

Компания Snowflake выпустила самую большую языковую модель, открытую для коммерческого использования. Разработчикам доступная новая обучающая выборка из 15 триллионов токенов. Microsoft представила новое поколение компактной модели Phi. Рассказываем, что произошло в мире ИИ на прошлой неделе.

Новая открытая языковая модель, обновление GPT-4 и скорый выход LLaMa 3: дайджест новостей из мира ИИ

Метеорологи обещали осадки в виде LLM: новая открытая языковая модель, обновление GPT-4 и скорый выход LLaMa 3.

GPT-4 больше не лучшая языковая модель, суперкомпьютер за 100 млрд долларов и новые открытые модели

OpenAI и Microsoft строят суперкомпьютер для нейросетей, модель Claude 3 Opus от Anthropic обошла GPT-4 в одном из основных рейтингов, Илон Маск опубликовал свою большую языковую модель без цензуры.

Что такое random forest?

Random forest (он же «случайный лес») — это алгоритм машинного обучения, который состоит из множества отдельных независимых «решающих деревьев». Чтобы повысить качество предсказаний, в машинном обучении используют ансамбли — алгоритмы, сочетающие сразу несколько моделей. Рассказываем об одном из самых популярных ансамблей — random forest.

Автономный ИИ-инженер и новое о Sora: дайджест новостей в мире искусственного интеллекта

Создатели Sora рассказали, откуда брали видео для обучения, но кое о чем умолчали. Компания Cohere — один из главных конкурентов OpenAI/ChatGPT — выпустила модель с 35 млрд параметров. Вышла сопоставимая с трансформерами RNN-модель EagleX — неужели рекуррентные нейросети рано хоронить? Рассказываем, что произошло в мире ИИ за прошедшую неделю

Интернет-эстетика Dark Academia в исторической перспективе 2010–2020-х гг.

Почему COVID-19 сделал популярной Dark Academia? Рассказываем, как романтизация мрачности связана с самоизоляцией.

Sora: как работает модель для генерации видео по тексту

Недавно компания OpenAI, создавшая модели GPT и сервис ChatGPT, выпустила новую модель Sora, которая генерирует видео по текстовому описанию. Такие модели были и раньше, но здесь произошёл качественный скачок. Во-первых, Sora умеет генерировать реалистичные видео в высоком разрешении (вплоть до FullHD), во-вторых, объекты в видео консистентны в течение всего времени. Рассказываем, как работает Sora, какие у неё есть ограничения и неожиданные особенности.

Что такое capta и чем отличается от больших данных?

Рассказываем про вид данных, отличающийся от привычных big data, и чем малые данные похожи на археологический раскоп.

Как устроена оцифровка дневников: Михаил Мельниченко о проекте «Прожито» и его перезапуске

Проект «Прожито» начался с небольшой группы волонтёров, собиравших и оцифровывавших личные дневники. Сегодня это крупный центр по цифровой архивации эго-документов: дневников, мемуаров, писем и других личных свидетельств времени. Основатель «Прожито» Михаил Мельниченко рассказал «Системному Блоку» о том, кто и как приносит документы для оцифровки, откуда берутся тысячи волонтёров и как изменится «Прожито» в ближайшем будущем.

Правда глаза колет: 150 лет истории айтрекеров

В психологии и психолингвистике айтрекинг — давно известная и популярная технология. Рассмотрим, как она появилась и почему первым испытуемым приходилось терпеть тупую иглу на веке или присоску с радиоантенной на глазу. Но не пугайтесь: сейчас для исследования движений глаз применяют бесконтактные технологии. И об инвазивных методах, и о новых способах айтрекинга расскажем в нашем материале

Научим любить Родину… и мать твою: о чём говорят на «Разговорах о важном»

С сентября 2022 года в российских школах идут «Разговоры о важном». Это внеклассные уроки, направленные, по словам авторов идеи, на «укрепление традиционных российских духовно-нравственных ценностей» и «воспитание патриотизма» среди российских школьников. Ко дню учителя «Системный Блокъ» изучил содержание этих уроков, применив метод тематического моделирования.

Научный журналист должен быть аутсайдером: Ольга Добровидова о научной коммуникации и научной журналистике

Научный и экологический журналист Ольга Добровидова — о разнице между научными журналистами и научными коммуникаторами, о конфликте интересов между научным сообществом и общественным благом, а также о том, как вырос запрос на медицинскую журналистику.

Почтовая открытка «Генеральская дача» из Екатеринбурга в Камышлов.

«Генеральская дача» в Екатеринбурге

Исторические здания и территории имеют разную судьбу: некоторым из них суждено украшать обложки книг и журналов, а другие становятся малозаметными и ненужными, оставаясь за рамками новых городских пространств и туристических маршрутов. К таким забытым историческим территориям относится Генеральская дача в Екатеринбурге. В дореволюционное время летом здесь жили начальники горных заводов и гуляли жители города, а находящаяся тут плотина была уникальным инженерным объектом своего времени. Как Вы уже поняли, рубрика «Путешествие с открыткой» сегодня в Екатеринбурге, в месте под названием Генеральская дача.

Как провести стилометрический эксперимент с помощью stylo?

Системный Блокъ уже рассказывал о том, что такое стилометрия, и о многих стилометрических исследованиях. Читайте подробный гайд, как самому провести такой эксперимент — с помощью stylo, библиотеки языка R и самого популярного инструмента для стилометрии.

Что такое цифровое наследство?

Разбираемся, что такое цифровое имущество и как подготовить свои цифровые активы к передаче по наследству.

Русско-китайский корпус НКРЯ, или Как превратить ботвинью в гаспачо

Параллельный корпус — это коллекция текстов, где для каждого текста хранятся его переводы на другой язык (или языки). Параллельные корпуса позволяют узнать, какие приемы и стратегии использовал переводчик для передачи слов, у которых нет эквивалентов в другом языке. В этой статье мы расскажем про русско-китайский параллельный корпус в составе Национального корпуса русского языка.

Как это устроено: мастерские «Пишу тебе»

Как правильно расшифровывать почтовые открытки? Команда проекта «Пишу тебе» каждый месяц проводит специальные мастерские, во время которых все желающие постигают премудрости расшифровки открыток под присмотром Тимура Хусяинова, куратора отдела добычи открыток проекта. Участники мастерских получают возможность не только расшифровать предоставленные им открытки, но и узнать историю живых людей, стоящих за их отправкой: отправителя и получателя. Некоторые участники мастерских приносят и свои открытки, которые пополняют коллекцию «Пишу тебе».

Что такое визуализация данных?

Зачастую данные содержат полезную информацию — от цен на «Биг Мак» в разных странах, по которым можно оценить стоимость валюты, до коррупционных схем высших должностных лиц и свидетельств военных преступлений. Поэтому существует множество способов извлечения важной информации из большого и сложно устроенного массива данных. В этом материале мы расскажем об одном из таких методов — о визуализации данных.

Иллюстратор статей

Смерть на улице: как бездомность сокращает жизнь и что об этом знает статистика

В среднем бездомные в РФ теряют 19 лет жизни, умирая намного раньше остальных россиян. У них выше риск умереть от инфекционных болезней и внешних причин. Бездомные женщины живут дольше мужчин, но сталкиваются с хроническими заболеваниями и онкологией, которые, как и множество даже самых простых болезней, часто невозможно вылечить без документов. Вместе с благотворительной организацией «Ночлежка», Благотворительной больницей и платформой «Если быть точным» мы проанализировали, что влияет на причины смертности бездомных женщин и мужчин.

Филологи и программирование: подборка интервью «Системного Блока»

Лингвистика и программирование. Филология и программирование. Нужны ли они друг другу? Нужно ли гуманитариям вообще уметь программировать или же все учёные чётко делятся на физиков и лириков? «Системный Блокъ» считает, что их знания можно взболтать, но не смешивать. Читаем интервью «Системного Блока» о том, насколько важно современным гуманитариям знание Python и нейросетей.

Архивы, сети и шифры в дневниках и письмах: цифровые исследования эго-документов

Изучение дневников и писем — это возможность услышать голоса людей из прошлого и понять, как они воспринимали и оценивали мир вокруг. В новой подборке мы рассказываем, как цифровые методы помогают сохранять, исследовать и публиковать исторические эго-документы.

Новый реагент — новый яд или спасение улиц? Дата-расследование «Системного Блока»

Испорченная обувь, обожжённые собачьи лапы, гололёд… «Да лучше бы просто песком посыпали, и всё», — думаем каждую зиму мы, стараясь не убиться и ругая коммунальщиков за щедро посоленные дороги. «Теперь не соль, а “Бионорд”», — поправляют нас власти, убеждая, что это безвредно. В опыте использования разными регионами нового чудо-средства попытался разобраться «Системный Блокъ».

Тест: какое будущее вам подходит?

Писатели-фантасты представляли будущее по-разному. Мы уже рассказывали о том, как им удалось предвидеть современные информационные технологии от мессенджеров до генеративных нейросетей. Теперь пришла ваша очередь подобрать себе грядущее по душе. Тест подскажет, какое будущее из фантастических книг разных столетий подойдет вам лучше всего.

«Коктейль Молотова» массового производства: как судят за поджоги военкоматов

В 2022 году поджоги военкоматов стали частью антивоенного движения в России. Поджигатели протестовали против отправки военнообязанных на передовую, а с сентября еще и против мобилизации. В ответ на прямое действие партизан, власти ужесточили наказание за поджоги. Дата-отдел «Системного Блока» проанализировал судебные дела и рассказал о том, как государство расправляется с поджигателями.

Что такое визуализация данных?

Зачастую данные содержат полезную информацию — от цен на «Биг Мак» в разных странах, по которым можно оценить стоимость валюты, до коррупционных схем высших должностных лиц и свидетельств военных преступлений. Поэтому существует множество способов извлечения важной информации из большого и сложно устроенного массива данных. В этом материале мы расскажем об одном из таких методов — о визуализации данных.

Что такое нейросеть GPT-3 и зачем она нужна

Общение с чат-ботами и голосовыми помощниками стало частью повседневного опыта. Мы спрашиваем у нейросетей о погоде и пробках, просим переводить и сочинять тексты, проверяем их способности стихосложения и иногда даже делимся сокровенными секретами. СБъ уже не раз рассказывал о работе языковых моделей, которые делают боты более человечными. Предлагаем освежить знания и прочитать материал из глоссария про наиболее крупную и продвинутую языковую модель в мире – GPT-3

Нейроцензура: генератор стихов Пушкина отказался писать о России, самовластье и царе

Бот «AI да Пушкин» дописывает любую предложенную ему фразу до четверостишия в стиле А.С. Пушкина — но только если в ней нет «запретных» слов

Пушкинский дом обновил Корпус текстов детской прозы

Институт русской литературы (Пушкинский дом) РАН пополнил ДетКорпус и сделал его доступным не только для онлайн-поиска, но и в качестве датасета

Тест Тьюринга для киберпоэтов

Как обычный «слепой тест» по отделению машинной поэзии от той, что написана людьми, приводит ученых к философскому спору об относительности понятия «человека» в искусстве

Как провести корпусное исследование? Помогите!

Рассказываем, что такое mystem и antconc, для чего они нужны, и как ими пользоваться

Автор статей

Пыльца, грибы и микробы помогают раскрывать преступления. А вы знаете как?

Готовы почувствовать себя Шерлоком Холмсом? Проверьте свои знания о криминалистической биоинформатике: как с помощью ДНК, пыли, грибов и микробиомов можно раскрыть преступления.

Mistral выпустила рассуждающую модель Magistral

Это первая модель компании с поддержкой reasoning.

Midjourney запустила генерацию видео на основе изображений

Пользователи могут анимировать картинки с помощью текстовых инструкций или автоматических сценариев.

Meta* инвестировала в $14 млрд сервис для разметки Scale AI

Компания приобрела 49% стартапа, специализирующегося на разметке данных для ИИ-моделей.

Тест: что вы знаете о палеогенетике?

Готовы ли вы совершить захватывающее путешествие в мир древности, используя современные технологии? Палеогенетика и биоинформатика воссоздают историю наших предков через анализ их ДНК. Пройдите наш тест и проверьте свои знания о том, как наука помогает расшифровывать загадки прошлого!

Grok появится в Telegram этим летом: анонс Дурова

ИИ от xAI будет встроен в мессенджер, а Telegram получит инвестиции и долю от подписок.

DeepSeek R1 обновился: меньше ошибок и поддержка внешних инструментов

Модель реже галлюцинирует, умеет запускать код и искать информацию в интернете.

Тест: что вы знаете о цифровой эпиграфике?

Как современные технологии меняют подход к изучению древних надписей? Какие методы используют исследователи для сохранения исторического наследия? Пройдите наш тест и выясните, насколько хорошо вы разбираетесь в цифровой эпиграфике.

Крокодиловы слезы ≠ слезы крокодила: проверьте, как хорошо вы знакомы с коллокациями

Каждый, кто говорит по-русски, знает, что роль играют, условия выдвигают, а глаза бывают карими, но не коричневыми. Такие устойчивые словосочетания называются коллокациями, и существовать без них не может ни один язык. Мы уже рассказывали о том, как коллокации помогают гуманитариям, а теперь сделали тест, который поможет вам разобраться в этой теме. Готовы проверить свои знания?

Anthropic выпустила новое поколение Claude 4

LLM демонстрирует высокий уровень автономности и в ряде случаев склонность к обману и инициативе.

OpenAI построит суперкомпьютер в ОАЭ

Проект станет частью инициативы Stargate по внедрению ИИ в государственные системы страны.

OpenAI купила компанию экс-шефа по дизайну Apple

Бывший дизайнер Apple займётся созданием устройств с ИИ в партнёрстве с исследовательской командой OpenAI.

Google обновила языковые модели и генераторы видео и звука 

Обновлены модели Gemini, анонсированы агентная система, генераторы мультимедиа и поиск с ИИ-выжимками.

Поповская шапка и провинциальный розен: угадаете ли вы растение по его старинному названию?

Как называли алоэ или шиповник травники XIII века или аптекари времен Петра Великого? Ученые из Европейского университета в Санкт-Петербурге создали базу данных PhytoLex, в которую внесли обозначения растений в ботанических, медицинских и этнографических источниках XI–XVIII веков. Подробно об этом проекте мы рассказали здесь. Предлагаем вам попробовать себя в роли историка ботаники: сможете ли вы угадать современные названия растений по их «паспортным данным» из прошлого?

Цифровые инструменты для японского языка: от словарей и распознавания до стилометрии

В новой подборке мы рассказываем об инструментах, которые используют востоковеды для изучения японского языка и цифровых исследований японских текстов: от онлайн-словарей до продвинутых методов стилометрии.

Google запустила генерацию ответов AI Mode в поиске

Новая вкладка формирует краткие текстовые ответы с помощью языковых моделей и доступна пользователям из США.

Alibaba представила третье поколение моделей Qwen

Модели Qwen3 доступны в разных масштабах, поддерживают рассуждения и входят в число лидеров среди open-source LLM.

Такая разная лингвистика: подборка интервью «Системного Блока»

Политизированные споры вокруг разграничения русского, украинского и белорусского языков, междисциплинарные исследования нейролингвистов, аудиозаписи Александра Блока. В фокусе новой подборки интервью «Системного Блока» — лингвистика. Наши собеседники рассказали о языковой смерти, компьютерных методах для церковных текстов, дистрибутивной семантике и о лингвистических экспедициях.

OpenAI представила модели GPT-4.1, o3 и o4-mini

Новые версии улучшили качество генерации, расширили контекст до 1 млн токенов и получили поддержку визуальных данных.

Meta* выпустила новые версии модели Llama 4

Компания представила модели Scout, Maverick и Behemot с поддержкой обработки изображений и длинных контекстов до 10 миллионов токенов.

Ученые спрогнозировали развитие ИИ до 2027 года

Исследователи предсказывают появление сверхчеловеческого ИИ и усиление международной конкуренции.

Подборка про русскую историю интернета

Интернет и программирование: как много в этом звуке для сердца русского слилось! Читайте в нашей подборке, как писатели в начале XX века предсказали интернет, как в Советском Союзе пытались создать суверенную электронную сеть и почему советские и русские программисты стали цениться во всем мире.

OpenAI обновила возможности генерации изображений в GPT-4o

Модель получила нативную поддержку работы с текстом и изображениями без использования отдельных нейросетей.

Google представила экспериментальную модель Gemini 2.5 Pro

Модель занимает первое место на платформе LMArena и доступна через API в бесплатной и платной версиях.

Mistral выпустила обновленную модель Mistral Small 3.1

Компактная модель улучшила результаты в задачах на понимание языка и логическое рассуждение.

OpenAI предложила новые правила экспорта чипов

Компания предлагает ограничить использование чипов для китайских ИИ-моделей в рамках инициативы AI Action Plan.

Google выпустила третью версию open-source модели Gemma

Модель поддерживает обработку текста и изображений и опережает конкурентов на платформе LMArena.

Подборка к 8 Марта: неравенство, женщины в DH и гендерная социолингвистика

В честь Международного женского дня мы собрали для вас подборку полезных и познавательных публикаций, в которых мы напоминаем о сферах, где все еще сохраняется неравенство, изучаем, чем занимаются DH-исследовательницы, и ищем различия между мужской и женской речью.

Думать или делать: исследуем глаголы в английской литературе

Что важнее для создания целостного образа персонажа в литературе: его слова или его действия? Как выбор глаголов отражает индивидуальность героя? Рассказываем о недавнем исследовании корпуса английской прозы, которое даёт ответы на эти (и не только) вопросы.

«Системный Блокъ»: лучшее за 2024 год

В 2024 году «Системный Блокъ» опубликовал 180 материалов. В этом посте мы рассказываем о наших итогах года: о запуске новых рубрик, лучших публикациях, создании DH-портала и других новостях. Несмотря ни на что, наша команда собирала для вас всё самое интересное из сферы цифровых гуманитарных исследований. Это наш способ сделать мир — если не лучше, то хотя бы понятнее.

Холм невзгод: когда наступает возраст несчастья

Официально диагноза «кризис среднего возраста» не существует. Но что происходит в этот период? Узнаем, как связаны возраст и несчастье и почему кривая несчастья похожа на холм.

Чему учат в цифровой школе? Альтернативное расписание уроков к 1 сентября от «Системного Блока»

Как бы выглядела школа «Системного Блока» и чему бы в ней учили? К началу учебного года мы составили альтернативное расписание и подобрали материалы.

Тексты, звуки, экспонаты: подборка интервью о цифровых коллекциях

Оцифровка и сохранение артефактов культуры — одна из важнейших задач цифровой гуманитаристики. Мы собрали для вас интервью четырёх исследователей и одного гражданского активиста о том, кто, зачем и для кого коллекционирует цифровые данные.

Птички, цветочки и запахи городов: подборка материалов для летнего чтения

Лето почти закончилось, но это не значит, что всё потеряно. Ещё можно успеть насладиться августом: съездить в путешествие, сходить в лес, собрать гербарий, посмотреть выставки. Но ещё лучше, если сделать всё это в духе digital humanities. Как соединить технологии и летние радости, читайте в нашей сезонной подборке.

Какие темы интересуют современных востоковедов и как им помогают в исследованиях цифровые технологии?

Что узнали учёные, исследующие религиозность африканцев? Какие инструменты помогают анализировать древние рукописные иероглифы и токенизировать азиатские тексты? И что творят с цифровыми технологиями японцы? Читайте в нашей востоковедческой подборке статей от «Системного Блока».

Подборка статей о цифровых музыкальных исследованиях

О чём пели в российской попсе за последние тридцать лет? Можно ли посчитать, насколько депрессивна моя любимая песня? Куда идти, если я хочу провести своё исследование большого пласта музыки? В подборке статей «Системного Блока» — проекты цифровых музыковедов и интернет-ресурсы, которые могут помочь исследователю.

Филологи и программирование: подборка интервью «Системного Блока»

Лингвистика и программирование. Филология и программирование. Нужны ли они друг другу? Нужно ли гуманитариям вообще уметь программировать или же все учёные чётко делятся на физиков и лириков? «Системный Блокъ» считает, что их знания можно взболтать, но не смешивать. Читаем интервью «Системного Блока» о том, насколько важно современным гуманитариям знание Python и нейросетей.

Как устроено закулисье современного интернета: подборка интервью «Системного Блока»

Интернет — это параллельный мир, в котором возникают новые культуры, формируется новый язык, разворачиваются ожесточённые словесные битвы. Он виртуален, но происходящее в нём напрямую влияет на реальную жизнь каждого из нас. Политика, буллинг, скорбь, торговля, флирт, преступления и благотворительность — как этот видимый хаос определяет нашу жизнь? О всём этом читайте в подборке интервью «Системного Блока», где наши интернет-исследователи делятся наблюдениями и опытом.

Подборка статей о точных методах в лингвистике

В Москве на 95-м году жизни скончался лингвист Ю. Д. Апресян — основатель Московской семантической школы, соавтор множества словарей, один из первых исследователей машинного перевода. Мы решили почтить память Ю. Д. Апресяна подборкой статей о прошлом и настоящем точных методов в лингвистике и машинного перевода.

Новый реагент — новый яд или спасение улиц? Дата-расследование «Системного Блока»

Испорченная обувь, обожжённые собачьи лапы, гололёд… «Да лучше бы просто песком посыпали, и всё», — думаем каждую зиму мы, стараясь не убиться и ругая коммунальщиков за щедро посоленные дороги. «Теперь не соль, а “Бионорд”», — поправляют нас власти, убеждая, что это безвредно. В опыте использования разными регионами нового чудо-средства попытался разобраться «Системный Блокъ».

«Системный Блокъ»: лучшее за 2023 год

По традиции 31 декабря «Системный Блокъ» публикует подборку лучших материалов уходящего года. В 2023-м в подборке есть стилометрия Набокова, интервью об исторической информатике, открытка из варшавского гетто, дата-исследование поляризации российских СМИ, предсказание появления ChatGPT от современника Пушкина… С Новым годом!

Возможен ли мир без СПИДа: статистика ВИЧ в России и в мире

Во Всемирный день борьбы со СПИДом изучаем данные о распространении ВИЧ в России и в мире, разбираемся, можно ли вылечить заболевание и как математическое моделирование позволяет его изучать.

Почему медицине нужны информационные технологии

Виртуальная реальность, дополненная реальность и дистанционные методы взаимодействия проникают и в медицину. VR и AR-технологии помогают хирургам проводить операции, а люди с психическими проблемами погружаются в виртуальный гипноз. Рассказываем, как медицина занимается пациентами в эпоху цифровых технологий.

Фонограммархив для науки: Светлана Подрезова о коллекции аудиозаписей Пушкинского Дома и работе с источниками

Как связаны имена Блока и Гумилёва с историей крупнейшей коллекции этнографических аудиозаписей? Когда исполнители перестали бояться раструба фонографа? Что происходит, если идеология вмешивается в научный процесс? Как происходит цифровизация аудио, записанного некогда на восковые валики? Об этом в интервью «Системному Блоку» рассказала Светлана Подрезова, заведующая Фонограммархивом Пушкинского Дома (ИРЛИ РАН).

9988 слов о последнем десятилетии

Мы прочитали новый школьный учебник по истории России для 11 класса и проанализировали параграфы, относящиеся к последнему десятилетию. Выясняем, чему будут учить в новом учебном году, и как официально осмысляются и оцениваются события, свидетелями которых мы были.

«Открытые данные против мракобесия и пренебрежения реальностью»: интервью с Кириллом Маслинским 

Кирилл Маслинский — цифровой филолог, руководитель Лаборатории цифровых исследований литературы и фольклора в Пушкинском Доме, создатель Детского корпуса и Репозитория открытых данных по русской литературе и фольклору. «Системный Блокъ» узнал у Кирилла, что можно найти в тысячах оцифрованных детских книг, когда в детской литературе было допустимо употреблять слово «какашка», зачем филологам репозиторий открытых данных и может ли этот репозиторий как-то помочь в борьбе с мракобесием и войнами.

Миссия России, деградация Европы: какие патриотические фильмы заказывает Минкульт РФ  

С 2014 года Министерство культуры России публикует приоритетные для кинопроизводства темы, у которых есть все шансы получить господдержку. Следуя этим рекомендациям, режиссеры сняли, например, «Крым» и новые «А зори здесь тихие….». Рейтинг у этих фильмов на Кинопоиске низкие, но это не останавливает «патриотический продакшн» в РФ. Разбираемся, что для нас снимут в 2023 и насколько это будет в духе времени.

«Цифровой концлагерь»: как закон о повестках через «Госуслуги» взбудоражил россиян

В России вступил в действие закон, объявляющий повестку из военкомата врученной вне зависимости от ее получения призывником. Теперь повестку достаточно выслать заказным письмом, разместить в электронном реестре или направить гражданину через «Госуслуги». Россияне отреагировали на новый закон повышенным интересом к «цифровым повесткам», «цифровому концлагерю» и удалению аккаунта на «Госуслугах».

«Присоединение на паузе»: как российских военных перенаправили из Южной Осетии в Украину

Российские военнослужащие — это люди, которые, согласно статистике погранслужб, крайне редко покидают пределы страны. Но с 2014 года военные из РФ активно въезжали в Южную Осетию, которая пока не решила, готова ли она входить в состав России. В 2021-2022 на фоне подготовки и начала вторжения в Украину этих поездок стало гораздо меньше.

GPT-4

Четвёртое поколение генеративных языковых моделей GPТ. Модель решает задачи качественнее GPT-3, а также умеет работать с изображениями.

«Коктейль Молотова» массового производства: как судят за поджоги военкоматов

В 2022 году поджоги военкоматов стали частью антивоенного движения в России. Поджигатели протестовали против отправки военнообязанных на передовую, а с сентября еще и против мобилизации. В ответ на прямое действие партизан, власти ужесточили наказание за поджоги. Дата-отдел «Системного Блока» проанализировал судебные дела и рассказал о том, как государство расправляется с поджигателями.

LLaMa

Семейство эффективных языковых моделей от Meta, доступное для некоммерческого использования всем желающим

Собери их всех: как record linkage помогает обогащать большие биографические данные

Сейчас историки всё чаще уделяют внимание не столько выдающимся деятелям прошлого, сколько целым группам людей, жившим в ту или иную эпоху. Это неудивительно — ведь с появлением больших исторических баз данных стало проще анализировать множество биографий одновременно. Автоматизировать обработку данных об одних и тех же людях в разных базах помогает сопоставление данных, или record linkage.

«Системный Блокъ»: лучшее за 2022 год

В 2022 году «Системный Блокъ» опубликовал 247 материалов. В этом посте мы сформулировали краткие итоги ушедшего года: открытие дата-отдела, оцифровка новых открыток, свежие интервью, тесты и инфографики, а также подборка лучших постов за весь год. Но самое главное в тяжелом 2022-м — это наша поддержка друг друга. Лучи этой поддержки мы шлем читателям и в новый 2023 год!

«Персоналистские диктатуры чаще начинают войны»: Эрика Франц об автократиях, Украине и поводах для оптимизма

Системный Блокъ поговорил с политологом Эрикой Франц о недемократических режимах, диктаторах и возможностях перехода к демократии. Спойлер: наши шансы на демократический транзит невысоки, но они есть.

Найди пару: однофамильцы-спойлеры на московских выборах 2022

В Москве прошли выборы муниципальных депутатов. Мы изучили списки кандидатов по округам и нашли неслучайные совпадения.

Что такое мешок слов

Рассказываем, что такое мешок слов и как он может помочь в задачах автоматической обработки текста