Фото автора

Дарья Устюжанина

Редактор, шеф-редактор, автор

Преподаю в университете, изучаю медиа

Редактор статей

Как работает большая языковая модель: перцептроны в черном ящике

Несмотря на стремительное развитие больших языковых моделей, исследователи до сих пор плохо понимают, как и почему нейросети выдают тот или иной ответ. Однако изучение этих проблем находится на переднем крае компьютерных наук. В нашем новом материале рассказываем о механизмах работы языковых моделей. В первой части мы объясняем, почему нейросети работают, как «чёрные коробки», что такое интерпретируемость в контексте машинного обучения и как компьютеры моделируют работу нейрона.

«В России история интернета не написана никем»: Леонид Юлдашев об изучении интернета, кибернетике, Starlink и Чебурнете

Как исследователи пишут историю интернета? Почему глобальная сеть вытеснила национальные проекты вроде французского Minitel? Почему достижения советской кибернетики не привели к созданию работающих сетей? Кто стоял у истоков Рунета и куда Рунет движется сегодня? Обо всём этом «Системному Блоку» рассказал Леонид Юлдашев, социолог, исследователь истории интернета, в прошлом координатор клуба любителей интернета и общества.

Лазер из iPhone: как найти древнюю цивилизацию с помощью LiDAR

Современным археологам недостаточно лопаты, мастерка и кисточки для полевой работы. Чтобы обнаружить скрытые в густых лесах под слоем почвы города и дороги, учёные сканируют пространство с помощью лазера. Рассказываем, как работает LiDAR — технология, которая сегодня есть в обычном айфоне, и как LiDAR помогает делать археологические открытия в джунглях Амазонки, на Тихоокеанских островах и прямо посреди Европы.

Проверяем авторство: стилометрия для японских текстов

Стилометрия — это количественный метод в лингвистике, литературоведении и других гуманитарных науках, который определяет авторский стиль с помощью статистических метрик. Метод применяется для того, чтобы установить авторство спорного текста, датировать текст (такие исследования называются стилохронометрией) или определить другие метаданные, такие как жанр текста или пол автора. На примере работы японской исследовательницы Уэсака Аяка мы расскажем о том, как с помощью стилометрии было поставлено под сомнение авторство повести, приписываемой знаменитому поэту и прозаику XVII века Ихара Сайкаку.

Всемирная история картотек: движение к мировому стандарту

«‎Системный Блокъ»‎ продолжает публикацию цикла статей о том, как развивалась идея библиотечного каталога с XVI века и до наших дней. В третьей части исследователь истории науки и техники, сотрудник Центра непрерывного образования факультета компьютерных наук НИУ ВШЭ Антон Басов рассказывает, как каталожные карточки и библиотечные коды стали мировым стандартом и как картотеки повышают работоспособность философов.

Всемирная история картотек: как в эпоху Просвещения классифицировали знание

Как Линней придумал таксономию живых организмов, в чём польза игральных карт для каталогизации знания и сколько человек нужно, чтобы описать 30 тыс. книг? Исследователь истории науки и техники, сотрудник Центра непрерывного образования факультета компьютерных наук НИУ ВШЭ Антон Басов продолжает рассказывать о том, как развивалась идея библиотечного каталога с XVI века и до наших дней, на страницах издания «Системный Блокъ».

Кибербуллинг в японских школах: что говорят данные о проблеме травли в Японии?

Онлайн-буллинг — проблема, с которой сталкиваются школьники по всему миру. Однако оценить её масштаб бывает сложно из-за отсутствия статистики. Министерство культуры Японии ежегодно публикует отчёты о случаях издевательств над учениками. Рассказываем, как японские власти собирают информацию об онлайн-буллинге и насколько распространена кибертравля в этой стране.

Всемирная история картотек: как учёные и библиотекари пытались упорядочить всё

Информация бесполезна, если мы не знаем, как и где её найти. С появлением книгопечатания проблема упорядочивания выпущенных книг занимала учёных всё больше. Исследователь истории науки и техники, сотрудник Центра непрерывного образования факультета компьютерных наук НИУ ВШЭ Антон Басов изучил, как развивалась идея библиотечного каталога с XVI века и до наших дней. В этом материале он рассказывает, зачем разрезать конспекты книг на полоски и как крючки в шкафу заменяли библиотекарям теги.

На последнем дыхании: туберкулёз в России в цифрах и фактах

Туберкулёз относится к числу социально значимых заболеваний, способных ухудшать не только жизнь одного человека, но и всего общества. «Системный Блокъ» изучил с опорой на данные, насколько туберкулёз распространён в России, от чего зависит заболеваемость, почему пациенты до сих пор остаются стигматизированными и как уберечь себя и своих близких от заражения.

Криминалистическая биоинформатика: как пыльца, грибы и микробы помогают раскрывать преступления

Помните, как в сериале BBC Шерлок Холмс по составу налипшей на кроссовки пыльцы выясняет, где жил их владелец? Это не фантазия сценариста, а научный метод геолокации, которому больше 55 лет. В нашем материале рассказываем, как по следам пыльцы раскрывают преступления, зачем криминалистам ДНК растений и можно ли по пыли на вашей двери определить, где вы живёте.

От Аввакума до Эсхила: анализ школьных программ по литературе в проекте «Список чтения»

Что такое литературное школьное образование — только ли книжки, которые год за годом читают ученики? И что из себя представляет «школьный канон»? Кажется, что нет поколения, которое бы не обошлось без «Дубровского» или «Муму», «Преступления и наказания» и «Мастера и Маргариты». Так ли это? Представить состав школьной программы по литературе на протяжении 170 лет и проследить его изменения — такова цель проекта Высшей школы экономики «Список чтения».

Угадайте любимые слова известных писателей: тест по уникальным авторским словечкам из Национального корпуса русского языка

Национальному корпусу русского языка — 20 лет! По этому поводу мы приготовили для вас тест по уникальным словам русских писателей. Пройдите его — и узнаете, в чьих текстах раздавалось «хохотание»‎ и происходило «требоисправление»‎.

История на службе игровой индустрии: как низаритские исмаилиты стали Орденом Ассасинов

Assassin’s Creed — серия игр, сюжет которых построен вокруг многовековой борьбы двух тайных организаций — ассасинов и тамплиеров. Прототипом ассасинов послужили члены средневекового мусульманского течения исмаилитов-низаритов. В нашем материале рассказываем, как видеоигры адаптируют исторические реалии под свой формат.

Качество воды в родниках Москвы: что говорят данные

Существует устойчивое убеждение, что родниковая вода чище и полезнее любой другой. По данным ВЦИОМ, 56% россиян уверены в полезных свойствах природных источников. Нередко горожане специально приезжают издалека, чтобы запастись питьём из недр земли, особенно если источник имеет историческое или религиозное значение. Мы изучили открытые данные Правительства Москвы, чтобы проверить, так ли безопасны родники на территории мегаполиса, как нам кажется. Оказалось, что на 2022 год большинство родников были загрязнены либо пробы там не проводились.

Что такое сетевой анализ?

Сетевой анализ ― это метод исследования, с помощью которого можно визуализировать и исследовать связи между людьми в сообществе, персонажами в художественном произведении, животными в стае и вообще любыми объектами. Из чего состоит сеть как модель? Какие параметры у них есть и о чём они говорят? Объясняем основы сетевого анализа на простых примерах.

Следи за ушами: как кошки чувствуют боль?

Учёные из Монреальского университета долго задавались вопросом, как понять, что животному больно, и вовремя помочь ему. Результатом их эксперимента стала шкала кошачьей боли. Пройдите наш тест и узнайте, как она создавалась. Подробности о работе учёных можно прочитать в нашем материале.

Глазами нейросети: мир как набор стереотипов

Миром управляют белые мужчины. Они же в основном работают врачами, юристами и судьями — хотя среди них иногда встречаются и белые женщины. Преступления совершают темнокожие парни, а женщины с афроамериканскими корнями готовят бургеры в забегаловках. Ну а если в ресторан зашел русский, то он непременно возьмет стопку водки. Именно так видит наш мир нейросеть Stable Diffusion. Алгоритмы искусственного интеллекта не только генерируют изображения или тексты, но и воспроизводят общественные стереотипы. Рассказываем, как и почему они это делают.

«Нас вообще все боятся»: Александра Архипова о том, зачем фольклористы и социальные антропологи собирают слухи и считают репосты

Как примирить сторонников количественных и качественных исследований культуры? Как исследователям фольклора помогают цифровые базы данных? О чём могут рассказать лозунги митингующих и народные рецепты лечения COVID-19? Почему конспирологические теории так привлекательны? Обо всём этом «Системный Блокъ» поговорил с антропологом Александрой Архиповой.

Как автоматически расшифровать аудио: пошаговая инструкция для Whisper

Расшифровка аудиозаписи — дело утомительное и времязатратное. К счастью, появляется всё больше сервисов, которые умеют это делать автоматически. Рассказываем, как сделать это с помощью модели Whisper от OpenAI и смотрим, насколько хорошо она справляется с русскоязычными записями

Кто какую часть произведения написал? Выясняем с помощью Stylo

«‎Системный Блокъ» уже рассказывал, что такое стилометрия, и как сделать её своими руками с помощью библиотеки Stylo на языке программирования R. В новом гайде мы познакомим вас с функцией rolling.classify(), которая может помочь в исследований произведений, написанных в соавторстве.

Читаем секретные письма опальной королевы: историческая криптография на примере Марии Стюарт

Расшифровка старинных кодов и древних систем письменности роднит работу историка с детективным расследованием. Это требует от учёного не только недюжинных способностей к анализу искусственных знаковых систем, но и хотя бы поверхностного знакомства с теорией вероятностей и другими математическими дисциплинами. На примере эпистолярного наследия Марии Стюарт рассказываем, как историку, который занимается разгадкой старинных шифров, могут помочь дата-инженеры и разработчики нейросетей.

Рецепт Нобелевской премии: исследуем открытые данные о лауреатах

10 декабря в Стокгольме Нобелевский комитет наградил лауреатов 2023 года. По этому поводу мы изучили сведения о том, кому вручали премию в течение всей её истории — с 1901 года. Теперь мы знаем, где нужно родиться, в каком университете работать и до скольких лет ждать, чтобы получить признание комитета. Эти и другие наблюдения — в нашем новом материале.

Посмотреть на мир чужими глазами: пять исследований с мобильными айтрекерами

Данные о движениях глаз можно получать не только в лаборатории, но и во время реальных жизненных ситуаций: в магазине, за рулём автомобиля, в музее, на скалодроме. На примере исследований из разных областей — от нейрофизиологии до лингвистики — мы расскажем о сферах применения мобильных айтрекеров

Эйджинг и социальное неравенство: искусственный интеллект в мире стареющих людей

ООН прогнозирует, что к 2100 году пожилые составят около трети всего мирового населения. Рост продолжительности жизни — это хорошо, но старение населения может замедлить экономический рост и сделать трудовую нагрузку на работающих непосильной. Сможет ли искусственный интеллект помочь преодолеть сложности, возникающие в связи с уменьшением рабочей силы, или он вызовет новые социальные проблемы? Разбираемся, как изменится жизнь пенсионеров и всех остальных в дивном новом мире.

Сталин, чучхе, Ким Ир Сен: о чём говорят заголовки северокорейской прессы

Северная Корея имеет совершенно заслуженную репутацию закрытого общества, труднодоступного не только для туристов, но и для специалистов. Один из немногих открытых источников, по которым исследователи могут судить о ситуации в стране, ― это пресса. Специалист по Северной Корее, ведущий научный сотрудник университета Кунмин (г. Сеул) Фёдор Тертицкий изучил заголовки главной партийной газеты КНДР и обнаружил, как в них отражались идеологические изменения и внешнеполитические приоритеты государства

Как писать художественные тексты с ChatGPT и не облажаться: советы редактора

Может ли нейросеть заменить писателя? И да и нет. Есть творческие задачи, с которыми современные языковые модели справляются легко: например, стилизовать сказку под триллер, а трагедию Шекспира — под дворовую байку. Но есть многое, в чем им нужна помощь или хотя бы руководство человека. Разбираемся, какие литературные задачи можно делегировать ChatGPT, а какие пока не стоит.

Русалка села на шпагат: как нейросети генерируют картинки и подменяют понятия

Новостей о том, что уже умеет искусственный интеллект и какие профессии из-за него обречены, предостаточно. Гораздо интереснее выяснять, чего он не может. Ранее мы уже писали о том, как ChatGPT выдумывает несуществующие произведения Льва Толстого. Теперь авторы «Системного Блока» провели эксперимент, чтобы выяснить, где границы возможностей нейросетей для генерации изображений (Midjourney, DALL-E, Kandinsky), и обнаружили у них проблемы с образным и абстрактным мышлением

Вы Лев Толстой на словах или на деле? Викторина по редким словам из корпуса текстов писателя

Кого Лев Толстой называл голышом и где в усадьбе тырла? Кем лучше быть ― келарем или щелкопёром? Писатель был знатоком редких и диковинных слов. Пройдите наш тест и попробуйте отгадать их значения

Женщина и программист: исследуем гендерное неравенство в IT-сфере

Нобелевская премия 2023 присуждена за исследование роли женщин в экономике и причин дискриминации женщин в оплате труда. Проблема гендерного неравенства очень заметна и в сфере IT. «Системный Блокъ» изучил, какова доля женщин в IT, сколько девушек готовы обучаться компьютерным наукам и какие стереотипы ограничивают их на рынке труда.

Книги 1.х: расширяем границы дозволенного

Электронные книги ― еще одна примета цифровой повседневности. Десять-пятнадцать лет назад они казались чем-то революционным и тем, что навсегда изменит характер чтения. Но сбылись ли ожидания визионеров? «Системный Блокъ» разбирается, как технологии меняют книжный мир (спойлер: медленно), и почему это не так просто, как кажется.

Тест: какая летняя открытка подходит вам? 

Есть два способа сохранить на память уходящее лето: приготовить варенье и получить открытку. Варенье мы вам подарить не можем, а открытку можем. Пройдите наш серьезный психологический тест и получите летние послания из коллекции проекта «Пишу тебе». Мы подобрали их специально для вас.

Голос(а) автора: может ли один человек писать как несколько?

Стилометрический анализ позволяет определить, принадлежат ли тексты одному и тому же автору. Но что если писатель творит под несколькими литературными масками, у каждой из которых есть индивидуальность? Рассказываем, как португалец Фернандо Пессоа и француз Ромен Гари «обманули» стилометрию — а ученые Борис Орехов и Даниил Скоринкин исследовали и визуализировали это.

Строить графы стало проще. Встречайте Gephi Lite

В апреле 2023 года разработчики самой популярной программы для сетевого анализа Gephi представили её веб-версию. Базовые функции сервиса теперь доступны в браузере, и пользоваться им стало гораздо проще.

Цифровой архив газет Российской империи: от морских чудищ до высочайших манифестов

Разбираемся, как узнать, кого видели британские мореходы, кому досталось наследство Сергея Львовича Пушкина и когда общество узнало об отречении Николая II, с помощью цифрового архива газет.

Автор статей

Архивы, сети и шифры в дневниках и письмах: цифровые исследования эго-документов

Изучение дневников и писем — это возможность услышать голоса людей из прошлого и понять, как они воспринимали и оценивали мир вокруг. В новой подборке мы рассказываем, как цифровые методы помогают сохранять, исследовать и публиковать исторические эго-документы.

Качество воды в родниках Москвы: что говорят данные

Существует устойчивое убеждение, что родниковая вода чище и полезнее любой другой. По данным ВЦИОМ, 56% россиян уверены в полезных свойствах природных источников. Нередко горожане специально приезжают издалека, чтобы запастись питьём из недр земли, особенно если источник имеет историческое или религиозное значение. Мы изучили открытые данные Правительства Москвы, чтобы проверить, так ли безопасны родники на территории мегаполиса, как нам кажется. Оказалось, что на 2022 год большинство родников были загрязнены либо пробы там не проводились.

На пыльных дорожках прошедших эпох: семь статей об исторической картографии

Карты всегда были ценным историческим источником, но цифровые технологии сделали их поистине незаменимыми в руках учёных. Геоинформатика и пространственный анализ помогают обнаруживать связи между социальными процессами и окружающей средой. С помощью визуализации геоданных исследователи восстанавливают этапы развития городов и торговых путей, изучают средневековую преступность и превращают сюжеты из прошлого в увлекательные рассказы