Читать нас в Telegram

Как превратить текст в генеалогическое древо с помощью Python

Как понять, кем вам приходится сваха внучатого племянника вашей сестры? Проще всего — нарисовать генеалогическое древо, которое отразит все родственные связи. А еще лучше — написать код на Python, который сделает это за вас

Блоги авторов

Фото автора

Борис Орехов

Гуманитарий среди компьютерщиков, компьютерщик среди гуманитариев

Комбинаторика бисера

Как может выглядеть игра в бисер из романа Гессе? Вопрос абсолютно праздный, но иногда именно из таких непрактичных вопросов рождаются интересные технологические разработки. Можно ли исковеркать китайскую поэзию и получить новый эстетический объект?
Фото автора

Юлия Папанова

Учитель истории и обществознания

Как провести урок истории на основе цифрового архива «Прожито»?

Несколько идей, как можно использовать дневники для погружения в атмосферу событий прошлого
Фото автора

Борис Орехов

Гуманитарий среди компьютерщиков, компьютерщик среди гуманитариев

Уроки Нейробашкорта

Вот уже больше полугода существует проект «Нейробашкорт», проект лично для меня необычный и в какой-то мере противоестественный. Проект, меня многому научивший, и его уроками я хотел бы сегодня поделиться.

Наши статьи

Путешествие во времени: подборка дореволюционных открыток из будущего в прошлое

Сегодня 15 октября. И в любой стране Европе тоже 15 октября. Правда, к такому единогласию в календарях мы пришли недавно: чуть больше ста лет назад. До этого Россия и Европа жили буквально в разных временах. Как эта разница отразилась в почтовых открытках, читайте в нашем новом материале от проекта «Пишу тебе»

Тест: что говорит статистика о выборах в регионах России

17–19 сентября 2021 года в России прошли выборы в Государственную Думу. Независимый электоральный аналитик Сергей Шпилькин построил графики, которые отражают результаты голосования в разных регионах. По ним можно предположить, были ли на выборах фальсификации. Пройдите наш тест и проверьте, сможете ли вы понять, какой регион на каждом графике?

«Я совсем без денег»: о чем писали в открытках 120 лет назад

1 октября — Международный день открытки. В этот день в 1869 году австрийский экономист Эммануэль Херрман написал статью о том, что написание письма и его упаковка в конверт — слишком сложные операции для маленьких сообщений. Его идея вдохновила австрийскую почту ввести новый тип открытого письма. Так появилась почтовая открытка. Специально к этому дню мы публикуем рассказ о самых старых открытках в коллекции нашего проекта «Пишу тебе». Открыток 1869 года у нас пока нет, но есть те, которым больше ста лет — и в них много интересного.

Русские в Китае 100 лет назад: контент-анализ жизни эмигрантов в Харбине

Каким образом подданные бывшей Российской империи очутились в северо-восточном Китае и как они обустраивали быт, превратив Харбин в «Дальневосточную Москву». И почему их называли «редисками» (нет, знаменитый комедийный фильм тут ни при чем). Рассказываем о жизни русских эмигрантов в Китае с применением цифровых методов

ИИ с датчиком движения проследит за приемом лекарств

Беспроводное зондирование облегчит жизнь пациентам с ингаляторами и инсулиновыми ручками

Цифровое искусство: как современные художники создают шедевры в TouchDesigner

Экспрессионизм обычно ассоциируется с Джейсоном Поллоком с его красочными разводами. Но создать подобное искусство можно и не пачкая рук. Рассказываем о серии видеоработ «Expressions» — экспрессионистском произведении диджитал-арта

Почем голосование и сколько самовыдвиженцев прорвалось: тест к выборам в Госдуму

17–19 сентября пройдут выборы в Государственную Думу. Однако заметить это нелегко: власти явно выбрали стратегию «тихого» голосования, в котором поучаствуют только подневольные бюджетники и пенсионеры. Всем остальным эти выборы должны быть неинтересны. Нам не нравится такое засушивание политики, поэтому мы сделали тест с интересными фактами о выборах в Госдуму. А поскольку наше издание — про цифровое, то и в тесте у нас — любопытные цифры думской кампании 2021.

Компьютерное зрение учится выявлять аутизм

Разработан прототип приложения для обнаружения ключевого симптома аутизма у детей

Цифровая любовь: как работает тиндер

Как алгоритмы дейтинговых платформ подбирают партнеров, почему «‎мэтчи» не всегда идеальны и заменят ли приложения знакомства вживую? «‎Системный Блокъ» разобрался в любовных делах цифровой эпохи, изучил подводные камни и попросил комментарий психолога

Компьютер учит срамоту

Как обучить нейросеть генерировать жёлтые тексты в духе самых трешовых баннеров? Наш автор Иван Торубаров погрузился в глубины кликбейта и спешит поделиться с вами тем, что он там нашел

«Да что они понимают»: как младенцы учатся говорить

В младенчестве нам предстояло выучить незнакомый язык на основе речи вокруг себя. Как мы осваивали язык и отделяли слова друг от друга? Рассказываем о речевых подсказках для младенцев и о том, как мы прибегали к статистике уже в 7 месяцев

Нейросеть определяет богатые районы по снимкам из космоса

Алгоритм глубокого обучения по спутниковым снимкам проанализировал уровень жизни в отдельных географических регионах

Одежда все чувствует

Ученые разработали «умную» ткань для отслеживания самочувствия

Визуализация геоданных подтвердила утечку персональной информации

Визуализация геоданных подтвердила утечку персональной информации.

«Кладмен мудак»: анализ тональности отзывов о запрещенных веществах

Язык интернета имеет свои характерные черты. И если исследованию языка Рунета посвящено множество работ, то DarkNet все еще остается серым пятном в этом плане. С помощью анализа тональности текстов выясняем, какая лексика характерна для отзывов о запрещенных веществах.

Веселое Рождество для великой княжны: как поздравляли друг друга в старых открытках

Наш проект по оцифровке открыток «Пишу тебе» продолжает исследовать свою постоянно растущую коллекцию. На этот раз мы изучили поздравительные открытки, написанные как до, так и после революции. Некоторые популярные поздравления сегодня выглядят неожиданно, хотя раньше были распространены повсеместно.

«Так много любовалась морем, что две ночи почти не спала…»: проект «Пишу тебе» провел первую лабораторию расшифровки почтовых открыток.

Именно с такими впечатлениями от посещения Крыма и черноморского побережья пришлось столкнуться участникам первого занятия лаборатории по расшифровке почтовых открыток от проекта «Пишу тебе». Рассказываем, как прошла лаборатория и что мы планируем дальше

ИИ по классике: компьютер досочинил Десятую симфонию Бетховена

Людвиг ван Бетховен создал девять симфоний, а еще он успел набросать несколько заметок и к симфонии № 10. Рассказываем, как ученые с помощью ИИ закончили это произведение «в стиле Бетховена».

язык произведений русской литературы

Опознаете ли вы Пушкина из параллельного мира: тест по векторной литературе

Сможем ли мы отличить «Мастера и Маргариту» от «12 стульев»? Скорее всего, не ошибемся. А что если заменить некоторые слова из оригинальных произведений на близкие по значению с помощью векторной модели на базе word2vec? Предлагаем вам пройти наш тест и проверить, насколько хорошо получится опознать классические тексты, если некоторые слова в них будут модифицированы.

DraCor и Programmable Corpora: корпуса для цифровых гуманитариев

Разбираемся, как работает DraCor — программируемый корпус текстов на 11-ти языках, с помощью которого можно прочитать пьесу, наглядно рассмотреть отношения между персонажами и даже поиграть в карточную игру

Подборка летних открыток дореволюционного и советского времени

Уже минула середина лета, кто-то еще только в предвкушении отпуска, а кто-то возвращается из поездок, путешествий, приключений. Такие моменты хочется разделять с близкими людьми. В дореволюционное и советское время популярным способом поделиться впечатлениями из поездки было отправление почтовых открыток с изображением городских достопримечательностей. Проект «Пишу тебе» сделал подборку летних почтовых открыток, где люди рассказывают об отдыхе и путешествиях.

История про людей: как устроены просопографические базы данных

Для исторической науки важны не только битвы, революции, переселения народов, смены экономических укладов и политических режимов. Важно еще понимать, кем были все те люди, чьими руками и умами велись сражения и торговля, совершались великие географические открытия, создавались новые государства, в общем — творилась история. Рассказываем о просопографии и просопографических базах данных

Twitter упростил исследователям доступ к данным

Новый Twitter API помогает получить доступ к истории публичных бесед

Как работает GPT-3 — самая продвинутая языковая модель

GPT-3 — самая известная из современных нейросетевых моделей языка. Вокруг нее много мифов, но модель действительно умеет впечатлить. Она отлично справляется с написанием целых эссе на заданную тему, удачно отвечает на вопросы, а также пишет стихи и программный код. Рассказываем, как работает GPT-3.

К звездам — через древний системный блок

Расшифрован механизм работы древнего «компьютера» обнаруженного в 1901 году на дне Эгейского моря

BERT модель

UniLM — языковая модель для тех, кому мало BERT

Сегодня каждая большая IT-корпорация пытается сделать «еще более умную» нейросетевую языковую модель, которая решала бы сразу множество задач: и ответы на вопросы, и порождение правдоподобного текста по заданной теме, и краткий пересказ. Мы уже писали о BERT от Google и семействе GPT от OpenAI — настал черед UniLM от Microsoft

В Китае создали квантовый компьютер на фотонах

Квантовые компьютеры за секунды справляются с задачами, на которые у обычных компьютеров ушли бы миллиарды лет. Создать полностью работающий квантовый компьютер пока не удалось, но теперь в битву за квантовое превосходство вступает Китай

управление жестами

Культурные жесты: американцы и китайцы свайпают по-разному

Выбор жестов для управления бесконтактными интерфейсами зависит от происхождения пользователей, выяснили исследователи из Государственного колледжа информационных наук и технологий Пенсильвании

Что общего между переписью населения и жаккардовой тканью?

Материал о том, как Розелла Бискотти с помощью ткани и ячеек разных цветов и узоров визуализировала данные о жителях родного города.

Преступления и наказания: что показывает статистика судов и приговоров в России

Правозащитный проект ОВД-Инфо запустил сервис анализа и визуализации открытых данных по статистике судебных решений по уголовным делам в России. «Системный Блокъ» разбирается с тем, как сервис становится проводником диалога судебной власти и общества, и зачем это нужно

«Это имитация интеллекта»: Константин Воронцов — о настоящем и будущем машинного обучения

Сможет ли человечество построить искусственный интеллект, не уступающий человеческому, и надо ли его строить? «Системный Блокъ» обсудил это с Константином Воронцовым, одним из известнейших специалистов по машинному обучению в России. Публикуем его ответы на наши вопросы

Храпящие мини-пиги помогут победить апноэ

Анализ дыхательного потока свиней помог ученым прийти к пониманию, что происходит в организме во время эпизодов приостановки дыхания во сне

открытка

«Желаю быть паинькой»: как поздравляли с днем рождения в дореволюционных открытках

Сегодня Системный Блокъ отмечает свой третий день рождения. День рождения - очень добрый праздник. В этот день именинник получает приятные пожелания от близких людей. И никакие расстояния не помеха чтобы сказать теплые слова дорогому человеку. Сейчас нам не составит труда позвонить имениннику или отправить ему пожелания в мессенджере. А в начале XX века единственным способом поздравить на расстоянии человека было отправление почтовых открыток или писем.

Тест: Знаете ли вы различия между мужской и женской речью

Женщины и мужчины спорят о равенстве или превосходстве и никак не могут прийти к соглашению. Что если дело в том, что они просто говорят на разных языках? Такой вывод напрашивается после прочтения исследований о зависимости речи от гендера. По мотивам этих исследований мы создали небольшой тест, чтобы проверить, настолько ли заметна разница в коммуникации мужчин и женщин.

зарплаты учителей в россии

«Марь Иванна, у вас воротничок сине́ет»: исследование СБъ о зарплатах учителей

Сегодня в России более 1,3 млн учителей средних школ. «Системный Блокъ» решил узнать, насколько учитель средней школы в России подходит под критерий среднего класса. Говоря геймерским языком: насколько трудно «проходить Россию» на уровне сложности «medium teacher»

«Орнамика»: цифровой архив узоров и вдохновение для дизайнера

Рассматривая расписную тарелку дома у бабушки, мало кто задумывается, что декоративно-прикладное искусство — важная часть визуальной культуры. А еще старинные орнаменты отлично вдохновляют современных дизайнеров. Рассказываем про проект «Орнамика», собирающий узоры в цифровом формате

Байкал

Нейросеть проследит за чистотой Байкала

Российские ученые начали разработку нейросетевого алгоритма для мониторинга экосистемы озера Байкал. Он будет делать анализ проб воды, автоматически распознавать и классифицировать живущие в ней микроорганизмы. Раньше это делалось вручную.

Большие данные против инфаркта и диабета

С помощью больших данных жизнь человека можно представить ​​как траекторию качественных или количественных характеристик в многомерном пространстве. Одновременный анализ таких траекторий помог разработать персонализированный подход в терапии диабета и инфаркта миокарда

Привет с фронта: военные открытки

80 лет назад, 22 июня 1941 года, началась Великая Отечественная война. В военное время было особенно важно сообщить вести о себе своим близким, друзьям, знакомым. Проект «Пишу тебе» отобрал фронтовые открытки, посвященные тем временам. Эти открытки наполнены любовью, заботой и надеждой на встречу с родными

Арт-площадка для программистов

Dwitter – платформа, на которой программисты соревнуются в создании графики и анимации с помощью кода, длина которого не более 140 символов

Нейросеть предсказывает новые химические реакции

Группа ученых из Страсбурга, Казани и Саппоро разработала нейросеть для поиска новых химических реакций, что привело к ощутимому прогрессу в области органической химии

Люди не смогут управлять сверхразумными машинами

Эксперимент показал, что остановить искусственный интеллект со сверхчеловеческими способностями может оказаться слишком сложно

Нейросети обошли человека в понимании текста

Языковые модели от Google и Microsoft — T5 + Meena и DeBERTa — показали себя лучше человека в тесте SuperGLUE, который проверяет понимание и логику текста на английском языке

Transkribus: как компьютерное зрение помогает переводить тексты сирийских мистиков

Сколько ваших знакомых без проблем смогут прочитать рукописи Пушкина? А петровскую скоропись? А рецепт своего лечащего врача? Чтобы разобрать написанное, часто нужен натренированный глаз. Добиться этого можно двумя способами: мы можем тренировать собственное зрение, а можем — компьютерное. Как и зачем тренируют модели распознавания рукописного текста — рассказывают исследовательницы классической сирийской литературы Юлия Фурман и Анна Черкашина

Как видят мир беспилотники и почему «обучение с учителем» сломано. Расшифровка подкаста с Борисом Янгелем

Эта страничка — дополнение к XI выпуску подкаста «Неопознанный Искусственный Интеллект». В этом выпуске мы общались с Борисом Янгелем из команды разработки беспилотных автомобилей в Яндексе. Здесь вы найдете полную расшифровку, оглавление выпуска и полезные ссылки

Как устроена нейросеть BERT от Google

BERT — нейросетевая модель-трансформер от Google, на которой сегодня строится большинство инструментов автоматической обработки языка. Модель появилась в начале 2018-го, а уже в октябре того же года Google встроил модель в свой поисковик. Разбираемся, что же представляет из себя модель BERT и как она работает

Нейросети оживили старые фото

Алгоритм добавляет движения и мимику на снимки давно умерших людей

Безработица, отчаяние и смерть: что стоит за эпидемией безысходности

Согласно данным проекта Periscopic, на 2021 год приходится пик так называемых «смертей от отчаяния» - преждевременных смертей американцев без высшего образования. Разбираемся, почему каждый год умирает все больше белых жителей США средних лет и как с этим связан русский алкоголизм

документы ВОВ

Что можно найти в цифровом архиве «Документы Победы»

Цифровой архив «Документы Победы» хранит свидетельства о том, как управлялись войска, оборонная промышленность и прочие отрасли хозяйства во время Великой Отечественной войны.

Рыбий жир полнит: о чем писали дети в открытках

1 июня — международный день защиты детей. К этому дню проект «Пишу тебе» собрал подборку старых открыток, написанных детьми. Юные авторы открыток рассказывают родителям о понравившихся игрушках, школьных отметках и последствиях употребления рыбьего жира.

«Нравственное право» и «немеркнущая правда»: как речи президентов на 9 мая влияют на коллективную память

Мы проанализировали все речи президентов, которые произносились в честь 9 мая с 2000 года. О том, как эти выступления влияют на нашу коллективную память и помогают легитимировать власть, читайте в исследовании СБъ

3D-моделирование разоблачило убийц Андрея Боголюбского

Ученые НИУ ВШЭ и РАН при помощи 3D-модели прочитали текст XII века на стене собора. В надписи перечисляются убийцы князя Андрея Боголюбского

Генеративное искусство: от калейдоскопа до машинного обучения

Со временем машины получают все больше способностей. Одной из них стало творчество. Произведения искусства, созданные автономными механизмами, существовали еще несколько веков назад, но расцвет этого вида творчества происходит в наши дни благодаря развитию технологий. Рассказываем о прошлом, будущем и настоящем генеративного искусства

«Алиса, ты секси»: гендер, харассмент и голосовые помощники

Развитие технологий порождает новые этические проблемы. Например, голосовые помощники могут отражать и укреплять гендерные стереотипы. Мы проверили это, протестировав реакцию российских голосовых ассистентов «Алису» и «Маруси» на флирт, вопросы о гендере и оскорбления.

RhymeTagger: создан инструмент для автоматической разметки рифмы

Чешский цифровой стиховед Петр Плехач разработал и опубликовал библиотеку Python под названием rhymetagger, которая предназначена для поиска рифмы в стихотворениях. Разработанный алгоритм протестировали на текстах на английском, французском и чешском языках

Правосудие на ладони: открытые данные о судах и приговорах в России

Проект «Достоевский» от ОВД-Инфо – открытые данные об уголовных делах в России с 2009 года на одной бесплатной платформе

Программирование для филологов и нейропоэзия: интервью с Борисом Ореховым

Для чего филологу учиться программировать? Зачем учить нейросети писать стихи? Как мы опираемся на корпусные методы исследования языка в повседневной жизни, даже не замечая этого? Системный Блокъ поговорил с цифровым филологом Борисом Ореховым — доцентом школы лингвистики НИУ ВШЭ и постоянным ведущим нашей рубрики «Нейростихи».

Голова в раме: VR-фильмы по мотивам известных картин

Продолжая осваивать виртуальную реальность как медиум, режиссеры и художники создают 360° VR-фильмы по мотивам шедевров мировой живописи. С изображений «снимают рамы» и превращают картины в трехмерные миры, доступные через VR-шлем или очки. Рассказываем, как оживают герои с картин, как меняется восприятие живописи и какую роль здесь играет зритель.

Для чего еще нужны маски: карта загрязнения воздуха

После 2020 мы все усвоили, что вирусные заболевания очень хорошо распространяются воздушно-капельным путем. Но какой еще невидимый глазом враг может таиться в воздухе?

Взгляд в «черный ящик» искусственного интеллекта

Ученые исследуют внутренности нейронных сетей через аналогию со зрением