Читать нас в Telegram

Цифровая любовь: как работает тиндер

Как алгоритмы дейтинговых платформ подбирают партнеров, почему «‎мэтчи» не всегда идеальны и заменят ли приложения знакомства вживую? «‎Системный Блокъ» разобрался в любовных делах цифровой эпохи, изучил подводные камни и попросил комментарий психолога

Почем голосование и сколько самовыдвиженцев прорвалось: тест к выборам в Госдуму

17–19 сентября пройдут выборы в Государственную Думу. Однако заметить это нелегко: власти явно выбрали стратегию «тихого» голосования, в котором поучаствуют только подневольные бюджетники и пенсионеры. Всем остальным эти выборы должны быть неинтересны. Нам не нравится такое засушивание политики, поэтому мы сделали тест с интересными фактами о выборах в Госдуму. А поскольку наше издание — про цифровое, то и в тесте у нас — любопытные цифры думской кампании 2021.

Компьютерное зрение учится выявлять аутизм

Разработан прототип приложения для обнаружения ключевого симптома аутизма у детей

Компьютер учит срамоту

Как обучить нейросеть генерировать жёлтые тексты в духе самых трешовых баннеров? Наш автор Иван Торубаров погрузился в глубины кликбейта и спешит поделиться с вами тем, что он там нашел

«Да что они понимают»: как младенцы учатся говорить

В младенчестве нам предстояло выучить незнакомый язык на основе речи вокруг себя. Как мы осваивали язык и отделяли слова друг от друга? Рассказываем о речевых подсказках для младенцев и о том, как мы прибегали к статистике уже в 7 месяцев

Нейросеть определяет богатые районы по снимкам из космоса

Алгоритм глубокого обучения по спутниковым снимкам проанализировал уровень жизни в отдельных географических регионах

Одежда все чувствует

Ученые разработали «умную» ткань для отслеживания самочувствия

Визуализация геоданных подтвердила утечку персональной информации

Визуализация геоданных подтвердила утечку персональной информации.

«Кладмен мудак»: анализ тональности отзывов о запрещенных веществах

Язык интернета имеет свои характерные черты. И если исследованию языка Рунета посвящено множество работ, то DarkNet все еще остается серым пятном в этом плане. С помощью анализа тональности текстов выясняем, какая лексика характерна для отзывов о запрещенных веществах.

Веселое Рождество для великой княжны: как поздравляли друг друга в старых открытках

Наш проект по оцифровке открыток «Пишу тебе» продолжает исследовать свою постоянно растущую коллекцию. На этот раз мы изучили поздравительные открытки, написанные как до, так и после революции. Некоторые популярные поздравления сегодня выглядят неожиданно, хотя раньше были распространены повсеместно.

«Так много любовалась морем, что две ночи почти не спала…»: проект «Пишу тебе» провел первую лабораторию расшифровки почтовых открыток.

Именно с такими впечатлениями от посещения Крыма и черноморского побережья пришлось столкнуться участникам первого занятия лаборатории по расшифровке почтовых открыток от проекта «Пишу тебе». Рассказываем, как прошла лаборатория и что мы планируем дальше

ИИ по классике: компьютер досочинил Десятую симфонию Бетховена

Людвиг ван Бетховен создал девять симфоний, а еще он успел набросать несколько заметок и к симфонии № 10. Рассказываем, как ученые с помощью ИИ закончили это произведение «в стиле Бетховена».

язык произведений русской литературы

Опознаете ли вы Пушкина из параллельного мира: тест по векторной литературе

Сможем ли мы отличить «Мастера и Маргариту» от «12 стульев»? Скорее всего, не ошибемся. А что если заменить некоторые слова из оригинальных произведений на близкие по значению с помощью векторной модели на базе word2vec? Предлагаем вам пройти наш тест и проверить, насколько хорошо получится опознать классические тексты, если некоторые слова в них будут модифицированы.

DraCor и Programmable Corpora: корпуса для цифровых гуманитариев

Разбираемся, как работает DraCor — программируемый корпус текстов на 11-ти языках, с помощью которого можно прочитать пьесу, наглядно рассмотреть отношения между персонажами и даже поиграть в карточную игру

Подборка летних открыток дореволюционного и советского времени

Уже минула середина лета, кто-то еще только в предвкушении отпуска, а кто-то возвращается из поездок, путешествий, приключений. Такие моменты хочется разделять с близкими людьми. В дореволюционное и советское время популярным способом поделиться впечатлениями из поездки было отправление почтовых открыток с изображением городских достопримечательностей. Проект «Пишу тебе» сделал подборку летних почтовых открыток, где люди рассказывают об отдыхе и путешествиях.

История про людей: как устроены просопографические базы данных

Для исторической науки важны не только битвы, революции, переселения народов, смены экономических укладов и политических режимов. Важно еще понимать, кем были все те люди, чьими руками и умами велись сражения и торговля, совершались великие географические открытия, создавались новые государства, в общем — творилась история. Рассказываем о просопографии и просопографических базах данных

Twitter упростил исследователям доступ к данным

Новый Twitter API помогает получить доступ к истории публичных бесед

Как работает GPT-3 — самая продвинутая языковая модель

GPT-3 — самая известная из современных нейросетевых моделей языка. Вокруг нее много мифов, но модель действительно умеет впечатлить. Она отлично справляется с написанием целых эссе на заданную тему, удачно отвечает на вопросы, а также пишет стихи и программный код. Рассказываем, как работает GPT-3.

К звездам — через древний системный блок

Расшифрован механизм работы древнего «компьютера» обнаруженного в 1901 году на дне Эгейского моря

BERT модель

UniLM — языковая модель для тех, кому мало BERT

Сегодня каждая большая IT-корпорация пытается сделать «еще более умную» нейросетевую языковую модель, которая решала бы сразу множество задач: и ответы на вопросы, и порождение правдоподобного текста по заданной теме, и краткий пересказ. Мы уже писали о BERT от Google и семействе GPT от OpenAI — настал черед UniLM от Microsoft

В Китае создали квантовый компьютер на фотонах

Квантовые компьютеры за секунды справляются с задачами, на которые у обычных компьютеров ушли бы миллиарды лет. Создать полностью работающий квантовый компьютер пока не удалось, но теперь в битву за квантовое превосходство вступает Китай

управление жестами

Культурные жесты: американцы и китайцы свайпают по-разному

Выбор жестов для управления бесконтактными интерфейсами зависит от происхождения пользователей, выяснили исследователи из Государственного колледжа информационных наук и технологий Пенсильвании

Что общего между переписью населения и жаккардовой тканью?

Материал о том, как Розелла Бискотти с помощью ткани и ячеек разных цветов и узоров визуализировала данные о жителях родного города.

Преступления и наказания: что показывает статистика судов и приговоров в России

Правозащитный проект ОВД-Инфо запустил сервис анализа и визуализации открытых данных по статистике судебных решений по уголовным делам в России. «Системный Блокъ» разбирается с тем, как сервис становится проводником диалога судебной власти и общества, и зачем это нужно

«Это имитация интеллекта»: Константин Воронцов — о настоящем и будущем машинного обучения

Сможет ли человечество построить искусственный интеллект, не уступающий человеческому, и надо ли его строить? «Системный Блокъ» обсудил это с Константином Воронцовым, одним из известнейших специалистов по машинному обучению в России. Публикуем его ответы на наши вопросы

Храпящие мини-пиги помогут победить апноэ

Анализ дыхательного потока свиней помог ученым прийти к пониманию, что происходит в организме во время эпизодов приостановки дыхания во сне

открытка

«Желаю быть паинькой»: как поздравляли с днем рождения в дореволюционных открытках

Сегодня Системный Блокъ отмечает свой третий день рождения. День рождения - очень добрый праздник. В этот день именинник получает приятные пожелания от близких людей. И никакие расстояния не помеха чтобы сказать теплые слова дорогому человеку. Сейчас нам не составит труда позвонить имениннику или отправить ему пожелания в мессенджере. А в начале XX века единственным способом поздравить на расстоянии человека было отправление почтовых открыток или писем.

Тест: Знаете ли вы различия между мужской и женской речью

Женщины и мужчины спорят о равенстве или превосходстве и никак не могут прийти к соглашению. Что если дело в том, что они просто говорят на разных языках? Такой вывод напрашивается после прочтения исследований о зависимости речи от гендера. По мотивам этих исследований мы создали небольшой тест, чтобы проверить, настолько ли заметна разница в коммуникации мужчин и женщин.

зарплаты учителей в россии

«Марь Иванна, у вас воротничок сине́ет»: исследование СБъ о зарплатах учителей

Сегодня в России более 1,3 млн учителей средних школ. «Системный Блокъ» решил узнать, насколько учитель средней школы в России подходит под критерий среднего класса. Говоря геймерским языком: насколько трудно «проходить Россию» на уровне сложности «medium teacher»

«Орнамика»: цифровой архив узоров и вдохновение для дизайнера

Рассматривая расписную тарелку дома у бабушки, мало кто задумывается, что декоративно-прикладное искусство — важная часть визуальной культуры. А еще старинные орнаменты отлично вдохновляют современных дизайнеров. Рассказываем про проект «Орнамика», собирающий узоры в цифровом формате

Байкал

Нейросеть проследит за чистотой Байкала

Российские ученые начали разработку нейросетевого алгоритма для мониторинга экосистемы озера Байкал. Он будет делать анализ проб воды, автоматически распознавать и классифицировать живущие в ней микроорганизмы. Раньше это делалось вручную.

Большие данные против инфаркта и диабета

С помощью больших данных жизнь человека можно представить ​​как траекторию качественных или количественных характеристик в многомерном пространстве. Одновременный анализ таких траекторий помог разработать персонализированный подход в терапии диабета и инфаркта миокарда

Привет с фронта: военные открытки

80 лет назад, 22 июня 1941 года, началась Великая Отечественная война. В военное время было особенно важно сообщить вести о себе своим близким, друзьям, знакомым. Проект «Пишу тебе» отобрал фронтовые открытки, посвященные тем временам. Эти открытки наполнены любовью, заботой и надеждой на встречу с родными

Арт-площадка для программистов

Dwitter – платформа, на которой программисты соревнуются в создании графики и анимации с помощью кода, длина которого не более 140 символов

Нейросеть предсказывает новые химические реакции

Группа ученых из Страсбурга, Казани и Саппоро разработала нейросеть для поиска новых химических реакций, что привело к ощутимому прогрессу в области органической химии

Люди не смогут управлять сверхразумными машинами

Эксперимент показал, что остановить искусственный интеллект со сверхчеловеческими способностями может оказаться слишком сложно

Нейросети обошли человека в понимании текста

Языковые модели от Google и Microsoft — T5 + Meena и DeBERTa — показали себя лучше человека в тесте SuperGLUE, который проверяет понимание и логику текста на английском языке

Transkribus: как компьютерное зрение помогает переводить тексты сирийских мистиков

Сколько ваших знакомых без проблем смогут прочитать рукописи Пушкина? А петровскую скоропись? А рецепт своего лечащего врача? Чтобы разобрать написанное, часто нужен натренированный глаз. Добиться этого можно двумя способами: мы можем тренировать собственное зрение, а можем — компьютерное. Как и зачем тренируют модели распознавания рукописного текста — рассказывают исследовательницы классической сирийской литературы Юлия Фурман и Анна Черкашина

Как видят мир беспилотники и почему «обучение с учителем» сломано. Расшифровка подкаста с Борисом Янгелем

Эта страничка — дополнение к XI выпуску подкаста «Неопознанный Искусственный Интеллект». В этом выпуске мы общались с Борисом Янгелем из команды разработки беспилотных автомобилей в Яндексе. Здесь вы найдете полную расшифровку, оглавление выпуска и полезные ссылки

Как устроена нейросеть BERT от Google

BERT — нейросетевая модель-трансформер от Google, на которой сегодня строится большинство инструментов автоматической обработки языка. Модель появилась в начале 2018-го, а уже в октябре того же года Google встроил модель в свой поисковик. Разбираемся, что же представляет из себя модель BERT и как она работает

Нейросети оживили старые фото

Алгоритм добавляет движения и мимику на снимки давно умерших людей

Безработица, отчаяние и смерть: что стоит за эпидемией безысходности

Согласно данным проекта Periscopic, на 2021 год приходится пик так называемых «смертей от отчаяния» - преждевременных смертей американцев без высшего образования. Разбираемся, почему каждый год умирает все больше белых жителей США средних лет и как с этим связан русский алкоголизм

документы ВОВ

Что можно найти в цифровом архиве «Документы Победы»

Цифровой архив «Документы Победы» хранит свидетельства о том, как управлялись войска, оборонная промышленность и прочие отрасли хозяйства во время Великой Отечественной войны.

Рыбий жир полнит: о чем писали дети в открытках

1 июня — международный день защиты детей. К этому дню проект «Пишу тебе» собрал подборку старых открыток, написанных детьми. Юные авторы открыток рассказывают родителям о понравившихся игрушках, школьных отметках и последствиях употребления рыбьего жира.

«Нравственное право» и «немеркнущая правда»: как речи президентов на 9 мая влияют на коллективную память

Мы проанализировали все речи президентов, которые произносились в честь 9 мая с 2000 года. О том, как эти выступления влияют на нашу коллективную память и помогают легитимировать власть, читайте в исследовании СБъ

3D-моделирование разоблачило убийц Андрея Боголюбского

Ученые НИУ ВШЭ и РАН при помощи 3D-модели прочитали текст XII века на стене собора. В надписи перечисляются убийцы князя Андрея Боголюбского

Генеративное искусство: от калейдоскопа до машинного обучения

Со временем машины получают все больше способностей. Одной из них стало творчество. Произведения искусства, созданные автономными механизмами, существовали еще несколько веков назад, но расцвет этого вида творчества происходит в наши дни благодаря развитию технологий. Рассказываем о прошлом, будущем и настоящем генеративного искусства

«Алиса, ты секси»: гендер, харассмент и голосовые помощники

Развитие технологий порождает новые этические проблемы. Например, голосовые помощники могут отражать и укреплять гендерные стереотипы. Мы проверили это, протестировав реакцию российских голосовых ассистентов «Алису» и «Маруси» на флирт, вопросы о гендере и оскорбления.

RhymeTagger: создан инструмент для автоматической разметки рифмы

Чешский цифровой стиховед Петр Плехач разработал и опубликовал библиотеку Python под названием rhymetagger, которая предназначена для поиска рифмы в стихотворениях. Разработанный алгоритм протестировали на текстах на английском, французском и чешском языках

Правосудие на ладони: открытые данные о судах и приговорах в России

Проект «Достоевский» от ОВД-Инфо – открытые данные об уголовных делах в России с 2009 года на одной бесплатной платформе

Программирование для филологов и нейропоэзия: интервью с Борисом Ореховым

Для чего филологу учиться программировать? Зачем учить нейросети писать стихи? Как мы опираемся на корпусные методы исследования языка в повседневной жизни, даже не замечая этого? Системный Блокъ поговорил с цифровым филологом Борисом Ореховым — доцентом школы лингвистики НИУ ВШЭ и постоянным ведущим нашей рубрики «Нейростихи».

Голова в раме: VR-фильмы по мотивам известных картин

Продолжая осваивать виртуальную реальность как медиум, режиссеры и художники создают 360° VR-фильмы по мотивам шедевров мировой живописи. С изображений «снимают рамы» и превращают картины в трехмерные миры, доступные через VR-шлем или очки. Рассказываем, как оживают герои с картин, как меняется восприятие живописи и какую роль здесь играет зритель.

Для чего еще нужны маски: карта загрязнения воздуха

После 2020 мы все усвоили, что вирусные заболевания очень хорошо распространяются воздушно-капельным путем. Но какой еще невидимый глазом враг может таиться в воздухе?

Взгляд в «черный ящик» искусственного интеллекта

Ученые исследуют внутренности нейронных сетей через аналогию со зрением

Виден ли конец «нейронного блицкрига»: компьютерные лингвисты между вычислениями и теорией. Расшифровка подкаста с Денисом Кирьяновым

Публикуем материалы к восьмому выпуску подкаста «Неопознанный Искусственный Интеллект»: текст расшифровки выпуска, оглавление, полезные ссылки и термины.

Стэнфорд научит белых воротничков сосуществовать с нейросетями

Внедрение искусственного интеллекта обернулось проблемой для сотрудников компаний. Но ученые знают решение: они открыли лабораторию социальных взаимодействий… с роботами!

Экономия и лень: как мозг заставляет нас ошибаться

Нейролингвисты из Вышки исследовали, насколько легко обмануть мозг с помощью текстовых уловок. Спойлер: очень легко

Подборка интерактивных карт по истории

Крутим глобус времен динозавров, запускаем навигатор по античным дорогам и созерцаем, как менялся мир под воздействием человека в последние тысячелетия

Пообедать у Канта: калининградские ученые воссоздают дом философа в 3D

К грядущему 300-летию одного из самых цитируемых философов мира специалисты из Центра социально-гуманитарной информатики Балтийского федерального университета реконструируют дом своего земляка в Кёнигсберге XVIII в. Виртуальная реконструкция ведется на основе письменных источников, а также единичных старых фотографий и картин

разница между текстами

А автор кто? Рассудит дельта Бёрроуза

Как найти сходства между текстами, определить авторство и проследить за эволюцией письма? Рассказываем об одном из самых применяемых методов вычисления стилистической близости – дельте Бёрроуза

Из-за пандемии музей Виктории и Альберта может остаться без «Театра и Перформанса»

Театральная и перформативная коллекции в Музее Виктории и Альберта представлены как самостоятельный отдел. Он хранит уникальные артефакты: от сборников времен Шекспира до плакатов Sex Pistols. В пандемию доходы музея сильно упали, поэтому отдел хотят закрыть. Даже государственная поддержка не может компенсировать колоссальные убытки музея