
Что такое мешок слов
Рассказываем, что такое мешок слов и как он может помочь в задачах автоматической обработки текста
Рассказываем, что такое мешок слов и как он может помочь в задачах автоматической обработки текста
Продолжаем разгадывать вечную тайну «Беовульфа» и рассказывать о том, как цифровые филологи строят научный диалог в поисках правды.
Мария Фаликман — доктор психологических наук, профессор департамента психологии факультета социальных наук НИУ ВШЭ, специалист в области когнитивной науки. «Системный Блокъ» расспросил Марию о том, чем занимаются когнитивные исследователи, как связаны когнитивная наука и искусственный интеллект, а также почему воспоминания со временем искажаются.
Общение с чат-ботами и голосовыми помощниками стало частью повседневного опыта. Мы спрашиваем у нейросетей о погоде и пробках, просим переводить и сочинять тексты, проверяем их способности стихосложения и иногда даже делимся сокровенными секретами. СБъ уже не раз рассказывал о работе языковых моделей, которые делают боты более человечными. Предлагаем освежить знания и прочитать материал из глоссария про наиболее крупную и продвинутую языковую модель в мире – GPT-3
Многие представляют себе искусственный интеллект по фантастике. Альтрон из «Железного человека», ВИКИ Азимова, «Мир Дикого запада» и «Апгрейд» — все это выглядит, как торжество развития технологии, способной и улучшить жизнь человечества, и положить ему конец. Правда, реальный искусственный интеллект пока далек от того, что показывают нам в фильмах и книгах. Но это не повод расстраиваться — ведь в истории ИИ были и куда более тёмные времена
В России в апреле официально зарегистрирован первый искусственный интеллект в медицине. Неужели из-за COVID? (Спойлер: нет; но к борьбе с коронавирусом его все равно привлекли)
Мы часто воспринимаем платформы для изучения языка как волшебные инструменты, с помощью которых и вправду можно выучить японский за тридцать дней. Приложения типа Lingualeo или Memrise добросовестно напоминают нам о необходимости пройти новый раздел грамматики или повторить слова, сопровождают каждый урок смешными примерами и вообще предлагают довольно широкий выбор тем — интересно будет и маленькому ребёнку, и начинающему новый язык взрослому. Но как именно организовать такой обширный материал? Давайте разберёмся на примере всем известного Duolingo
Разбираемся, как прямые трансляции похорон в Zoom и Facebook спасают ритуальную индустрию и влияют на участников церемонии
Поп-музыка — практически неограниченное пространство для исследователя. Можно попробовать изучать ее инструментами социологии, теории музыки, культурологии и еще десятка дисциплин, но самый простой способ — проверить, как меняются тексты в самом распространенном музыкальном стиле последнего столетия
Если вы учитесь на картографа и не знаете, чем заняться в жизни, не переживайте: всегда есть вероятность, что вас попросят нанести на карту пару тысяч белок. Подробнее о потенциальном рабочем месте — в этой статье
Как инструменты стилометрии помогают исследовать относительную силу стилистического отпечатка автора и переводчика в художественном тексте
Все еще пользуетесь навигатором, катаясь на машине по родному городу? Постоянно заглядываете в Google.Карты во время пеших прогулок? Альцгеймер уже идет к вам!
Разбираемся, как работает алгоритм генерации историй «Шахерезада»
В 2010 году «Оскар» за лучшую режиссуру впервые получила женщина — Кэтрин Бигелоу с фильмом «Повелитель бури». Стали ли после этого режиссеры женского пола более заметными фигурами в киноиндустрии? Редакция «Системного Блока» провела исследование, проследив динамику упоминаний женщин-режиссеров в статьях популярных киножурналов
Не так давно заговорили о том, что система нейронного машинного перевода от Google сама научилась переводить в языковых парах, для которых у неё нет параллельных корпусов. Действительно ли онлайн-переводчик изобрел собственный универсальный язык, машинную интерлингву?
Военные используют искусственный интеллект с момента его появления. Самонаводящиеся ракеты с компьютерным зрением поступили на вооружение еще в разгар Холодной войны, с начала 2000-х активно применяются беспилотные ударные дроны, обретающие все больше самостоятельности в решении вопросов жизни и смерти... Что дальше?
Как обычный «слепой тест» по отделению машинной поэзии от той, что написана людьми, приводит ученых к философскому спору об относительности понятия «человека» в искусстве
Рассказываем, что такое mystem и antconc, для чего они нужны, и как ими пользоваться
Лев Манович — о будущем соцсетей, смещении глобальных культурных центров и экспорте русского страдания
Если ты гуманитарий — не отчаивайся. Если технарь — дружи с гуманитариями!
Как стать больше, чем просто роботом-доставщиком, и научиться коммуницировать с людьми? Надо быть милым, выучить «словарь поведения» и уступать человекам дорогу
Этот материал для вас, если вы до сих пор пользуетесь пакетом Microsoft Office и носите презентации на флешке
Искусственный интеллект научился разбираться в художниках
Технология deepfake подходит не только для создания поддельного порно со знаменитостями
Писатель-призрак и писатель-робот создали «посмертную» книгу Джека Керуака
Знаменитому итальянскому собору грозит разрушение. Космическое излучение может его спасти
Не знаете, что посмотреть? Попробуйте фильм, сценарий к которому написала нейросеть!
Эта страничка — дополнение к первому выпуску подкаста «Неопознанный Искусственный Интеллект». Здесь вы найдете полную расшифровку, оглавление выпуска и полезные ссылки.
Как вы проводите время на самоизоляции? Наш урбанист Оля, например, встречается с друзьями в Zoom на кулинарных пятницах, куратор Ира ходит на британские онлайн-спектакли, а главред Даня путешествует по району до самой дальней мусорки. Во втором интервью с участниками проекта Системный Блокъ мы расскажем о том, как карантин изменил нашу жизнь, что нового мы узнали о себе и чем еще можно заняться, чтобы скрасить последние недели самоизоляции
Но не тот, о котором вы подумали. Мы расскажем не о последствиях трагической любви, которые заставляют молодых людей с разбитым сердцем сводить счеты с жизнью, а о том, как «Страдания юного Вертера» перекликаются с окружающими его текстами
Аль Пачино знают по «Крестному отцу» и «Лицу со шрамом», но в его репертуаре есть и кино, связанное с тематикой искусственного интеллекта и симуляции разума. В 2002 году Аль Пачино сыграл кинорежиссера, создавшего виртуальную актрису. В день 80-летия актера мы решили узнать, не стала ли эта фантазия реальностью в наш век дипфейков
Быть полиглотом круто не только потому, что вам будет проще заказать пиво в отпуске за границей. У многоязычного сознания есть и более глубокие внутренние преимущества. Исследования показывают, что использование нескольких языков может отсрочить старческую деменцию и болезнь Альцгеймера, помогает усваивать новые знания и лучше справляться с некоторыми когнитивными тестами. Правда, эти бонусы подтверждаются не во всех экспериментах
На самом деле нет. Но возможность стилизовать современную статью по Data Science под рукописи титана Возрождения — это круто. Спасибо сверточным нейросетям и исследователю из Вышки Борису Орехову.
Самоизоляция в Fortnite, пары по программированию в Minecraft, обитаемые 3D-модели университетов и мемы про военку в Counter-Strike: как игровая среда заменяет людям реальность в дни пандемии
Нейросети хорошо порождают правдоподобный текст. Но как заставить их писать на нужную тему, да еще и с нужным отношением к этой теме (положительным, нейтральным или отрицательным)? Рассказываем про решение, которое позволяет «донастраивать» языковую модель под себя
Сегодня, 24 февраля 2020, исполнилось бы 65 лет Стиву Джобсу — создателю Apple, эстету, скандалисту и визионеру. Джобс сделал почти невозможное: он стал глобальным технологическим революционером, не будучи технарем. Гений Джобса всегда был в области дизайна, эргономики и общей эстетики. Но оказалось, что в XXI веке именно это отличает великого производителя электроники — от заурядных и просто хороших
Стихотворные поздравления на 23 февраля — не менее одиозный жанр, чем сексистские вирши на 8 марта или слащавые стишки на День святого Валентина. «Системный Блокъ» решил исследовать этот жанр количественными методами. А в качестве бонуса мы сделали собственный генератор абсурдных поздравлений с Днем защитника Отечества. Впрочем, порожденные генератором тексты оказались не более абсурдны, чем вся атмосфера 23 февраля, превратившегося из профессионального праздника военных — в офисный «день коллег мужского пола» с нелепыми рудиментами милитаризма.
Оцифровка культурных данных — необходимая база для цифровых гуманитарных исследований. Делимся списком крупных коллекций, созданных российскими библиотеками
Когда мобильный интернет был экзотикой, а отчёты по грантам сдавали на 3,5-дюймовых дискетах... в Рунете уже были цифровые гуманитарные проекты! Рассказываем в лицах и деталях об одном из них — о параллельном корпусе переводов поэмы «Слово о полку Игореве», которая отметила 13-летие. В конце поста бонус — обзор исследований на основе корпуса
Машинное обучение и Data Science похожи на ядерную физику в начале 50-х или кибернетику в 60-е. Мечтают делать многие, понимают немногие, делают — совсем немногие. Главная преграда — математика. Рассказываем про вебинар наших партнеров из OTUS
В 2019 году наша команда спецпроектов знакомила вас с учеными, популяризаторами науки, которые применяют цифровые методы в своих гуманитарных исследованиях. А 2020-й мы решили начать со знакомства с участниками самого Системного Блока. Кто, как и почему делает этот проект — расскажем в нашем праздничном интервью
Весь 2019 год «Системный Блокъ» рассказывал, как высокие технологии становятся частью современной науки, культуры и повседневности, принося хорошее и плохое. Мы писали о последних прорывах в автоматической обработке языка и о методах борьбы с фейк ньюс, объясняли на пальцах, как работают нейросети, машинный перевод и фильтры в инстаграме, учили обкачивать VK, твиттер и HTML-страницы и делать корпусные исследования, рассказывали про статистические исследования в истории, литературе и искусстве, а еще много исследовали сами... За год в «СБъ» вышло больше 220 материалов. Предлагаем вам подборку из 12 постов, которые стоит перечитать. Можно как раз под бой курантов 🥂
Научиться программировать мечтают многие, но как выбрать подходящий курс из сотен доступных вариантов? Мы сделали обзор курсов по Python, которые проходили сами
Видеохостинг YouTube имеет локализации в 100 с лишним странах — это значит, что для них есть специальная локальная версия сайта (а то и не одна). Например, когда вы заходите в YouTube из России, вы видите меню на русском языке. Такие же меню есть не только на языках-гигантах вроде английского, испанского или китайского, но и, к примеру, на суахили, эстонском, зулусском, урду, африкаансе, узбекском... А как оценивать качество перевода всех этих кнопочек в меню и их понятность для пользователей?
...зачем в этом разбираться и почему мы волнуемся за НКРЯ
Вавилонская рыбка все ближе к вашему уху! Синхронный машинный переводчик STACL начинает выдавать перевод предложения до того, как прозвучит окончание фразы на языке оригинала. Но получится ли сравниться по качеству с человеком?
Маргарет Тэтчер, Екатерина Великая, Индира Ганди, Ангела Меркель… Вряд ли вы сможете добавить в этот список больше 5-10 имен. Женщин-политиков, которым довелось управлять государствами, совсем немного. А что происходит в парламентах и руководстве компаний? И как настроено общественное мнение по отношению к женщинам-руководителям?
Как Google Translate умножает стереотипы
Если качество машинного перевода проверяет человек, то это долго и дорого. А если нужно быстро и дёшево?
— Я угадаю это слово с трех букв! — Угадывай! Рассказываем о том, как устроены системы оптического распознавания символов (OCR)
Не можете разобрать врачебный почерк? NLP спешит на помощь!
Великий эпос Гомера рассказывает о Троянской войне — неудивительно, что к концу действия половина героев погибает
Аесова и другие: откуда и благодаря кому мы знаем, как ругались русские люди в XII веке?
Второе поколение генеративных языковых моделей GPТ. Cпособна обучаться решать новые задачи на основе всего нескольких примеров
Модель учитывает семантику частей слов, за счёт чего лучше понимает слова с опечатками и слова не из словаря.
Улучшение Word2Vec, которое учитывает не только локальные взаимосвязи слов, но и связи слов в рамках всего корпуса
Модель, которая преобразовывает слова в числовые векторы, отражающие семантические значения и взаимосвязи слов
Первая глубокая свёрточная нейронная сеть, показавшая беспрецендентые результаты в задаче распознавания изображений
Первая свёрточная нейронная сеть, совершившая революцию в области компьютерного зрения и ИИ в целом