
Кто это сказал? Разбирается Google AI
Как работает новый инструмент распознавания речи и автоматического определения говорящего
NLP — Natural Language Processing. Эта область находится на стыке традиционной лингвистики и компьютерных наук. В рубрике собраны материалы о методах обработки естественного языка и системах, созданных на основе этих методов. Здесь вы сможете узнать, что значит BERT и GPT3, а также понять как работают чат-боты, голосовые помощники и системы машинного перевода или как поисковик решает, что именно вы ищете.
Как работает новый инструмент распознавания речи и автоматического определения говорящего
Видеохостинг YouTube имеет локализации в 100 с лишним странах — это значит, что для них есть специальная локальная версия сайта (а то и не одна). Например, когда вы заходите в YouTube из России, вы видите меню на русском языке. Такие же меню есть не только на языках-гигантах вроде английского, испанского или китайского, но и, к примеру, на суахили, эстонском, зулусском, урду, африкаансе, узбекском... А как оценивать качество перевода всех этих кнопочек в меню и их понятность для пользователей?
Научпоп стремительно обзаводится почитателями по всему миру. Какие ученые хотят рассказать о своей работе больше всего, что ресурсы и паблики для этого делают и какими характеристиками обладает типичный научно-популярный текст?
Компьютерные лингвисты из Вышки, университета Тренто и университета Осло разработали vec2graph — инструмент для визуализации семантической близости слов в виде сети. Воспользоваться vec2graph может любой желающий. Рассказываем, как это работает и зачем нужно
Великое, могучее, свободное, подвижное. От праславянской акцентуации к нейросетевым программам автоматической расстановки ударений
Нейросети научились неплохо подражать человеку в написании текста. Но теперь есть симметричный ответ: системы обнаружения текста, порожденного нейросетями. Запасаемся попкорном и следим за битвой брони и снаряда в искусственном интеллекте
Авторский стиль тяжело определить формально — это целый комплекс деталей, которые заметны человеческому глазу, но могут ускользнуть от компьютера. Указать на характерный выбор слов, конструкций, моделей легко, но как рассказать алгоритму про метафоры или научить его распознавать другие тонкие материи?
Все любят котиков… особенно переводчики. Рассказываем о CAT-системах: чем и как сегодня переводят
Как подобрать духи, если не смыслишь в парфюмерии, и чем пахнет Digital Humanities
Почему «Слово о полку Игореве» не смогли бы создать инопланетяне или нейросеть, и при чем тут берестяные грамоты?
Исследователи из MIT и Google Brain объединились для создания алгоритма, который имеет шанс повторить подвиг Майкла Вентриса — он в 1950-е годы расшифровал одну из древних форм критского письма. Пока что нейросеть научилась читать угаритский, копируя типичные действия ученых-дешифровщиков
«Мой мозг застрял в черепе», «He was introduced to the wells», «филиал исследований» и другие приключения онлайн-перевода
Как компьютерная лингвистика подсела на нейронные сети и диплернинг, какие подходы сегодня в тренде и почему они так хороши
Распознавание лжи в текстах методами компьютерной лингвистики и машинного обучения – сравнительно новое направление в науке. Разбираемся, как это работает и чего ждать от этих разработок в будущем
Машинный перевод и другая компьютерно-лингвистическая магия работают тогда, когда есть много данных для обучения нейросетей. Но что делать, если язык редкий и данных почти нет? Рассказываем про хитрый способ выкрутиться с помощью лингвистики
Mr.Translator, переводчик на основе искусственного интеллекта, провально отработал на международном форуме. И это уже не первый случай, когда реальное качество системы оказалось совсем не таким, какое обещали оптимисты-разработчики. Будущее машинного перевода под угрозой?
Что сейчас происходит в нейронном машинном переводе и каково состояние дел в отрасли? Публикуем рассказ ведущего разработчика систем машинного обучения
Компьютерная лингвистика утверждает, что слоны розового цвета. Разбираемся, как так вышло
Вавилонская рыбка все ближе к вашему уху! Синхронный машинный переводчик STACL начинает выдавать перевод предложения до того, как прозвучит окончание фразы на языке оригинала. Но получится ли сравниться по качеству с человеком?
Шутки — дело серьезное. Исследовательница из Стенфорда Хё Хё точно это знает, потому что она разрабатывает генератор каламбуров для искусственного интеллекта и даже устраивает соревнования живых комиков и машин. Пока наши выигрывают, но Хё не собирается прекращать работать над шуточным генератором
Какие метафоры популярны при описании габаритов предмета, как они изменялись со временем и почему из сравнений исчезли голубиные яйца
Как Google Translate умножает стереотипы
Так ли хороши нейросети под капотом Google.Translate? Разбор с пристрастием
Если качество машинного перевода проверяет человек, то это долго и дорого. А если нужно быстро и дёшево?
Не можете разобрать врачебный почерк? NLP спешит на помощь!
Фанаты Assassin’s Creed за одну ночь помогли собрать материал для переводчика египетских иероглифов
Аесова и другие: откуда и благодаря кому мы знаем, как ругались русские люди в XII веке?
Тексты Шекспира, Мелвилла и современных хип-хоп-музыкантов сквозь призму методов лексического анализа и ранжирование рэперов по количеству уникальных слов
Визуализация, тематическое моделирование и другие методы автоматической обработки текста
Могут ли роботы сострадать? Искусственный интеллект для тяжелых эмоций и сложных ситуаций
Сейчас каждый может закадрить яндексовскую Алису — и отхватить виртуальную пощечину. Но так было не всегда
Разбираемся во внутренностях Project Debator — искусственного интеллекта от IBM, которому удалось переспорить чемпионов дебатов. Спойлер: Без помощи Аристотеля не обошлось
Как компьютеры сравнивают значения слов, и почему это бывает смешно
Скоро у тебя в смартфоне появится автоматический диагност, который первым заметит, что ты чот приуныл
Мы стали на шаг ближе к тому, чтобы заменить утомительные тесты по английскому наблюдением за тем, что делают зрачки во время чтения иностранного текста
Откуда поисковики знают, что «пожрать», «поесть» и «кафе» — это близкие вещи? Как можно научить алгоритм различать слова по смысловой близости?
Как ИИ убедил нас, что инвестиции в космос и телемедицина – это здорово
Как статистика и лингвистический анализ помогли опознать еще одно письмо знаменитого английского маньяка
Смертность от сердечно-сосудистых болезней можно предсказать с помощью лингвистического анализа сообщений в Twitter