NLP

Как автоматически расшифровать аудио: пошаговая инструкция для Whisper

Расшифровка аудиозаписи — дело утомительное и времязатратное. К счастью, появляется всё больше сервисов, которые умеют это делать автоматически. Рассказываем, как сделать это с помощью модели Whisper от OpenAI и смотрим, насколько хорошо она справляется с русскоязычными записями

Kandinsky 2.1

Мультиязычная модель для генерации изображений по текстовому описанию

GPT-4

Четвёртое поколение генеративных языковых моделей GPТ. Модель решает задачи качественнее GPT-3, а также умеет работать с изображениями.

LLaMa

Семейство эффективных языковых моделей от Meta, доступное для некоммерческого использования всем желающим

С приветом из Англии: у мультиязычных языковых моделей обнаружился «английский акцент» 

Если вы выучили иностранный язык во взрослом возрасте, вполне вероятно, вы говорите на нем не так же бегло, как носитель языка. Оказывается, подобная проблема встречается и у мультиязычных моделей: если в обучающей выборке для них преобладает английский, текст на других языках они будут генерировать «с английским акцентом». Объясняем, почему так происходит и что можно с этим сделать.

«Размечено»: как распознавать именованные сущности в исторических дневниках

Дневники людей, живших в различных исторических эпохах, могут многое сказать исследователю, но анализировать их вручную — тяжело и долго. Разбираемся, как цифровые инструменты используются для упрощения анализа дневниковых записей.

Midjourney

Самая известная модель для генерации изображений по текстовому описанию

DALL-E 2

Улучшение модели DALL-E, генерирующей изображения по текстовому описанию

Русская классика глазами нейросети ruDALLE

Как видит русскую классику нейросеть ruDALLE? Пройдите тест и попробуйте угадать, что скрывается под изображениями

ChatGPT

GPT-3, обученная понимать и исполнять текстовые запросы и доступная всем желающим через веб сайт

InstructGPT

GPT-3, которая обучена понимать и исполнять текстовые запросы

Stable Diffusion

Одна из самых популярных открытых моделей для генерации изображений по текстовому описанию

DALL-E

Одна из первых моделей, генерирующих качественные изображения по текстовому описанию

CLIP

Мультимодальная модель, способная строить векторные представления текстов и изображений

Виден ли конец «нейронного блицкрига»: компьютерные лингвисты между вычислениями и теорией. Расшифровка подкаста с Денисом Кирьяновым

Публикуем материалы к восьмому выпуску подкаста «Неопознанный Искусственный Интеллект»: текст расшифровки выпуска, оглавление, полезные ссылки и термины.

GPT-3

Третье поколение генеративных языковых моделей GPТ. Значительно больше GPT-2, умеет решать новые задачи без обучения

Бэггинсы, Кольца и Сауроны: как научить компьютер понимать кто есть кто?

Как помочь компьютеру понять, что Гарри — волшебник, Гендальф — майар, а Джон Сноу — (СПОЙЛЕР!) одновременно Старк и Таргариен? Человек схватывает новую информацию на лету: из контекста, из интонации, из невербального общения. А как дать компьютеру такие же умения?

Как управлять мамонтом: генерируем нужные тексты с помощью моделей Plug and Play

Нейросети хорошо порождают правдоподобный текст. Но как заставить их писать на нужную тему, да еще и с нужным отношением к этой теме (положительным, нейтральным или отрицательным)? Рассказываем про решение, которое позволяет «донастраивать» языковую модель под себя

Журналисты VS роботы: неравный бой

Искусственный интеллект — друг или враг журналисту? Чтобы ответить на этот вопрос, изучаем 10 свежих AI-проектов со всего мира мира

Как начать свой путь в NLP (не путать с НЛП)

Хотите разобраться в автоматической обработке языка и стать NLP-инженером? Вам сюда

Translate-баттл: могут ли онлайн-переводчики передавать стиль текста?

«Мой мозг застрял в черепе», «He was introduced to the wells», «филиал исследований» и другие приключения онлайн-перевода

8 главных прорывов в нейросетевом NLP

Как компьютерная лингвистика подсела на нейронные сети и диплернинг, какие подходы сегодня в тренде и почему они так хороши

Что такое кросс-языковая морфология и зачем она нужна

Машинный перевод и другая компьютерно-лингвистическая магия работают тогда, когда есть много данных для обучения нейросетей. Но что делать, если язык редкий и данных почти нет? Рассказываем про хитрый способ выкрутиться с помощью лингвистики

Розовые слоны и красные деревья: цвета в языке и в реальной жизни

Компьютерная лингвистика утверждает, что слоны розового цвета. Разбираемся, как так вышло

У вас вся спина белая: как искусственный интеллект учится шутить

Шутки — дело серьезное. Исследовательница из Стенфорда Хё Хё точно это знает, потому что она разрабатывает генератор каламбуров для искусственного интеллекта и даже устраивает соревнования живых комиков и машин. Пока наши выигрывают, но Хё не собирается прекращать работать над шуточным генератором

Фасолина или яйцо? С чем сравнивают размеры вещей

Какие метафоры популярны при описании габаритов предмета, как они изменялись со временем и почему из сравнений исчезли голубиные яйца

Что не так с машинным переводом?

Так ли хороши нейросети под капотом Google.Translate? Разбор с пристрастием

Как машинный перевод оценивает… машина?

Если качество машинного перевода проверяет человек, то это долго и дорого. А если нужно быстро и дёшево?

Что в смайлике тебе моем?

🆕 семантический анализ эмодзи или как мы выучили новый язык сами того не подозревая

Машинный перевод: как это работает

Нейросети отбирают хлеб у переводчиков!

GPT-2

Второе поколение генеративных языковых моделей GPТ. Cпособна обучаться решать новые задачи на основе всего нескольких примеров

BERT

Одна из первых больших языковых моделей, использующих архитектуру Transformer

ELMo

Языковая модель, позволяющая получать векторные представления слова, учитывающие его контекст

GPT

Одна из первых больших генеративных языковых моделей с архитектурой Transformer

FastText

Модель учитывает семантику частей слов, за счёт чего лучше понимает слова с опечатками и слова не из словаря.

GloVe

Улучшение Word2Vec, которое учитывает не только локальные взаимосвязи слов, но и связи слов в рамках всего корпуса

Word2Vec

Модель, которая преобразовывает слова в числовые векторы, отражающие семантические значения и взаимосвязи слов