InstructGPT

GPT-3, которая обучена понимать и исполнять текстовые запросы

01.01.2022

Год выпуска: 2022

Описание

Модификация GPT-3, обученная генерировать ответы, которые соответствуют запросам пользователя. Модель также генерирует меньше токсичного и неправдивого контента. Улучшения были достигнуты с помощью метода RLHF (Reinforcement from Learning Human Feedback), который позволяет учитывать человеческую оценку ответов модели при её обучении

Оригинальная статья

Примеры использования:

Основа для решения большинства задач автоматической обработки языка

Чат-бот

Нововведения

Ответы модели более согласованы с запросом пользователя. Модель выдаёт меньше токсичного и неправдивого контента

Количество параметров: 175B

Автор: Системный Блокъ

Теги:GPT, LM, NLP, OpenAI, RLHF, Transformer

Next ChatGPT »

Previous « «Системный Блокъ»: лучшее за 2021 год

Tags: GPTLMNLPOpenAIRLHFTransformer

01.01.2022

Жесткая регуляция LLM в США, ИИ полностью прочитал обугленный свиток

США усилили контроль над лидирующими ИИ моделями, ученые смогли полностью прочитать античный свиток, не разворачивая его — что произошло в…

06.07.2026

От ИИ-агентов до малых языков: куда движется NLP в 2026 году

Агенты, которые самостоятельно планируют свои действия и пользуются внешними инструментами. Модели, способные работать с миллионами токенов. Системы, которые помогают сохранять…

02.07.2026

Новости

Национальный корпус русского языка вырос в шесть раз

Теперь в него входят тексты ВКонтакте — почти 11,3 млрд слов из соцсетей

30.06.2026

InstructGPT

Recent Posts

Жесткая регуляция LLM в США, ИИ полностью прочитал обугленный свиток

От ИИ-агентов до малых языков: куда движется NLP в 2026 году

Национальный корпус русского языка вырос в шесть раз