Читать нас в Telegram
date_range

Год выпуска: 2022

assignment

Описание

Модификация GPT-3, обученная генерировать ответы, которые соответствуют запросам пользователя. Модель также генерирует меньше токсичного и неправдивого контента. Улучшения были достигнуты с помощью метода RLHF (Reinforcement from Learning Human Feedback), который позволяет учитывать человеческую оценку ответов модели при её обучении



Примеры использования:

  • Основа для решения большинства задач автоматической обработки языка
  • Чат-бот

Нововведения

Ответы модели более согласованы с запросом пользователя. Модель выдаёт меньше токсичного и неправдивого контента 

Количество параметров: 175B