Читать нас в Telegram
date_range

Год выпуска: 2022

assignment

Описание

Модификация GPT-3, обученная вести диалог с пользователем. Как и в случае InstructGPT, использовался метод RLHF, благодаря которому модель учится генерировать соответствующие запросу пользователя ответ. При обучении модели были использованы данные в виде диалога: люди-разметчики придумывали вопросы и детальные ответы на них.

Примеры использования:

  • Чат-бот: получение ответов на вопросы
  • Поиск информации в интернете
  • Работа с разными интернет-сервисами с помощью естественного языка

Нововведения

  • Модель стала лучше «понимать» запросы пользователя
  • Появление понятного веб-интерфейса в виде окна с чатом сделала модель доступной для рядовых пользователей

Количество параметров: Предположительно 175B