Год выпуска: 2022
Описание
Модификация GPT-3, обученная вести диалог с пользователем. Как и в случае InstructGPT, использовался метод RLHF, благодаря которому модель учится генерировать соответствующие запросу пользователя ответ. При обучении модели были использованы данные в виде диалога: люди-разметчики придумывали вопросы и детальные ответы на них.
Примеры использования:
- Чат-бот: получение ответов на вопросы
- Поиск информации в интернете
- Работа с разными интернет-сервисами с помощью естественного языка
Нововведения
- Модель стала лучше «понимать» запросы пользователя
- Появление понятного веб-интерфейса в виде окна с чатом сделала модель доступной для рядовых пользователей
Количество параметров: Предположительно 175B
Автор: Системный Блокъ