Год выпуска: 2022
Описание
Модификация GPT-3, обученная генерировать ответы, которые соответствуют запросам пользователя. Модель также генерирует меньше токсичного и неправдивого контента. Улучшения были достигнуты с помощью метода RLHF (Reinforcement from Learning Human Feedback), который позволяет учитывать человеческую оценку ответов модели при её обучении
Примеры использования:
Нововведения
Ответы модели более согласованы с запросом пользователя. Модель выдаёт меньше токсичного и неправдивого контента
Количество параметров: 175B
Компания Google представила много новых ИИ-продуктов, а модель GPT опровергла известную математическую гипотезу Пала Эрдёша — рассказываем, что произошло в мире ИИ за последнее время
Facebook* и Instagram* будут сканировать фото и видео, чтобы находить детей, которые скрыли свой возраст
Можно ли заниматься NLP, если при словах «производная» и «матрица» хочется закрыть ноутбук? Да — если изучать математику не абстрактно, а через реальные задачи. Объясняем, какие разделы действительно нужны джуну,…