Год выпуска: 2023
Описание
Семейство языковых моделей от Meta (Large Language Model Meta AI). При гораздо меньшем количестве параметров LLaMa по качеству решения большинства NLP задач сопоставима с куда более большими моделями вроде GPT-3, PaLM. Этого удалось достичь за счёт более тщательной и продолжительной процедуры обучения. Модель также более открыта относительно конкурентов – доступ к весам можно получить, если заполнить форму (допускается только некоммерческое использование). Вскоре после выхода модели она была нелегально опубликована на торрент-трекеры.
Примеры использования:
- Основа для решения большинства задач автоматической обработки языка
- Чат-бот
Нововведения
- По соотношению размер-качество LLaMa значительно превосходит GPT и PaLM
- Модель доступна всем желающим для некоммерческого использования
Количество параметров: 7B-65B