большие языковые модели

NLP, Лингвистика 17.09.2025

Как узнать тематический состав корпуса для обучения LLM

Датасет в машинном обучении — структурированный набор данных, который используется для тренировки моделей. Чтобы обучить большую языковую модель (LLM), датасеты должны быть крупными. Сегодня посмотрим на инструмент BunkaTopics, который позволяет исследовать их — узнавать тематическую составляющую, очищать и проверять, нет ли в данных смещения.

Яна Хлусова

Обзоры 16.09.2025

Что умеют LLM? Подборка материалов «Системного Блока» о языковых моделях

Они пересказывают тексты, находят скрытые смыслы и даже сочиняют истории. Читайте в нашей подборке, как большие языковые модели обнаруживают неожиданные параллели в произведениях, соревнуются с писателями и какие приемы помогут вам получать от них лучшие ответы.

Системный Блокъ

Как это работает 15.09.2025

Что такое рассуждающая языковая модель и как она работает

Прогресс больших языковых моделей через увеличение их размеров застопорился: их масштабирование уже почти не дает прироста качества. Выход ищут в новом подходе — рассуждающих языковых моделях. Рассказываем, как работают рассуждающие языковые модели, как они решают проблемы современных LLM и создают новые.

Михаил Ким

Филология 13.05.2025

Что это за персонаж? Отвечает LLM

Подумайте о своем любимом книжном персонаже. Как он выглядит? что думает? как взаимодействует с другими? Мы можем описать образ героя, перечислив эти и другие черты, или проанализировать его, используя другие внутритекстовые данные. Рассказываем, как с этой задачей справятся большие языковые модели.

Яна Хлусова

NLP, Дайджест 21.04.2025

Новые версии GPT, прогнозы развития ИИ

OpenAI представила сразу несколько обновленных моделей (GPT-4.1, o3 и o4-mini), вышел детальный прогноз развития ИИ до 2027 года — что произошло в мире ИИ за последнее время.

Михаил Ким

NLP, Дайджест 07.04.2025

Новая Llama 4, новый лидер Gemini 2.5 Pro, новые картинки от GPT

Вышло новое поколение Llama, Gemini 2.5 Pro стала лучшей LLM, а GPT сильно улучшила генерацию изображений — что произошло в мире ИИ за последнее время.

Михаил Ким

NLP 10.01.2025

История развития диалоговых систем: от распознавания цифр до Siri

В какой момент чат-боты стали повсеместными онлайн-собеседниками? И как у них получается воспроизводить естественный разговор? Краткий обзор того, как говорящие машины постепенно учились и становились более человечными.

Роман Ковалев

О проекте

СОЦСЕТИ

Теги

Темы