Mistral выпустила рассуждающую модель Magistral
Это первая модель компании с поддержкой reasoning.
Компания приобрела 49% стартапа, специализирующегося на разметке данных для ИИ-моделей.
Пользователи могут анимировать картинки с помощью текстовых инструкций или автоматических сценариев.
Видеогенерация в Midjourney, инвестиции Meta в компанию по разметке данных, новая модель Mistral — что нового в мире ИИ произошло за последнее время.
Можно ли с помощью нейросетей находить скрытые цитаты, аллюзии и сближения в художественных текстах? Конечно! Что будет, если объединить силу LLM с экспертизой литературоведов, — читайте в материале математика, специалиста по Computer Science и одновременно литературоведа Евгения Обухова.
ИИ от xAI будет встроен в мессенджер, а Telegram получит инвестиции и долю от подписок.
Модель реже галлюцинирует, умеет запускать код и искать информацию в интернете.
Компания Google представила новые AI-продукты, Anthropic выпустила свежие версии своих моделей, бывший главный дизайнер Apple разработает новое устройство для OpenAI — что произошло в мире ИИ за последнее время.
LLM демонстрирует высокий уровень автономности и в ряде случаев склонность к обману и инициативе.
Проект станет частью инициативы Stargate по внедрению ИИ в государственные системы страны.
Как работает поиск изображений по текстовым описаниям? Как это связано с генерацией изображений? Как языковые модели «понимают» не только текст, но и изображения и аудио? Рассказываем, как нейросети работают с разными типами данных одновременно.
Бывший дизайнер Apple займётся созданием устройств с ИИ в партнёрстве с исследовательской командой OpenAI.
Обновлены модели Gemini, анонсированы агентная система, генераторы мультимедиа и поиск с ИИ-выжимками.
Подумайте о своем любимом книжном персонаже. Как он выглядит? что думает? как взаимодействует с другими? Мы можем описать образ героя, перечислив эти и другие черты, или проанализировать его, используя другие внутритекстовые данные. Рассказываем, как с этой задачей справятся большие языковые модели.
Google открыла доступ к ИИ-поиску американским пользователям, вышло третье поколение языковой модели Qwen, OpenAI после жалоб пользователей вернула менее подобострастную версию GPT — что произошло в мире ИИ за последнее время.
Новая вкладка формирует краткие текстовые ответы с помощью языковых моделей и доступна пользователям из США.
Модели Qwen3 доступны в разных масштабах, поддерживают рассуждения и входят в число лидеров среди open-source LLM.
ЕГЭ — нервное событие, а подготовка к экзаменам — долгая и сложная. На помощь ученикам и учителям приходят сервисы на базе искусственного интеллекта. Сравниваем «Сочинитель», «Яндекс Учебник» и Skysmart AI с популярными нейросетями. И технологично готовимся к итоговому сочинению, ЕГЭ по информатике и английскому языку.
Новые версии улучшили качество генерации, расширили контекст до 1 млн токенов и получили поддержку визуальных данных.
Вышло новое поколение Llama, Gemini 2.5 Pro стала лучшей LLM, а GPT сильно улучшила генерацию изображений — что произошло в мире ИИ за последнее время.
Компания представила модели Scout, Maverick и Behemot с поддержкой обработки изображений и длинных контекстов до 10 миллионов токенов.
Исследователи предсказывают появление сверхчеловеческого ИИ и усиление международной конкуренции.
Модель получила нативную поддержку работы с текстом и изображениями без использования отдельных нейросетей.
Модель занимает первое место на платформе LMArena и доступна через API в бесплатной и платной версиях.
OpenAI выступила за ужесточение доступа к чипам, экспортируемым из США, Google и Mistral обновили свои открытые модели — что произошло в мире ИИ за последнее время.
Компактная модель улучшила результаты в задачах на понимание языка и логическое рассуждение.
Компания предлагает ограничить использование чипов для китайских ИИ-моделей в рамках инициативы AI Action Plan.
Модель поддерживает обработку текста и изображений и опережает конкурентов на платформе LMArena.
Более человечная GPT-4.5, новая флагманская модель от Anthropic и OCR от Mistral — что произошло в мире ИИ за последнее время.
В честь Международного женского дня мы собрали для вас подборку полезных и познавательных публикаций, в которых мы напоминаем о сферах, где все еще сохраняется неравенство, изучаем, чем занимаются DH-исследовательницы, и ищем различия между мужской и женской речью.
Иногда сложно понять, что же хотел сказать автор своим сочинением, а пересказать текст кажется нереальной задачей — из-за необычной структуры повествования или при использовании разных рассказчиков. Как справляются с подобными задачами LLM? Ученые Колумбийского университета спросили у самих писателей.
Можно ли повысить качество ответов языковых моделей с помощью более продуманных промтов? Как сделать так, чтобы ответы LLM следовали определенному формату? Как заставить модели объяснять свои ответы? Рассказываем о методах формулирования эффективных запросов к LLM в нашем материале.
Мы попросили нейросети сгенерировать новогодние обращения Владимира Путина, стилизуя их под разные года и события. Пройдите тест и проверьте, сможете ли вы отличить настоящее обращение президента России от созданного нейросетью.
Петроглифы — небольшие древние наскальные изображения — часто сложно датировать и атрибутировать. При этом для некоторых рисунков может быть очень много однотипных образцов — например, таковы петроглифы с изображениями оленей в долине чукотской реки Пегтымель. Выпускница магистратуры Digital Humanities НИУ ВШЭ рассказывает, как можно классифицировать петроглифы по типам при помощи нейросети.
OpenAI представила модель, способную «рассуждать», француский стартап Mistral снизил цены на свои модели, Apple отстаёт в гонке за ИИ машинного обучения в смартфонах — что произошло за последнее время в мире ИИ.
OpenAI выпустила компактную дешёвую версию GPT-4, Meta* обновила семейство моделей LLama 3, релиз четырёх новых LLM от Mistral. Рассказываем, что произошло в мире ИИ за последние две недели.
Llama 3 с 405 миллиардами параметров выйдет в конце июля. Компания EvolutionaryScale представила большую модель для дизайна белков. В главный блок всех языковых моделей на трансформерной архитектуре — блок внимания (attention) — добавили новые оптимизации. Рассказываем, что произошло в мире ИИ за последние две недели.
Лингвистика и программирование. Филология и программирование. Нужны ли они друг другу? Нужно ли гуманитариям вообще уметь программировать или же все учёные чётко делятся на физиков и лириков? «Системный Блокъ» считает, что их знания можно взболтать, но не смешивать. Читаем интервью «Системного Блока» о том, насколько важно современным гуманитариям знание Python и нейросетей.
Что значит «языковая модель галлюцинирует»? Как сделать её ответы более точными и фактологически верными? Умеет ли нейросеть гуглить? Может ли нейросеть выдумывать несуществующие факты? Отвечаем в нашем материале о RAG (Retrieval Augmented Generation) — методе, позволяющем «подключать» языковые модели к внешним источникам информации.
Специально для вас мы попросили нейросети сгенерировать изображения. Пройдите тест и проверьте, сможете ли вы понять, результатом какого запроса является картинка перед вами.
Создатели Sora рассказали, откуда брали видео для обучения, но кое о чем умолчали. Компания Cohere — один из главных конкурентов OpenAI/ChatGPT — выпустила модель с 35 млрд параметров. Вышла сопоставимая с трансформерами RNN-модель EagleX — неужели рекуррентные нейросети рано хоронить? Рассказываем, что произошло в мире ИИ за прошедшую неделю
Миром управляют белые мужчины. Они же в основном работают врачами, юристами и судьями — хотя среди них иногда встречаются и белые женщины. Преступления совершают темнокожие парни, а женщины с афроамериканскими корнями готовят бургеры в забегаловках. Ну а если в ресторан зашел русский, то он непременно возьмет стопку водки. Именно так видит наш мир нейросеть Stable Diffusion. Алгоритмы искусственного интеллекта не только генерируют изображения или тексты, но и воспроизводят общественные стереотипы. Рассказываем, как и почему они это делают.
Кибер-арт постоянно противопоставляют классической живописи, но между ними намного больше общего, чем нам кажется. Сможете ли вы отличить работу нейросети от картины художника? Пройдите тест и узнайте, насколько хорошо вы распознаете картины, созданные алгоритмом
Нейросеть научилась давать оценку картинам китайских художников, как профессиональный искусствовед. Рассказываем простыми словами, как это работает и причём здесь пятьдесят оттенков серого
Как обучить нейросеть на своих данных? Какие бывают параметры обучения/генерации, и на что они влияют? Как оптимизировать процесс обучения, если нет видеокарты? Отвечаем на все эти вопросы в нашем туториале по файн-тюнингу ruGPT3 на текстах Достоевского.
Новости о развитии искусственного интеллекта попадают на первые полосы различных медиа, а про ChatGPT слышно из каждого утюга. При этом, различным моделям ИИ приходится конкурировать по степени «разумности» не только с человеком, но и между собой. Разбираемся с конкуренцией между моделями ИИ, между ИИ и человеком, преимуществами и недостатками бота ChatGPT и его аналогов, а также моральной ответственностью и человеческим снобизмом.
Новая нейросеть семейства GPT не только точнее, надёжнее и безопаснее GPT-3 и ChatGPT. Еще она умеет работать с изображениями. Благодаря этому GPT-4 лучше понимает окружающий мир, а самое главное — способна объяснять мемы ¯\_(ツ)_/¯
Как нейросеть, обученная под одну задачу, решает другую? Может ли она использовать свой «предыдущий опыт»? Почему это важно и почему корпорации спешат внедрить эту технологию? Рассказываем о популярном методе «переноса знаний» в машинном обучении на примерах языков, ягод и Достоевского.
Модель Ithaca позволила повысить точность реставрационных работ почти в три раза: с 25% до 72%
Общение с чат-ботами и голосовыми помощниками стало частью повседневного опыта. Мы спрашиваем у нейросетей о погоде и пробках, просим переводить и сочинять тексты, проверяем их способности стихосложения и иногда даже делимся сокровенными секретами. СБъ уже не раз рассказывал о работе языковых моделей, которые делают боты более человечными. Предлагаем освежить знания и прочитать материал из глоссария про наиболее крупную и продвинутую языковую модель в мире – GPT-3
Алгоритм глубокого обучения по спутниковым снимкам проанализировал уровень жизни в отдельных географических регионах
Исследователи из компании Google создали алгоритм, который распознает строение белка. Биологи решали эту задачу 50 лет
Группа исследователей из Беркли и Стэнфорда разработала инструмент, который находит нестыковки в аудио-визуальном потоке между положениями губ и произносимыми звуками
Разбираем сложные технологии глубокого обучения, чтобы они становились понятны каждому
DALL-E — нейросеть-трансформер с 12 миллиардами параметров, которую обучили генерировать изображения по произвольному текстовому описанию. Например, пишете ей «кресло в виде авокадо» — и получаете изображение, которое почти неотличимо от фотографии из салона дизайнерской мебели. Рассказываем, что еще умеет DALL-E
Научить нейросети понимать искусство пытаются уже много лет. И хотя про «понимание» говорить рано, некоторые задачи, ранее доступные лишь искусствоведу, они решают неплохо! Пример — датировка живописи. Рассказываем про систему, сделанную студентами МИСиС, которая может датировать картины — причем не только всем известные «Звездную ночь» или «Мона Лизу», но и полотна неизвестных художников. Кстати, эту модель может протестировать любой желающий!
С помощью мобильных игр мы обычно расслабляемся и убиваем время. А вот новая игра от исследователей из Калифорнийского университета и фонда Шампалимо запущена для исследовательских целей — она изучает человека, чтобы улучшить искусственный интеллект. Разбираемся, к каким открытиям может привести игра-пазл
«Системный Блокъ» уже рассказывал, как «Союзмультфильм» вручную восстановил часть советских анимационных лент. Основная проблема старых мультфильмов — не физические повреждения и выцветание, а низкое разрешение видеозаписи.
Все слышали о GPT-3, которая умеет сочинять стихи и прозу, разгадывать анаграммы, переводить, отвечать на вопросы по прочитанному тексту и даже писать философские рассуждения о жизни и смерти. Рассказываем, как работает ее бабушка, GPT-2, без которой такой прорыв в области обработки естественного языка был бы невозможен
Маленькие дети радуются, когда удается прочитать вывеску на улице. Нейросети тоже читают вывески, а некоторые еще и шрифт определяют. И если по почерку человека можно узнать его характер, то какую информацию о жителях городского района позволяет получить почерк улицы?