Neuropolis

Meta представила две новые модели ИИ Llama 4

Meta представила новые модели ИИ Llama 4: Scout и Maverick, превосходящие аналоги от OpenAI и Google по многим показателям. Скоро выйдет и гигантская модель Behemoth. Узнайте подробности!

2 минуты

Meta представляет Llama 4

Компания Meta представила Llama 4 – новое семейство моделей искусственного интеллекта, которые уже используются в её продуктах: помощнике Meta AI, а также в приложениях WhatsApp, Messenger и Instagram. Доступны две модели для загрузки на сайтах Meta и Hugging Face: Llama 4 Scout – компактная модель, работающая на одном графическом процессоре Nvidia H100; и Llama 4 Maverick, демонстрирующая производительность, сравнимую с GPT-4 и Gemini 2.0 Flash.

Производительность моделей Llama 4

По заявлению Meta, Llama 4 Scout, имеющая контекстное окно в 10 миллионов токенов, превосходит модели Google Gemini 3 и Gemini 2.0 Flash-Lite, а также Mistral 3.1 по результатам множества тестов, при этом работая на одном графическом процессоре Nvidia H100. Аналогичные заявления касаются и более масштабной модели Maverick: Meta утверждает, что её результаты сопоставимы с GPT-4 от OpenAI и Gemini 2.0 Flash от Google, а также с DeepSeek-V3 в задачах программирования и логического вывода, при этом используя меньшее количество активных параметров.

Например, в тестах на генерацию кода на Python Llama 4 Maverick показала результаты, близкие к GPT-4, но при этом затрачивая меньше вычислительных ресурсов. Это достигается за счет оптимизированной архитектуры модели.

Llama 4 Behemoth: флагманская модель

Llama 4 Behemoth – модель с 288 миллиардами активных параметров и 2 триллионами параметров в общей сложности. Хотя она пока не доступна публично, Meta заявляет о её превосходстве над конкурентами, такими как GPT-4.5 и Claude Sonnet 3.7, по ряду бенчмарков в области STEM (наука, технология, инженерия и математика).

Архитектура и лицензирование Llama 4

В Llama 4 Meta использовала архитектуру «смесь экспертов» (MoE – Mixture of Experts), которая позволяет экономить ресурсы, задействуя только необходимые части модели для решения конкретной задачи. Например, при обработке текста на английском языке будут использоваться одни компоненты модели, а при обработке математических задач – другие. Это позволяет повысить эффективность и снизить потребление ресурсов.

Компания планирует более подробно рассказать о своих планах развития моделей и продуктов ИИ на конференции LlamaCon 29 апреля. Meta позиционирует Llama 4 как проект с открытым исходным кодом, однако лицензия на использование модели содержит ограничения. Коммерческие организации с более чем 700 миллионами активных пользователей в месяц должны запрашивать разрешение у Meta перед использованием моделей Llama 4. Это условие вызвало дискуссии в сообществе разработчиков и ставит под сомнение полное соответствие проекта принципам открытого исходного кода.

Источник:www.theverge.com