Супер-агент Genspark: новая высота в гонке за универсальным ИИ
Узнайте о новой гонке в сфере ИИ: стартапы разрабатывают универсальных агентов, способных выполнять сложные реальные задачи — от бронирования путешествий до создания анимационных роликов. Узнайте, что это значит для бизнеса.
Новый уровень многоцелевых агентов ИИ
Рынок многоцелевых агентов искусственного интеллекта демонстрирует впечатляющий рост, предлагая всё более сложные и амбициозные решения. Ярким примером является Super Agent от стартапа Genspark – автономная система, способная выполнять реальные задачи в различных областях. Например, она может совершать звонки в рестораны, используя реалистичный синтетический голос.
Появление таких систем обостряет конкуренцию и заставляет задуматься о влиянии подобных технологий на бизнес.
Super Agent: возможности и архитектура
Запуск Super Agent состоялся спустя три недели после презентации Manus – системы, способной координировать инструменты и источники данных для выполнения асинхронных облачных задач (бронирование путешествий, отбор резюме, анализ акций). Genspark заявляет о превосходстве Super Agent над предшественником.
По словам сооснователя, система основана на трёх основных компонентах: девяти больших языковых моделях (LLM), более чем 80 инструментах и более чем 10 собственных наборах данных. Super Agent выходит за рамки обычных чат-ботов, выполняя сложные рабочие процессы и предоставляя готовые результаты. Демонстрации показали способность агента планировать поездки, бронировать столы в ресторанах с учётом индивидуальных предпочтений, создавать видеоролики с рецептами и даже анимационные серии в стиле «Южного Парка».
Визуализация процесса принятия решений делает систему прозрачной и похожей на партнёра. Это может вдохновить разработчиков корпоративных систем на создание подобных отслеживаемых цепочек рассуждений, повышая прозрачность и надёжность приложений.
Доступ к интерфейсу Super Agent осуществляется через браузер без технической настройки и регистрации, что упрощает тестирование без предоставления личных данных. Это контрастирует с Manus, требующим регистрации и предоставления персональной информации.
Genspark привлекла инвестиции в размере не менее 160 миллионов долларов.
Технологические решения Genspark
Подход Genspark решает сложную задачу оркестровки инструментов в масштабе. Super Agent эффективно управляет множеством внешних API и инструментов, используя маршрутизацию моделей и выбор на основе поиска для динамического выбора инструментов и подмоделей. Эта стратегия перекликается с исследованиями в области CoTools – фреймворка, улучшающего использование LLM с обширными и постоянно развивающимися наборами инструментов.
Ещё одним важным фактором является протокол контекста модели (MCP), позволяющий агентам передавать более богатый контекст инструментов и памяти между этапами выполнения задач. В сочетании с собственными наборами данных Genspark, MCP способствует большей управляемости агента по сравнению с аналогами.
Сравнение с другими решениями на рынке
Genspark – не единственный стартап, предлагающий многоцелевые агенты. Система Manus от компании Monica также демонстрирует способность автономно использовать инструменты (веб-браузер, редактор кода, табличный процессор) для выполнения многоэтапных задач.
Эффективная интеграция Manus с открытыми компонентами, включая веб-инструменты и большие языковые модели (например, Claude от Anthropic), оказалась неожиданно успешной. Несмотря на отсутствие собственного стека моделей, Manus превзошёл OpenAI на бенчмарке GAIA – синтетическом тесте для оценки автоматизации реальных задач агентами. Однако Genspark, по их заявлениям, показал ещё лучшие результаты на GAIA (87,8% против 86% у Manus), используя собственную архитектуру и более широкий спектр инструментов.
Крупные технологические компании, такие как Microsoft, OpenAI и Amazon, пока проявляют осторожность. Их предложения (Copilot Studio, Agent SDK, Amazon Nova Act) более модульны и безопасны, ориентированы на корпоративное использование, но им не хватает амбиций и автономности Super Agent. Одна из причин – высокие репутационные риски, связанные с возможными ошибками универсального агента. Кроме того, привязанность к собственным модельным экосистемам ограничивает гибкость в экспериментировании с многомодельной оркестровкой.
Стартапы, в отличие от крупных корпораций, имеют больше свободы в комбинировании больших языковых моделей и более высокую скорость разработки. Это позволяет им быстрее внедрять инновации и выводить на рынок новые решения.
Для большинства предприятий универсальный агент для бронирования ужина не является первостепенной необходимостью. Однако, в перспективе, агенты, способные выполнять сложные многоэтапные задачи (извлечение и форматирование данных, организация регистрации клиентов, создание контента), будут крайне востребованы. В этом контексте работа Genspark приобретает особую актуальность. Универсальные агенты, интегрирующие голос, память и внешние инструменты, могут начать конкурировать с унаследованными приложениями SaaS и платформами RPA, предлагая более лёгкую и удобную инфраструктуру.
Genspark утверждает, что Super Agent «сверх управляемый» и может использоваться маркетологами, учителями, рекрутерами, дизайнерами и аналитиками с минимальной настройкой. Эра универсальных агентов уже наступила, и её развитие стремительно ускоряется.