Neuropolis

Супер-агент Genspark: новая высота в гонке за универсальным ИИ

Узнайте о новой гонке в сфере ИИ: стартапы разрабатывают универсальных агентов, способных выполнять сложные реальные задачи — от бронирования путешествий до создания анимационных роликов. Узнайте, что это значит для бизнеса.

4 минуты

Новый уровень многоцелевых агентов ИИ

Рынок многоцелевых агентов искусственного интеллекта демонстрирует впечатляющий рост, предлагая всё более сложные и амбициозные решения. Ярким примером является Super Agent от стартапа Genspark – автономная система, способная выполнять реальные задачи в различных областях. Например, она может совершать звонки в рестораны, используя реалистичный синтетический голос.

Появление таких систем обостряет конкуренцию и заставляет задуматься о влиянии подобных технологий на бизнес.

Super Agent: возможности и архитектура

Запуск Super Agent состоялся спустя три недели после презентации Manus – системы, способной координировать инструменты и источники данных для выполнения асинхронных облачных задач (бронирование путешествий, отбор резюме, анализ акций). Genspark заявляет о превосходстве Super Agent над предшественником.

По словам сооснователя, система основана на трёх основных компонентах: девяти больших языковых моделях (LLM), более чем 80 инструментах и более чем 10 собственных наборах данных. Super Agent выходит за рамки обычных чат-ботов, выполняя сложные рабочие процессы и предоставляя готовые результаты. Демонстрации показали способность агента планировать поездки, бронировать столы в ресторанах с учётом индивидуальных предпочтений, создавать видеоролики с рецептами и даже анимационные серии в стиле «Южного Парка».

Визуализация процесса принятия решений делает систему прозрачной и похожей на партнёра. Это может вдохновить разработчиков корпоративных систем на создание подобных отслеживаемых цепочек рассуждений, повышая прозрачность и надёжность приложений.

Доступ к интерфейсу Super Agent осуществляется через браузер без технической настройки и регистрации, что упрощает тестирование без предоставления личных данных. Это контрастирует с Manus, требующим регистрации и предоставления персональной информации.

Genspark привлекла инвестиции в размере не менее 160 миллионов долларов.

Технологические решения Genspark

Подход Genspark решает сложную задачу оркестровки инструментов в масштабе. Super Agent эффективно управляет множеством внешних API и инструментов, используя маршрутизацию моделей и выбор на основе поиска для динамического выбора инструментов и подмоделей. Эта стратегия перекликается с исследованиями в области CoTools – фреймворка, улучшающего использование LLM с обширными и постоянно развивающимися наборами инструментов.

Ещё одним важным фактором является протокол контекста модели (MCP), позволяющий агентам передавать более богатый контекст инструментов и памяти между этапами выполнения задач. В сочетании с собственными наборами данных Genspark, MCP способствует большей управляемости агента по сравнению с аналогами.

Сравнение с другими решениями на рынке

Genspark – не единственный стартап, предлагающий многоцелевые агенты. Система Manus от компании Monica также демонстрирует способность автономно использовать инструменты (веб-браузер, редактор кода, табличный процессор) для выполнения многоэтапных задач.

Эффективная интеграция Manus с открытыми компонентами, включая веб-инструменты и большие языковые модели (например, Claude от Anthropic), оказалась неожиданно успешной. Несмотря на отсутствие собственного стека моделей, Manus превзошёл OpenAI на бенчмарке GAIA – синтетическом тесте для оценки автоматизации реальных задач агентами. Однако Genspark, по их заявлениям, показал ещё лучшие результаты на GAIA (87,8% против 86% у Manus), используя собственную архитектуру и более широкий спектр инструментов.

Крупные технологические компании, такие как Microsoft, OpenAI и Amazon, пока проявляют осторожность. Их предложения (Copilot Studio, Agent SDK, Amazon Nova Act) более модульны и безопасны, ориентированы на корпоративное использование, но им не хватает амбиций и автономности Super Agent. Одна из причин – высокие репутационные риски, связанные с возможными ошибками универсального агента. Кроме того, привязанность к собственным модельным экосистемам ограничивает гибкость в экспериментировании с многомодельной оркестровкой.

Стартапы, в отличие от крупных корпораций, имеют больше свободы в комбинировании больших языковых моделей и более высокую скорость разработки. Это позволяет им быстрее внедрять инновации и выводить на рынок новые решения.

Для большинства предприятий универсальный агент для бронирования ужина не является первостепенной необходимостью. Однако, в перспективе, агенты, способные выполнять сложные многоэтапные задачи (извлечение и форматирование данных, организация регистрации клиентов, создание контента), будут крайне востребованы. В этом контексте работа Genspark приобретает особую актуальность. Универсальные агенты, интегрирующие голос, память и внешние инструменты, могут начать конкурировать с унаследованными приложениями SaaS и платформами RPA, предлагая более лёгкую и удобную инфраструктуру.

Genspark утверждает, что Super Agent «сверх управляемый» и может использоваться маркетологами, учителями, рекрутерами, дизайнерами и аналитиками с минимальной настройкой. Эра универсальных агентов уже наступила, и её развитие стремительно ускоряется.

Источник:venturebeat.com