Теперь вы можете управлять камерой ИИ Google с помощью голосовых команд

Google улучшил свой ИИ для видео Veo 2! Теперь он автоматически удаляет объекты, расширяет видео, добавляет кинематографические эффекты и позволяет задавать направление камеры. Узнайте о новых возможностях!

2 минуты

Улучшенное редактирование видео с помощью Google Veo 2

Google значительно упростил создание профессиональных видеороликов с помощью своей модели искусственного интеллекта Veo 2. Новые функции, доступные в предварительном доступе на платформе Google Cloud Vertex AI, позволяют автоматизировать множество этапов редактирования. Теперь Veo 2 способен автоматически удалять нежелательные объекты (функция "inpainting"), расширять границы кадра ("outpainting"), генерируя видеоконтент, который плавно интегрируется с оригинальным клипом, и применять различные стилистические пресеты.

Функция "outpainting" представляет собой мощный инструмент для расширения композиции. Она заполняет пустое пространство за пределами исходного кадра сгенерированным видео, обеспечивая плавный переход и расширяя возможности визуальной истории. Аналогичная функция, Generative Expand, уже используется в Adobe для обработки изображений.

Пользователи могут выбирать из набора кинематографических пресетов, таких как "таймлапс", "вид от дрона" или "панорамирование". Эти пресеты помогают задать направление композиции, угол камеры и темп видео, существенно упрощая процесс создания динамичных и визуально привлекательных роликов. Кроме того, добавлена функция интерполяции, которая генерирует промежуточные кадры между двумя статичными изображениями, создавая плавный видеопереход.

Обновления Imagen 3 и других моделей

Модель text-to-image Imagen 3 также получила значительные обновления. Улучшена функция автоматического удаления объектов, а результаты генерации стали более реалистичными и естественными. Стоит отметить, что Veo 2 и Imagen 3 уже активно используются крупными компаниями, такими как L’Oreal и Kraft Heinz, для создания маркетингового контента. Kraft Heinz, например, отметил сокращение времени выполнения задач с восьми недель до восьми часов благодаря применению этих технологий.

Новые возможности аудиомоделей

Google представил новую модель text-to-music, Lyria (доступна в закрытом доступе), которая позволяет генерировать музыку на основе текстового описания. Кроме того, модель синтетической речи Chirp 3 получила функцию "Instant Custom Voice". Эта функция позволяет генерировать реалистичные голоса на основе всего 10 секунд аудиозаписи. Также запущена новая функция транскрипции, способная разделять речь нескольких говорящих, что значительно упрощает обработку аудиозаписей с участием нескольких человек.

Другие обновления Google AI

В ближайшем будущем на платформе Vertex AI появится Gemini 2.5 Flash – оптимизированная модель, которая автоматически регулирует время обработки в зависимости от сложности задачи. Это позволит эффективно использовать вычислительные ресурсы и сократить время ожидания результатов. Инструменты Agentic AI для корпоративного сектора также получили обновления: агенты ИИ теперь могут взаимодействовать друг с другом и выполнять задачи на различных платформах, таких как PayPal и Salesforce. Наконец, на Google Cloud Marketplace открыт новый раздел для покупки агентов ИИ от сторонних разработчиков, расширяя возможности платформы и предоставляя пользователям доступ к ещё большему количеству инструментов.

Источник:www.theverge.com

Предыдущая статья Следующая статья

Теперь вы можете управлять камерой ИИ Google с помощью голосовых команд

Улучшенное редактирование видео с помощью Google Veo 2

Обновления Imagen 3 и других моделей

Новые возможности аудиомоделей

Другие обновления Google AI

Другие статьи

Первые впечатления от Gemini в Chrome: ожидание и реальность

Новые возможности GPT-4 в автоматизации бизнеса