Neuropolis

Google AI: теперь видит и ищет по картинкам

Google улучшил свой ИИ-чат-бот AI Mode: теперь он "видит" изображения! Благодаря новой функции, основанной на Gemini и Google Lens, вы можете загрузить фото и получить подробный ответ с ссылками. Доступно на Android и iOS.

2 минуты

Многомодальный поиск в Google AI Mode

Google значительно расширил функциональность своего чат-бота AI Mode, интегрировав в него возможности обработки изображений. Теперь пользователи в США могут загружать фотографии или делать снимки, а AI Mode будет анализировать их и предоставлять подробные ответы, включая ссылки на источники информации. Эта инновация объединяет возможности собственной модели Gemini AI с технологией визуального поиска Lens, открывая новые горизонты в поиске информации.

Обновление доступно для пользователей Android и iOS через приложение Google. Робби Штейн, вице-президент Google Search, подчеркивает, что AI Mode использует многолетний опыт компании в области визуального поиска, но выходит за его рамки. Благодаря многомодальности Gemini, AI Mode способен понимать не только отдельные объекты на изображении, но и контекст их взаимосвязи, анализируя материалы, цвета, формы и пространственное расположение.

Для обеспечения высокой точности и релевантности ответов, Google применяет технологию "ветвления запросов". Система отправляет множество параллельных запросов, анализируя изображение и его элементы с разных точек зрения. Рассмотрим пример: пользователь загружает фотографию книжной полки. AI Mode не только идентифицирует книги, но и предлагает похожие книги с высокими рейтингами, отвечая на уточняющие вопросы пользователя и предоставляя дополнительные рекомендации.

Расширение доступности AI Mode

Ранее доступный только подписчикам платного сервиса Google One AI Premium в тестовом режиме (Labs), AI Mode теперь открыт для миллионов пользователей в США. Это значительный шаг к демократизации доступа к передовым технологиям искусственного интеллекта.

AI Mode – это конкурент таких сервисов, как Perplexity и ChatGPT Search. Он предоставляет ответы на вопросы в формате, сгенерированном искусственным интеллектом, используя данные из индекса Google. Это позволяет получать не только сухую информацию, но и контекстуальные обзоры, созданные на основе анализа огромного массива данных.

Источник:www.theverge.com