Новая модель Google Gemini: теперь с регулировкой уровня логического мышления
Узнайте, как Google решает проблему чрезмерных вычислений в своих новых моделях ИИ. Новая функция Gemini позволяет регулировать "глубину мышления", снижая затраты и повышая эффективность. Разбираемся в преимуществах и недостатках моделей ИИ, основанных на рассуждениях.

Новая эра в искусственном интеллекте: Google Gemini и проблема "передумов"
Новейшая версия модели Google Gemini от DeepMind включает регулятор, контролирующий "размышления" системы при формировании ответа. Это позволяет экономить ресурсы, но одновременно признает проблему: модели, основанные на рассуждениях, склонны к "передумыванию", потребляя значительные вычислительные ресурсы и энергию.
Эволюция моделей ИИ
До 2019 года существовало два основных способа улучшить модели ИИ: увеличение размера модели и улучшение обратной связи. В конце прошлого года Google DeepMind и другие компании добавили третий метод: рассуждения.
Модели, ориентированные на логическое решение задач, стали популярны с запуском DeepSeek R1. Они позволяют улучшить существующую модель, обучая её прагматичному подходу к задачам, вместо создания новой модели с нуля.
Однако, чем больше времени и энергии тратит модель, тем дороже её эксплуатация. Стоимость одной задачи на ведущих моделях может достигать 200 долларов.
Экономия ресурсов и эффективность: тонкая грань
Предполагалось, что дополнительные ресурсы позволят моделям лучше справляться со сложными задачами, например, анализом кода. Однако, как показала практика, это не всегда так. Gemini Flash 2.5, выпущенная с новым регулятором, часто "передумывает", особенно на простых запросах.
Высокая стоимость и экологический след
Излишнее время, затраченное на решение задачи, повышает стоимость и ухудшает экологический след. Поспешное внедрение моделей, основанных на рассуждениях, приводит к их использованию там, где это нецелесообразно.
Даже применительно к подходящей задаче могут возникнуть проблемы. Например, при решении задачи органической химии одна из ведущих моделей "зависла", многократно повторяя "Подождите, но...", значительно увеличив время выполнения.
Регулятор рассуждений: решение проблемы "передумов"
Модели Google также могут "застревать" в циклах. Новый регулятор "рассуждений" в Gemini — попытка решить эту проблему. Пока он доступен только для разработчиков приложений.
Управление вычислительными ресурсами
Разработчики могут устанавливать бюджет вычислительных ресурсов для задачи, уменьшая интенсивность рассуждений, если задача их не требует. Стоимость вывода данных в шесть раз выше при включенных рассуждениях.
Сложно определить, когда интенсивные рассуждения необходимы для лучшего ответа. Очевидные примеры – кодирование и генерация экспертных отчетов. Для большинства задач нужны дополнительные тесты и обратная связь.
Изменение парадигмы: будущее моделей ИИ
Высокие инвестиции в модели, основанные на рассуждениях, свидетельствуют об изменении парадигмы улучшения моделей. Законы масштабирования меняются, и будущее за более эффективными и экономичными решениями.
Затраты на вывод и выбросы, проприетарные и открытые модели
Более новые модели, в отличие от предыдущих поколений, склонны к ошибкам. Вместо увеличения размера моделей, компании делают ставку на увеличение времени обработки. Вывод данных отвечает за растущую долю выбросов.
Даже при доминировании моделей рассуждения, Google DeepMind не единственный игрок на рынке. Появление открытой модели DeepSeek вызвало падение фондового рынка, поскольку обещало дешевый доступ к мощным моделям рассуждения. Открытый вес модели позволяет разработчикам запускать её самостоятельно.
Проприетарные модели от Google остаются востребованными в областях, требующих высокой точности, например, в кодировании, математике и финансах. DeepMind считает, что рассуждение станет основой будущих моделей ИИ, которые будут действовать от имени пользователя и решать его проблемы.