DeepSeek потрясает мир ИИ: новый скачок искусственного интеллекта — это не больше данных, а больше вычислительных мощностей на этапе вывода
Прорыв в сфере ИИ: китайская компания DeepSeek создала высокопроизводительную модель по низкой цене, вызвав падение акций Nvidia. Узнайте о новых трендах в развитии ИИ и их влиянии на рынок.

Влияние на индустрию ИИ
Увеличение вычислительных затрат на время тестирования (TTC) и растущая конкуренция среди моделей логического вывода оказывают значительное влияние на индустрию искусственного интеллекта. Это влияние затрагивает различные сферы, от аппаратного обеспечения до корпоративного программного обеспечения.
Аппаратное обеспечение (GPU, специализированные чипы и вычислительная инфраструктура)
Сдвиг фокуса на TTC меняет подход к управлению вычислительными ресурсами. Вместо инвестиций в масштабные кластеры GPU для обучения, компании всё чаще вкладываются в оптимизацию вывода данных, чтобы удовлетворить растущие потребности в скорости обработки. Несмотря на то, что GPU остаются необходимыми для обработки вывода, различия между рабочими нагрузками обучения и вывода приводят к изменению их настройки и использования. Динамичность рабочих нагрузок вывода усложняет планирование ресурсов по сравнению с пакетной обработкой данных при обучении.
Повышение значения TTC стимулирует развитие альтернативного аппаратного обеспечения, специализированного на вычислениях с низкой задержкой. Например, растёт спрос на специализированные интегральные схемы (ASIC) для вывода, которые могут стать конкурентами GPU. Универсальные GPU, используемые как для обучения, так и для вывода, могут постепенно уступать место специализированным решениям.
Облачные платформы: Гиперскейлеры (AWS, Azure, GCP) и облачные вычисления
Качество обслуживания (QoS) становится решающим фактором при выборе облачной платформы. Ненадежность API вывода, проявляющаяся в колебаниях времени отклика, ограничении скорости и проблемах с обработкой одновременных запросов, препятствует широкому внедрению ИИ в корпоративном секторе. Увеличение TTC усугубляет эти проблемы, предоставляя преимущество поставщикам облачных услуг, которые гарантируют стабильное QoS.
Повышение эффективности моделей не обязательно приводит к снижению расходов на облачные вычисления. Более эффективные модели могут, наоборот, стимулировать их более широкое использование, увеличивая общий спрос на вычислительные ресурсы (парадокс Джевонса). Это ведёт к росту спроса на облачные вычисления как для вывода, так и для обучения специализированных моделей.
Поставщики базовых моделей (OpenAI, Anthropic, Cohere, DeepSeek, Mistral)
Появление новых игроков, таких как DeepSeek, способных конкурировать с ведущими лабораториями ИИ при меньших затратах, ставит под вопрос монополию на проприетарные предварительно обученные модели. Успех DeepSeek демонстрирует, что инновации в вычислительной технике обучения могут поступать из неожиданных источников.
Внедрение корпоративного ИИ и SaaS (прикладной уровень)
Проблемы безопасности и конфиденциальности
Продукты компаний, подобных DeepSeek, подвергаются тщательной проверке с точки зрения безопасности и конфиденциальности. Это особенно актуально для компаний, расположенных вне западных стран. Потенциальные проблемы с обходом ограничений, предвзятостью и генерацией вредоносного контента ограничивают внедрение таких моделей в корпоративном секторе.
Рост специализации по отраслям
Ранее приложения ИИ, основанные на базовых моделях, фокусировались на создании рабочих процессов, адаптированных к конкретным бизнес-потребностям. Однако, значительный прогресс в базовых моделях может сделать эти приложения устаревшими. Замедление темпов прогресса в вычислительной технике обучения уменьшает эту угрозу, открывая новые возможности для игроков на уровне приложений.
Оптимизация времени тестирования и вывода становится приоритетной задачей. Улучшения в алгоритмах послеобучения, ориентированных на специфику предметной области, позволяют повысить производительность в целевых вертикалях, особенно в приложениях реального времени, где важна скорость отклика. Компании, обладающие экспертизой в конкретных областях, получают возможность оптимизировать вывод и настраивать результаты под свои нужды.
DeepSeek демонстрирует, что время тестирования становится важнее, чем размер предварительного обучения. Хотя прямое внедрение моделей DeepSeek в корпоративные приложения ограничено, их влияние на стимулирование улучшений в других моделях очевидно. Успех DeepSeek заставляет устоявшиеся лаборатории ИИ внедрять аналогичные методы, что приводит к снижению стоимости моделей и, как следствие, к увеличению их использования.