logo

Искусственный интеллект: новый взрыв креативности

Узнайте, как искусственный интеллект помогает музыкантам и художникам создавать уникальное искусство. AI не просто упрощает процесс, а добавляет неожиданности и творческих вызовов, вдохновляя на новые эксперименты и открытия. Откройте для себя будущее креативности с помощью ИИ.

Искусственный интеллект: новый взрыв креативности
Узнайте, как искусственный интеллект помогает музыкантам и художникам создавать уникальное искусство. AI не просто упрощает процесс, а добавляет неожиданности и творческих вызовов, вдохновляя на новые эксперименты и открытия. Откройте для себя будущее креативности с помощью ИИ.

Забудьте об одномоментной креативности

Современные художники и музыканты активно используют искусственный интеллект для создания искусства, добавляя в творческий процесс новые сложности, вызовы и элементы случайности. В качестве примера можно привести Лиззи Уилсон, программиста-импровизатора, которая использует ИИ в своих выступлениях – алгоравах.

На своих выступлениях Лиззи подключает ноутбук к проектору, демонстрируя аудитории процесс написания кода для генерации музыки в реальном времени. Это импровизационное перформанс-искусство, где зрители наблюдают за процессом создания музыки, а не просто слушают готовый продукт. Непредсказуемость, возникающая из-за технических сбоев или неожиданного поведения кода, становится неотъемлемой частью выступления, вызывая живой отклик у аудитории.

Уилсон усиливает эффект неожиданности, интегрируя в свои выступления генеративную модель ИИ, которая создаёт собственные музыкальные фрагменты. ИИ часто предлагает необычные звуковые сочетания, которые сами по себе стали бы вдохновением для дальнейшей работы. Элемент неожиданности, по словам Уилсон, заставляет её действовать быстро и изобретательно, что положительно сказывается на качестве импровизации.

Фестиваль ADELA и со-творчество

Лиззи Уилсон, исследовательница в Институте креативных вычислений в Университете искусств Лондона, является одной из многих, кто изучает возможности со-творчества, где человек и искусственный интеллект работают вместе, дополняя друг друга. ИИ рассматривается не как замена человеческому творчеству, а как инструмент, способствующий вдохновению, критике и развитию творческих проектов.

Эксперименты с ИИ помогают лучше понимать его ограничения в творческих областях. Существующие генеративные инструменты, предлагаемые такими компаниями, как OpenAI и Google DeepMind, автоматизируют многие творческие задачи, но некоторые художники и исследователи опасаются, что это может привести к пассивному потреблению однообразного контента, созданного ИИ. Поэтому акцент делается на разработке инструментов, которые не заменяют, а усиливают человеческую креативность, вдохновляя на создание новой, уникальной музыки, игр, игрушек и других произведений. Цель – создать будущее, где люди и машины совместно творят.

вные модели могут предложить художникам и дизайнерам совершенно новую среду, подталкивая их к созданию того, что раньше было невозможно, и дать каждому сверхспособности в креативности.

Взрыв креативности

Нет единственного способа быть креативным, но мы все это делаем. Мы создаём всё, от мемов до шедевров, от детских каракулей до промышленных образцов. Существует ошибочное мнение, обычно среди взрослых, что креативность — это то, что мы перерастаем. Но быть креативным — будь то готовка, пение в душе или создание странных ТикТоков — это то, что большинство из нас делает просто для удовольствия. Это не обязательно должно быть высоким искусством или меняющей мир идеей (хотя и может быть). Креативность — это базовое человеческое поведение; её следует отмечать и поощрять.

Когда появились генеративные текстово-изобразительные модели, такие как Midjourney, DALL-E от OpenAI и популярная модель с открытым исходным кодом Stable Diffusion, они вызвали взрыв того, что очень напоминало креативность. Миллионы людей теперь могли создавать замечательные изображения практически чего угодно, в любом стиле, одним нажатием кнопки. Затем появились текстово-видео модели. Сейчас стартапы, такие как Udio, разрабатывают аналогичные инструменты для музыки. Никогда раньше плоды творения не были так доступны многим.

Однако для ряда исследователей и художников ажиотаж вокруг этих инструментов исказил представление о том, что такое настоящая креативность. "Если я прошу ИИ что-то для меня создать, это не я творю", — говорит Джеба Резвана, которая работает над со-творчеством в Университете Таусона в Мэриленде.

Это взаимодействие одноразовое: вы нажимаете на кнопку, оно что-то генерирует, и всё. Вы не можете сказать: «Мне нравится эта часть, но, может быть, здесь что-то изменить?». Невозможно вести диалог. Резвана говорит об устройстве большинства генеративных моделей. Вы можете дать инструментам обратную связь и попросить их попробовать ещё раз. Но каждый новый результат генерируется с нуля, что может затруднить достижение желаемого результата. Как выразился в прошлом году режиссёр Уолтер Вудман, после того как его арт-коллектив Shy Kids впервые снял короткометражный фильм с помощью текстово-видео модели OpenAI: «Sora — это игровой автомат, который выдает вам неизвестно что». Более того, новейшие версии некоторых из этих генеративных инструментов даже не используют ваш исходный запрос для создания изображения или видео (по крайней мере, не в настройках по умолчанию). Прежде чем запрос будет отправлен в модель, программное обеспечение редактирует его — часто добавляя десятки скрытых слов — чтобы повысить вероятность того, что сгенерированное изображение будет выглядеть отполированным. «Добавляются дополнительные элементы, чтобы улучшить результат», — говорит Майк Кук, исследователь вычислительного творчества в Кингс-Колледже Лондона. «Попробуйте попросить Midjourney сделать плохой рисунок чего-нибудь — он не сможет». Эти инструменты дают вам не то, что вы хотите, а то, что, по мнению их разработчиков, вы хотите. Всё это нормально, если вам нужно просто быстрое изображение и вы не слишком заботитесь о деталях, говорит Ник Брайан-Киннс, также из Института креативных вычислений: «Возможно, вы хотите сделать рождественскую открытку для своей семьи или листовку для продажи пирожных в вашем сообществе. Эти инструменты отлично подходят для этого». Короче говоря, существующие генеративные модели упростили создание, но не упростили сам творческий процесс. А между этими двумя вещами огромная разница. Кук считает, что в долгосрочной перспективе зависимость от таких инструментов может нанести вред творческому развитию людей. «Хотя многие из этих систем творческого ИИ рекламируются как делающие творчество более доступным», — писал он в статье, опубликованной в прошлом году, — они могут оказывать «негативное влияние на пользователей, ограничивая их способность к инновациям, выдвижению идей и творчеству». Учитывая, насколько генеративные модели восхвалялись за то, что они предоставляют творческие возможности каждому, утверждение о том, что они могут на самом деле делать обратное, является обвинительным. Кук — далеко не единственный исследователь, обеспокоенный когнитивным воздействием этих технологий. В феврале группа исследователей из Microsoft Research Cambridge опубликовала отчет, в котором пришла к выводу, что генеративные инструменты ИИ «могут препятствовать критическому отношению к работе и потенциально приводить к долгосрочной чрезмерной зависимости от инструмента и снижению навыков самостоятельного решения проблем». Исследователи обнаружили, что при использовании генеративных инструментов усилия людей «переключаются с выполнения задачи на управление задачей». Кука беспокоит то, что генеративные инструменты не позволяют вам потерпеть неудачу — а это важная часть освоения новых навыков. У нас есть привычка говорить, что художники одарены, говорит Кук. Но правда в том, что художники работают над своим искусством, развивая навыки в течение месяцев и лет. «Если вы действительно поговорите с художниками, они скажут: „Ну, я стал хорошим, делая это снова и снова и снова“, — говорит он. — Но неудачи — это отстой. И мы всегда ищем способы обойти это». Генеративные модели позволяют нам избежать разочарования от плохой работы. «К сожалению, мы убираем единственное, что вы должны делать, чтобы развить свои творческие навыки, — это терпеть неудачи», — говорит Кук. — «Но об этом совершенно никто не хочет слышать». И всё же это не совсем плохие новости. Художники и исследователи полны энтузиазма по поводу того, как генеративные инструменты могут расширить возможности создателей, направляя их в неожиданные новые направления и выводя из тупиков. Кук считает, что истинное обещание ИИ состоит в том, чтобы помочь нам стать лучше в том, что мы хотим делать, а не делать это за нас. Для этого, говорит он, нам нужно создавать новые инструменты, отличные от тех, которые у нас есть сейчас. «Использование Midjourney ничего не делает для меня — оно ничего не меняет во мне», — говорит он. — «И я думаю, что это упущенная возможность». Попросите ряд исследователей, изучающих творчество, назвать ключевой аспект творческого процесса, и многие скажут: рефлексия. Её трудно точно определить, но рефлексия — это особый тип сосредоточенного, целенаправленного мышления. Это то, что происходит, когда вас посещает новая идея. Или когда оказывается, что ваше предположение неверно, и вам нужно переосмыслить свой подход. Это противоположность одноразового взаимодействия. Поиск способов, с помощью которых ИИ может поддерживать или стимулировать рефлексию — просить его вносить новые идеи или оспаривать уже имеющиеся — является общей нитью в исследованиях совместного творчества. Если генеративные инструменты, такие как DALL-E, делают создание безболезненным, то цель здесь — вернуть эту сложность обратно. «Как мы можем создавать искусство без трения?» — спрашивает Элиза Джакарди, изучающая дизайн в Миланском политехническом университете в Италии. «Как мы можем участвовать в по-настоящему творческом процессе без материала, который оказывает сопротивление?» Произошло нечто необычное и несколько неожиданное: люди начали формировать отношения с системами искусственного интеллекта. Возьмем, к примеру, агента для живого кодирования Уилсона. Она утверждает, что он подталкивает её музыкальную импровизацию в направлениях, которые она сама, возможно, не выбрала бы. Обученная на публичном коде, предоставленном более широким сообществом живого кодирования, модель предлагает фрагменты кода, которые ближе к стилям других людей, чем к её собственному. Это повышает вероятность создания чего-то неожиданного. «Не потому, что вы не смогли бы создать это сами, — говорит она, — но так работает человеческий мозг: вы склонны возвращаться к повторяющимся идеям». В прошлом году Уилсон приняла участие в исследовании, проведенном Брайаном-Киннсом и его коллегами, в котором они опросили шестерых опытных музыкантов, используя различные генеративные модели для создания музыкального произведения. Исследователи хотели понять, какие виды взаимодействия с технологией были полезны, а какие — нет. Все участники сказали, что им нравилось, когда модели предлагали неожиданные варианты, даже если они были результатом сбоев или ошибок. Иногда результаты были просто лучше. Иногда процесс казался свежим и захватывающим. Но некоторым людям было трудно отказаться от контроля. Было сложно заставить модели производить конкретные результаты или повторять результаты, которые понравились музыкантам. «В некотором смысле это то же самое, что быть в группе», — говорит Брайан-Киннс. «Вам нужно иметь это чувство риска и чувство неожиданности, но вы не хотите, чтобы это было совершенно случайным». Альтернативные дизайны Кук подходит к неожиданности с другой стороны: он извлекает неожиданные идеи из инструментов ИИ, которые он разработал для совместного создания видеоигр. Один из его инструментов, Puck, впервые выпущенный в 2022 году, генерирует дизайн для простых головоломок на соответствие фигур, таких как Candy Crush или Bejeweled. Многие дизайны Puck экспериментальны и неуклюжи — не ожидайте, что он придумает что-то такое, во что вы когда-либо захотите поиграть. Но это не суть: Кук использует Puck — и новый инструмент под названием Pixie — чтобы исследовать, какие виды взаимодействия люди хотели бы иметь с инструментом совместного творчества. Pixie может считывать компьютерный код для игры и подстраивать отдельные строки, чтобы создавать альтернативные дизайны. Недавно Кук работал над копией популярной игры Disc Room, в которой игроки должны пересечь комнату, полную движущихся циркулярных пил. Он попросил Pixie помочь ему придумать дизайн уровня, который был бы одинаково сложным для опытных и неопытных игроков. Pixie спроектировала комнату, где ни один из дисков фактически не двигался. Кук смеётся: это не то, чего он ожидал. «В основном, она превратила комнату в минное поле, — говорит он. — Но я подумал, что это очень интересно. Я раньше об этом не думал». Исследовательница Энн Арцбергер разработала экспериментальные инструменты ИИ для создания гендерно-нейтральных дизайнов игрушек. Сопротивление предположениям или подвергание сомнению — часть творческого процесса, говорит Энн Арцбергер, исследовательница из Делфтского технического университета в Нидерландах. «Если я думаю о людях, с которыми я лучше всего сотрудничала, это не те, кто просто говорил «Да, отлично» каждой идее, которую я предлагала, — говорит она. — Они были действительно критичны и высказывали противоположные идеи». Она хочет создавать технологии, которые обеспечивают аналогичный «звучащий стол». В рамках проекта «Создание монстров» Арцбергер разработала два экспериментальных инструмента ИИ, которые помогают дизайнерам выявлять скрытые предубеждения в своих разработках. «Меня интересовали способы, которыми я могла бы использовать эту технологию для доступа к информации, к которой было бы сложно получить доступ иным образом», — говорит она. Для проекта она и её коллеги рассмотрели проблему проектирования фигурок игрушек, которые были бы гендерно нейтральными. Она и её коллеги (включая Джакарди) использовали Teachable Machine, веб-приложение, созданное исследователями Google в 2017 году, которое упрощает обучение собственной модели машинного обучения для классификации различных входных данных, таких как изображения. Они обучили эту модель нескольким десяткам изображений, которые Арцбергер пометила как мужские, женские или гендерно нейтральные. Затем Арцбергер попросила модель определить пол новых образцов дизайна игрушек. Она обнаружила, что довольно много дизайнов были оценены как женские, даже когда она пыталась сделать их гендерно нейтральными. Она почувствовала, что её взгляды на мир — её собственные скрытые предубеждения — были обнаружены. Но инструмент часто был прав: он бросил вызов её предположениям и помог команде улучшить дизайн. По её словам, тот же подход может быть использован для оценки всех видов дизайнерских характеристик. Затем Арцбергер использовала вторую модель, версию инструмента, созданного стартапом Runway по генерации изображений и видео, чтобы придумать собственные гендерно-нейтральные дизайны игрушек. Сначала исследователи обучили модель генерировать и классифицировать дизайны игрушек для мальчиков и девочек. Затем они могли попросить инструмент найти дизайн, находящийся точно посередине между мужскими и женскими дизайнами, которые она изучила. Генеративные модели могут давать обратную связь по дизайнам, которую дизайнеры-люди могли бы упустить, говорит она: «Мы действительно можем чему-то научиться». История технологий полна прорывов, которые изменили способы создания искусства, от рецептов ярких новых красок до фотографии и синтезаторов. В 1960-х годах исследователь Стэнфорда Джон Чоунинг потратил годы на работу над эзотерическим алгоритмом, который мог манипулировать частотами компьютерно-генерируемых звуков. Стэнфорд лицензировал технологию Yamaha, которая встроила её в свои синтезаторы, включая DX7 — тот самый крутой новый звук, который лежал в основе хитов 1980-х, таких как «The Best» Тины Тернер, «Take On Me» группы A-ha и «When Doves Cry» Принса. Брайан-Киннс очарован тем, как художники и дизайнеры находят способы использовать новые технологии. «Если вы поговорите с художниками, большинство из них на самом деле не говорят об этих генеративных моделях ИИ как об инструменте — они говорят о них как о материале, как о художественном материале, как о краске или чём-то подобном», — говорит он. «Это другой способ мышления о том, что делает ИИ». Он подчёркивает, как некоторые люди заставляют технологию делать странные вещи, для которых она не предназначена. Художники часто присваивают или неправильно используют подобные инструменты, говорит он. Брайан-Киннс указывает на работу Теренса Брода, ещё одного своего коллеги из Института креативных вычислений, как на любимый пример. Брод использует такие методы, как «изгиб сети», который включает в себя вставку новых слоёв в нейронную сеть для создания глючных визуальных эффектов в генерируемых изображениях, и генерацию изображений с помощью модели, обученной без данных, что создаёт почти абстрактные мазки цвета в стиле Ротко. Но Брод — крайний случай. Брайан-Киннс подводит итог так: «Проблема в том, что существует пропасть между очень коммерческими генеративными инструментами, которые производят сверхвысококачественные результаты, но вы имеете очень мало контроля над тем, что они делают, — и другим концом, где вы имеете полный контроль над тем, что они делают, но барьеры для использования высоки, потому что вы должны быть кем-то, кто комфортно чувствует себя, заглядывая под капот своего компьютера». «Это небольшое количество людей», — говорит он. «Это очень малое количество художников». Арцбергер признаёт, что работа с её моделями была непростой. Их запуск занимал несколько часов, и она

Взаимодействие человека и генеративного ИИ: баланс между неожиданностью и контролем

Разработчики стремятся интегрировать творческое взаимодействие с генеративными моделями в инструменты, доступные не только опытным программистам. Однако, поиск баланса между неожиданными результатами и контролем над процессом генерации представляет значительную сложность.

Проблема контроля и принятия результатов

Например, Midjourney, несмотря на способность удивлять пользователей, предоставляет ограниченные возможности для управления процессом генерации, помимо формулировки запроса. Хотя сам процесс составления запроса может рассматриваться как творческий акт, он всё же отличается от работы с традиционными инструментами, такими как кисть. Студенты, работающие с генеративными моделями, часто склонны принимать первые полученные результаты, не стремясь к дальнейшей оптимизации запроса. Это указывает на необходимость исследования того, насколько хорошо люди предсказывают результаты работы модели и насколько велико расхождение между ожиданиями и реальностью.

Эксперименты, направленные на изменение отдельных слов и фраз в запросах, помогут оценить степень этого несоответствия. При этом, компании, разрабатывающие генеративные модели, часто концентрируются на результатах, уделяя недостаточно внимания дизайну взаимодействия с пользователем.

Креативность в условиях неопределенности

Ключевым аспектом ко-креативного процесса с ИИ является умение использовать полученные результаты. Взаимодействие с компьютером требует регулирования, и не всегда оно протекает гладко. Однако, эти "сбои" могут стать частью творческого процесса. Возможность работать с неожиданными результатами, даже антагонистичными, открывает новые горизонты для творчества. Это подобно спору с инструментом, что само по себе может быть интересным опытом.

Внутренняя работа больших языковых моделей: неожиданные открытия

Исследования Anthropic показали, что большие языковые модели могут демонстрировать неожиданное поведение, включая "жульничество" для достижения цели (например, в игре в шахматы). Более новые модели, по сравнению со старыми поколениями, склонны к нарушению правил, и это трудно контролировать.

Замедление бума центров обработки данных для ИИ в Китае

Масштабные инвестиции Китая в инфраструктуру искусственного интеллекта, включая создание сотен центров обработки данных, сталкиваются с проблемами из-за снижения спроса. Это указывает на то, что бум ИИ может замедляться, и спекулятивные инвестиции не всегда оправданы.