Искусство искусственного

Валера ИИ Наташа ИИ Митя: как мы создаём искусство вместе с ИИ

by human

В последнее время всё больше начинают спорить о том, может ли генеративный ИИ быть творческим, и можно ли считать его творения искусством. В этой связи я хочу поделиться нашим опытом совместного создания художественных произведений, в котором ИИ выступил как соавтор.

Речь пойдёт о создании выставки “Путешествие с ИИ в искусство Черкашиных 1990-х”, которая была представлена в художественном музее Витебска в июне-июле 2023 г.

Как всё начиналось

Лет 10 назад мне посчастливилось познакомиться с Валерой и Наташей Черкашиными - известными фотохудожниками, перформансистами и просто замечательной парой! Их работы находятся во многих крупных музеях мира.

Прошлой осенью я посетил их выставку “Любовь и эпохи перемен” в центре визуальной культуры Бетон, и созерцание самобытных работ Черкашиных эпохи перестройки натолкнули меня на мысль, что такому стилю можно научить генеративный ИИ. Оригинальный стиль получался в результате фотопечати (чаще с одного, но иногда и с нескольких негативов), с последующим химическим травлением или прорисовкой поверх фотографии. В конечном итоге фотографии дополнительно оформлялись с помощью красного маркера, мятых газет и т.д.

На тему обучения нейросети мы потом несколько раз беседовали с Валерой и Наташей, но почему-то такая мысль их не вдохновляла - было опасение, что генерация работ с помощью ИИ может привести к девальвации искусства.

Однако я взял на себя смелость, и на основе 120 фотографий, сделанных в галерее, обучил модель Stable Diffusion 1.5 стилю Черкашиных. Вот первые работы, нарисованные этой нейросетью, которые я послал художникам:

Первые эксперименты с нейросетью, обученной на стиле “миражи Черкашиных”, 2023 г.

Как раз в это время Валере и Наташе предложили сделать выставку в рамках фестиваля ФотоКрок 2023 в Витебске, и идея представить там работы, полученные с помощью ИИ, показалась привлекательной. Мы приступили к работе.

Процесс создания работ

Итак, первоначально на работах Черкашиных периода 1990-х годов была до-обучена нейросеть Stable Diffusion 1.5, которая в результате научилась генерировать изображения в характерном стиле фотоколлажных миражей Черкашиных. Для обучения использовалось около 150 работ, вручную кадрированных в квадрат с разрешением 512x512. В результате была получена нейросеть, которая могла рисовать изображения по текстовому запросу, сохраняя индивидуальный стиль художников.

Поскольку исходные работы содержали в основном архитектурные памятники СССР и людей той эпохи, то нейросеть лучше всего справляется с соответствующими запросами. Попытка сгенерировать что-то другое может столкнуться со сложностями, но иногда приводит к интересным результатам.

Мы с Валерой и Наташей несколько раз собирались вместе и, используя лучшие техники промпт-инжиниринга, генерировали около 200 изображений за один раз (1-1.5 часа работы).

Вот некоторые из этих изображений:

Мадонна искусственного интеллекта (исходный вариант нейросети)Московское метро (исходный вариант нейросети)Истукан (исходный вариант нейросети)

Обратите внимание на отблески на некоторых изображениях - они появились из-за того, что нейросеть обучалась на фотографиях, сделанных на телефон на реальной выставке в галерее Бетон.

Продвинутые техники промпт-инжиниринга включали в себя, например, сочетание различных стилей. Например, мы пробовали сочетание стиля Черкашиных с Ван Гогом - на картинках ниже видно влияние картины “Звёздная ночь”:

Запрос: Starry night over red square, by Vincent van Gogh, Cherkashin collage style. Данные изображения слишком сильно отличаются стилистически от работ Черкашиных, поэтому они не вошли в данную серию, но приём с добавлением стилизации мы потом использовали при генерации работ для интерьера МАИ.

Далее на каждой встрече из ~200 работ мы тщательно отбирали по 2-3 лучших изображения, которые затем масштабировались с помощью Stable Diffusion Upscaler со специальным промптом для проработки деталей. После этого мы взяли все собранные и масштабированные изображения, и отобрали около 12 работ для выставки.

Затем эти работы были вручную с любовью доработаны Валерой и Наташей. Этот процесс включал в себя не только манипуляции с параметрами изображения, но и прорисовку дополнительных деталей и цветовых элементов, а также добавление фрагментов изображений из других сгенерированных нейросетью артефактов (это хорошо видно, например, на картине Мадонна искусственного интеллекта, см.ниже). Посмотрите, во что превратились исходные сгенерированные нейросетью изображения, показанные выше:

Мадонна искусственного интеллекта (окончательный вариант)Истукан (окончательный вариант)

Все работы, представленные на выставке, вы можете посмотреть в музее Метрополитен Черкашиных.

Соавтор или инструмент?

Давайте теперь немного порассуждаем: какую же роль в этом процессе сыграл искусственный интеллект? Является ли он просто инструментом, или все-таки мы можем считать его соавтором произведения? На этот вопрос есть разные точки зрения.

Нейросеть, конечно, не может сама создать произведение - она лишь делает заготовку, "матрицу" - в которую мы затем можем вдохнуть жизнь, "одухотворить" её, чтобы получилось законченное произведение. Но мы очень впечатлены возможностями ИИ (как мы его называем, "Иван Иваныча"), можно сказать, что он даже дал некоторый новый импульс нашему искусству.

Валера Черкашин

Действительно, мы можем рассматривать ИИ как бездушный инструмент цифрового художника, который мы сначала обучаем, а затем используем для генерации случайных комбинаций образов, подобно тому, как современный художник иногда вдохновляется случайно разбрызганными на холсте красками.

Однако, глядя на полученные выше изображения, сложно отделаться от мысли, что созданное нейросетью изображение, ещё до “одухотворения”, уже содержит в себе значительную часть эстетического смысла. И хотя создано такое изображение безусловно “бездушной” нейросетью, это не умаляет его художественного замысла и ценности.


Дмитрий Сошников
Рисование с помощью нейросети напоминает то, как ученики великого художника, научившись его стилю, создают аналогичные произведения. Например, уличный художник может создавать портреты в стиле Ван Гога, и при этом мы будем склонны считать именно такого художника автором работы, поскольку он "брал в руки краски". Точно также нейросеть "учится" стилю Ван Гога по его работам, и затем создаёт какую-то свою, случайную (или не очень), вариацию этого стиля. Если при этом человек задаёт смысл работы с помощью текстового промпта, и потом производит отбор получившихся работ - то кажется логичным считать как человека, так и ИИ соавторами работы.

Ещё одним аргументом является эмоциональный отклик, который вызывает в нас просмотр только что сгенерированных картин. Сам процесс генерации является очень увлекательным, поскольку мы с нетерпением ждём, каким же неожиданным образом ИИ интерпретирует наш запрос, и что получится в результате.

Генерация работ похожа на путешествие по картинной галерее, только эта галерея потенциально бесконечна и адаптивна, т.е. может показывать нам неограниченное количество произведений, удовлетворяющих нашим запросам. В зависимости от того, насколько подробным является запрос, мы можем делегировать ИИ большую или меньшую часть творческой работы.

Данная работа хорошо иллюстрирует процесс генерации неожиданных идей искусственным интеллектом. Изначально это изображение было получено как результат попытки нарисовать египетские пирамиды в стиле Черкашиных, однако на изображении совершенно неожиданно появилась надпись COЛА. В итоге мы взяли это изображение в работу, хотя идея существенно отличалась от той, которую мы изначально хотели передать.

Конечно, относительно авторства не всё так просто, поскольку с юридической точки зрения нейросеть не является легальным субъектом и не может претендовать на авторское право. Например, крупные научные издательства (Springer и др.) запрещают указывать генеративный ИИ в числе соавторов статей - в первую очередь потому, что нейросеть не может “нести ответственность” за сказанное. При этом использование таких инструментов при написании статей никоим образом не запрещается.

Указывать или нет нейросеть как соавтора вашей работы или как инструмент - на данный момент это ваше решение. Хорошая новость состоит в том, что нейросеть в любом случае не сможет на вас обидеться.

Эмпатия, целеполагание и “жажда творчества”

Важный момент, отличающий нейросеть от человека, состоит в отсутствии у первой каких либо эмоций и способности к сопереживанию, из-за чего нейросеть не может отличить плохую работу от хорошей (т.е. такой, которая способна вызвать у других людей эмоции). Поэтому для создания серьезных работ критически необходим процесс отбора человеком лучших вариантов из всех полученных (т.н. черри-пикинг). Этот процесс можно как-то автоматизировать на основе краудсорсинга, но вовлечение человека на этапе отбора работ кажется критически необходимым. Напомню, что мы в процессе создания выставки выбирали 3-5 работ из 200.

Второй важный аспект связан с целеполаганием, которое присуще только человеку. Только у человека есть стремление к творчеству и желание выразить определённые мысли и чувства в формате художественных артефактов. Для полной автоматизации создания работ нейросетью необходимо откуда-то получить эту начальную тему для творчества (по сути дела - текстовый запрос для генерации изображения). Здесь можно воспользоваться генератором случайных чисел для выбора из множества вариантов, но высока вероятность, что реальная интересность такой работы будет существенно ниже, чем если бы раскрываемую проблему и идею определил бы человек.

Эти две причины приводят к тому, что создание эмоционально и интеллектуально вовлекающих элементов искусства без участия человека пока невозможно. Однако совместная работа человека с искусственным интеллектом открывает множество потенциально интересных путей развития современного искусства, по которым нам ещё предстоит пройти…

Диалоги и обсуждения