Нейрокомикс от Family Agency: люди в черных очках
Family Agency на рынке digital уже более 12 лет, и главным символом компании с самого начала были очки, обозначающие экспертизу. При создании комикса креативная команда задалась вопросом: как использовать символ очков, чтобы донести простую идею — агентство помогает клиенту найти креативное и эффективное решение задачи, тем самым делая мир вокруг нас лучше. Так и появились «‎Люди в черных очках»‎.
Матвей Менжевицкий, стратег Family Agency:
В основе комикса простая идея — используйте креативный подход и дружите с нейросетями. Нам понадобился один креативный штурм, чтобы придумать базовую историю про агентов, использующих очки в своих заданиях. Мы выбрали стилистику секретного агентства, взяв за референс «‎Люди в черном»‎, но в нашем случае мы спасаем мир не от пришельцев, а от банальных решений. Далее мы подключили GPT и дали ТЗ на развитие этой идеи в рамках сюжета комикса, получив в итоге историю про общество, которое отвергает ИИ, вместо того, чтобы найти к нему подход (возможно GPT нам на что-то намекает). После мы доработали полученный результат и отдали в раскадровку и генерацию изображений. В общей сложности на сценарий мы потратили около 4 часов.
Захар Башта, креатор Family Agency:
Наше агентство стабильно использует разные нейросетки с прошедшего декабря. Как только вышел ChatGPT, мы побежали его тестировать, развлекаться и искать способы применения. Когда выходили новые версии MidJourney, мы сразу заходили в Discord и скидывали друг другу первые генерации, которые у нас выходили. В итоге это увлечение нескольких сотрудников привело к созданию общего чата нейро–энтузиастов нашего агентства. Впоследствии мы стали проводить воркшопы по использованию нейросетей, обучая как наших сотрудников, так и клиентов.
Однако с нейросетями часто случается, что идея классная, да и инструмент мощный, а реализация не дотягивает. Выполнять задачи полностью в ИИ пока не выходит. Комикс, в этом смысле, оказался идеальным проектом.
Люди в черных очках Как новые фичи Midjourney выручили дизайнеров
Мы поставили себе задачу минимизировать участие человека в создании комикса, что у нас вышло на 90%. На 15-ти минутном звонке определили общую идею, которую мы хотим донести и дальше пошли работать с ChatGPT. На следующий день появился готовый сценарий, разбитый на иллюстрации. Тут мы столкнулись с чередой проблем:
во-первых, сложно делать персонажей узнаваемыми. Генерации различаются между собой; во-вторых, некоторые сюжетные повороты, которые мы хотели показать, требуют большой детализированности на изображении, а MidJourney сложно удерживать «много подробностей в голове».
Для упрощения работы, мы сделали раскадровку, чтобы заранее убедиться, что мы как минимум теоретически представляем, как решить поставленные задачи. Началась генерация.
Проблему с персонажами мы решили просто: дали каждому из них набор узнаваемых характеристик. Например, главный герой у нас всегда должен быть красноволосым, в черных солнцезащитных очках и кожаной куртке. Теперь как бы мы его не генерили, общий «вайб» узнавался всегда. То же самое проделали с каждым героем.
Стиль подбирался быстро. Открыли MidJourney и прокрутили несколько понравившихся нам кадров из комиксов через команду describe, которая описывает изображения «глазами» MJ (MidJourney). Посмотрели, на какие ключевые слова реагирует нейронка, из них сформировали ту часть промпта, которая отвечала за стиль: comics made by Brian Bolland, in the style of manga-inspired dynamic graphic novel.
Но что делать, если на изображении, например, нужна четко проработанная комната и четко проработанный персонаж? Мы уже почти решились использовать фотошоп и делать все ручками, как тут MJ выкатили новую фичу: zoom out. А через неделю еще и Pan.
Это открыло новые способы повествования. Но главное, это позволило генерить вещи на одном изображении, используя несколько промптов. Сначала делаете комнату, потом слева с помощью Pan добавляете человека, меняя промпт с помощью Remix Mode. Звучит сложно, но по факту это одна из самых эффективных манипуляций с промптингом в MJ. Один раз выучите порядок — больше не запутаетесь.
Неудачные примерыКонечно, MJ часто косячила. То бороду не дорисует, то ноги как у кузнечика. Тут на помощь выходил Adobe Generative Fill. Им мы делали финальные косметические правки в сценах. Хотя одну забавную пасхалку в первой сцене оставили (присмотритесь к пальцам доктора).
Примеры промтов:
epic shot from ground level of a red-haired man and a woman in black glasses and black leather jackets, comics made by Brian Bolland, in the style of manga-inspired dynamic graphic novel --ar 3:4 --s 200 --v 5.2 --style raw
sideview of a man in white coat with long black hair and beard standing on white bg, comics made by Brian Bolland, in the style of manga-inspired dynamic graphic novel--ar 3:4
Пример ошибки MidJourney/несоответствия промту:
closed door, smoke coming from under it, comics made by Brian Bolland, in the style of manga-inspired dynamic graphic novel --ar 3:4
Иногда MJ отходит от поставленной задачи, создавая чем-то схожую картинку, но добавляя/изменяя отдельные элементы. К примеру, здесь мы хотели получить закрытую дверь, из под которой идет дым. А MidJourney сгенерила сюрреалистичную картину с открытой дверью. Это решается пересборкой промта, когда мы меняем слова местами или подбираем синонимы.
Помимо генеративных нейронок также использовали сервис PixelBin для апскейла изображений, и чтобы быстро вырезать некоторые элементы с изображений для дальнейшего совмещения в фотошопе. Функция «вырезать фон» в фотошопе работает значительно хуже на сегодняшний день.
За время создания комикса мы окончательно убедились в том, как важно искать новые пути применения ИИ. Также важно помнить, что основная задача нейронок — оптимизация процессов, а не выполнение работы «за вас». Креативное участие человека все еще необходимо, и, надеемся, будет необходимо и дальше. В любом случае нам приходилось верстать, выделять некоторые элементы на изображении и добавлять текст в фотошопе вручную, чтобы получить полноценный комикс.