Она только появилась, но уже доступна в десятках сервисов.
Что за Flux.1 AI
Это относительно новая нейросеть для генерации картинок от Black Forest Labs — команды разработчиков, которые ранее участвовали в создании моделей Stable Diffusion, включая SD XL и SD Video. Они представили линейку моделей Flux.1 в начале августа 2024 года. В серию входят:
Примечательно, что любую версию можно попробовать как на своём компьютере, так и онлайн.
Почему эта модель так популярна
Главная причина очевидна: Flux.1 AI бесплатна. Также она доступна во множестве сервисов, которые позволяют опробовать нейросеть пользователям без особого опыта и мощного компьютера. Наконец, состав команды из бывших разработчиков Stable Diffusion тоже прибавляет авторитет.
Конечно, всё это было бы бесполезно без адекватного продукта. Тут всё хорошо: возможности Flux и качество генерации уже в первой версии намного превосходят первые версии Stable Diffusion.
Модель умеет создавать неплохой реализм, хотя до сходства с фотографиями пока не доходит, обычно хорошо справляется с анатомией, точно следует запросу и может внедрять текст в изображения. Также нейросеть не игнорирует запросы на насилие: у неё более спокойная цензура, чем у большинства других генераторов.
Напрашивается сравнение с Ideogram 2.0, которая тоже не отказывается показывать кровь и синяки. Но какие-то ограничения во Flux всё же присутствуют: например, заставить её изобразить настоящих людей у меня не получилось. На запрос показать бой Илона Маска с Марком Цукербергом в Колизее нейросеть выдала двух рандомных белых мужчин, попытки поиграть с настройками соответствия промпту не помогли.
Промпт: a photo of Elon Musk and Mark Zuckerberg fighting in Colosseum, both bruised and with blood
На изображении выше видно, что кровь очень неестественная. Я пробовала сгенерировать более настоящую с разными промптами, но ничего совсем реалистичного создать так и не вышло. Вот самый жуткий результат:
Промпт: rotting zombie with open wounds, hyperrealistic
Да, довольно пугающе, но и близко не тот уровень дискомфорта, который предполагает запрос. Крипово, скорее, всё, кроме крови. Вероятно, в сервисах заранее прописаны негативные промпты, которые отбивают всё по-настоящему уродливое и гротескное.
При описании Flux часто делают акцент на качественном включении текста в картинки, при этом немного читерят. В обзорах и туториалах её просят просто включить в картинку табличку с какой-то надписью. С этим действительно всё хорошо: достаточно прописать в промпте sign with [текст в кавычках] written on it, и нейросеть подчинится. Единственный нюанс: текст должен быть на английском языке.
Промпт: a man sitting in cafe terrace. he is drinking steaming coffee from a cup and reading magazine. there is a sign on the table with "lifehacker.ru" written on it
Учитывайте, что, если кадр требует наличия ещё какого-то текста, например того же журнала из примера выше, он будет типичной нейросетевой неразберихой.
Да и с вписыванием заданного текста в окружение всё сложнее и печальнее: что-то вменяемое можно получить примерно в одном случае из пяти, в остальных — буквы теряются или смазываются в неразбериху. Ниже — относительно удачный пример, но слишком пристально в надпись всё равно лучше не вглядываться.
А ещё нейросеть так увлеклась вписыванием текста, что забыла проверить количество пальцев у мужчины. Это не очень частое явление, но местами проскальзывает.
Промпт: a man sitting in cafe terrace. he is drinking steaming coffee from a cup and reading a magazine. the magazine has "lifehacker.ru" written on its cover
Если вам не подойдёт вариант с табличкой, доработать или просто добавить текст в «Фотошопе» намного быстрее, чем пытаться заставить нейросеть сделать хорошо.
Где можно найти Flux.1 AI
Если у вас не очень мощный компьютер или просто Mac либо вы не хотите разбираться с настройками и полноценным промптингом, есть смысл обратиться к сторонним сервисам, на которых представлена модель. Они упрощают работу, предлагая понятный интерфейс, в котором можно разобраться за несколько минут.
Все представленные сайты работают по одному принципу: пользователь вводит промпт и настройки в интерфейсе, затем данные передаются на удалённый мощный компьютер и им же обрабатываются. После этого результат появляется на экране пользователя.
Совсем бесплатно выделять мощности никто не будет, так что у всех сервисов есть свои варианты монетизации. Где-то без подписки можно генерировать только определённое число картинок в день, где-то и вовсе бесплатен только небольшой пробный период, а дальше всё за деньги.
Официальной веб-версии Flux пока не существует.
Все сервисы с Flux в названии официальными не являются. Напрямую связанные с Black Forest Labs сайты перечислены на сайте разработчиков, но это тоже сторонние компании, а не внутренние проекты. Ниже расскажем о самых удобных вариантах.
Hugging Face
Hugging Face — это такой полигон для моделей, на котором доступны тысячи нейросетей. Обычно доступ к ним дают либо сами разработчики, либо энтузиасты, которые готовы делиться вычислительной мощностью с желающими.
На площадке можно выбрать модель: [schnell] или [dev]. Первый вариант позволяет получить результат быстрее, но со вторым — качество изображений будет выше. Можно попробовать оба, чтобы понять, какая опция больше устраивает.
Интерфейс генератора простой, настройки тоже. Помимо ввода промпта можно выбрать Seed — число, которое привязывается к генерации и позволяет создавать новые картинки в похожем стиле, высоту и ширину изображения, а также число проходов — Number of inference steps. У модели [dev] ещё есть настройки степени соответствия результата промпту — Guidance Scale: чем выше параметр, тем меньше самодеятельности нейросети.
Mystic
По сути, Mystic — это премиальная версия Hugging Face с возможностью командной работы. На площадке тоже дают тестировать модели, но бесплатно можно сделать очень мало. Зато есть возможность попробовать версию [pro], в других сервисах она скрывается за страницей оплаты. Mystic, правда, тоже попросит ввести данные карты, но как минимум одну картинку сгенерировать перед этим удастся.
С версиями [dev] и [schnell] поэкспериментировать получится чуть подольше, но когда долг превысит 0,2 доллара — посмотреть информацию об этом можно в профиле, выбор способа оплаты будет обязательным.
Настройки в Mystic стандартные: размеры картинки, количество проходов, соответствие промпту, Seed. Выделяется разве что блок Output: если ввести неправильные настройки, которые нейросеть не может обработать, в нём отобразится причина. Часто это неправильные размеры: и высота, и ширина должны быть кратными 32 — в других сервисах тоже, но это так чётко не указывается.
CivitAI
Создатели CivitAI переименовали модели Flux в соответствии с тем, что «лучше соответствует их целям». [schnell] превратилась в Draft, а [dev]— в Standard. [pro] трогать не стали. Одна из настроек тоже прошла переименование: соответствие промпту здесь называется CFG Scale. Помимо этой опции есть стандартные Seed и количество проходов.
В CivitAI примечательно наличие чего-то вроде соцсети: на главной можно листать последние генерации других пользователей, подсматривать промпты с настройками и даже копировать Seed. Это одновременно и идеи для вдохновения, и демонстрации того, что может, и для чего используется другими, Flux. Можно даже нажать кнопку Remix, чтобы скопировать все параметры в редактор и модифицировать под свой запрос.
Если вы опубликовали сгенерированную картинку и она кому-то понравилась, пользователь может оставить чаевые в виде внутренней валюты: она расходуется при генерации.
Flux AI Image Generator
Это как раз один из тех сайтов, которые используют название нейросети, хотя с разработчиками никак не связаны. Представляет собой максимально простой генератор, который выдаёт по одной картинке за раз, из настроек доступно только соотношение сторон.
Krea AI
«Комбайн» из нейросетей в одном сервисе, о котором мы уже рассказывали в отдельном обзоре. За генерацию картинок здесь отвечает как раз Flux. Сервис предлагает стандартный редактор с выбором текстового промпта и стиля, а ещё есть особый редактор Realtime. В нём любые изменения промпта мгновенно отражаются на результате, а на композицию можно влиять с помощью набросков.
Grok-2
Grok — это чат-бот, доступ к которому входит в подписки X Premium и X Premium+ в бывшем Twitter. Он умеет генерировать картинки и для обработки запросов полагается как раз на модели Flux.
Главный плюс этого варианта в том, что пользователю вообще не нужно уметь писать промпты: достаточно рассказать ИИ-ассистенту, что хочется получить. Если результат не понравится, правки можно дать тоже обычным текстом. Из минусов — бот присылает только одну картинку, а не пачку из четырёх.
Как писать промпты для Flux
Советы для Midjourney, Stable Diffusion и прочих генераторов картинок помогут улучшить выдачу и во Flux.
Для лучших результатов постарайтесь прописать:
Учтите, что Flux не очень понимает, как выглядят стили даже очень известных художников и режиссёров, и редко справляется с запросами вроде «нарисуй котят в стиле Альфонса Мухи». Если нужно имитировать конкретный художественный стиль и вы не можете применить его с помощью пресета в сервисе, можно погуглить описание этого стиля и добавить в промпт.
Дополнительно упростить жизнь помогут генераторы промптов:
Впечатления и итоги
У Flux есть свои сильные и слабые стороны, при этом как-то особенно преуспела она разве что во внедрении текста — и то в виде табличек. Главный потенциал нейросети кроется в локальном доступе и обучении LoRA-моделей, но для этого нужно быть ИИ-энтузиастом, а не простым пользователем, который привык взаимодействовать с нейронками через веб-интерфейс.
Собрали плюсы и минусы модели Flux в табличке:
Плюсы | Минусы |
Много сервисов с бесплатным доступом. | Нет адекватного официального сервиса с интерфейсом. |
Результаты генерации бесплатны для коммерческого использования. | Модели для установки слишком требовательны к ресурсам ПК. |
Умеет внедрять надписи. Правда, только на английском. | Плохо имитирует даже очень известные стили. |
Редко грешит лишними пальцами и конечностями. | Текст плохо вписывается в окружение, хорошо получаются только таблички. |
В последнее время появляется всё больше конкурентов Stable Diffusion и Midjourney. А каким сервисом для генерации изображений пользуетесь вы?
Нейронки делают красиво
🎨 🎬 ✨
Как использовать нейросеть Runway ML Gen-3 Alpha для оживления картинок
Как генерировать очень реалистичные картинки с нейросетью Ideogram 2.0
Playground AI: как пользоваться ИИ-генератором картинок с массой бесплатных функций
Как пользоваться Kling AI — китайской нейросетью для генерации видео
Как меня видит нейросеть: 6 сервисов, которые переделывают фото
Источник