Как вы наверняка догадались, это я про нейросеть.
Честно скажу - были сложные чувства. С одной стороны - едва ли не единственная русско-говорящая нейронка, с весьма солидным функционалом. С другой - это ж Сбербанк!
Разве можно ждать что-то хорошего от такого небоговдохновенного заведения?
Угнетаемый таким вот когнитивным диссонансом, тестить я её не спешил - громоздкое это дело и компьютер у меня явно слабенький. Но когда вышла браузерная версия - откладывать уже некуда. Попробовал. Регистрация несложная. Сервис бесплатный (клиенты сбербанка оплачивают, хе-хе...)
Браузерная версия Кандинского называется Fusion Brain и доступна по ссылке https://fusionbrain.ai/editor/. Но здесь для простоты я буду называть её "Кандинским", потому что фактически это одно и то же. Итак, тест с шаром в воде - на уверенную четвёрочку.
Тест на пиццу - даже лучше чем у "Stable Diffusion Online" и "Сraiyon"
Если принять во внимание, что размер картинок 1024х1024, а само время генерации не больше минуты - то в целом очень даже неплохо.
Сеть имеет 18 предустановленных стилей изображения и понимает негативный промпт.
Но без сомнения - самая главная плюшка "Кандинского" - возможность пост-редактирования. Вот на этой картинке, например, у девушки слишком много пальцев (знакомое дело, да...).
Так вот тут, можно прямо указать сети на этот недочёт - стерев лишнее "ластиком" и она перерисует заново в соответствии с "пожеланиями трудящихся"
Так то лучше.
Ни одна из известных мне нейросетей такого не умеет.
Ну, с тестами, на этом покончим. Теперь впечатления от картинок.
Они тоже сложные.
Я задал тему "Горячий кофе в лесу": Девушка держит чашку с напитком и слушает музыку на закате.
Нейтральная генерация (фронт-ракурс, без эмоций) - это просто техническое качество картинки. Тут оно в режиме "Портретное фото" вполне на уровне. (Картинка не редактировалась: пальцы, провода от наушников - как есть)
Добавляем немного эмоций
Закат на время отключаем, что б не замедлять генерацию
Экспериментируем с ракурсом. Обнаруживается, что у Кандинского - это любимая фича.
Немного забегая вперёд замечу, что кадры с верхней полусферы - просто чудесны
Рекламщики это оценят.
Правда, нейросеть порой так увлекается, что забывает про законы физики (если она их знала вообще, хе-хе)
Левитация?!.. Этот кадр уже ничем не исправить, но как прикол - почему бы и нет.
Однако, продолжаем изучать эмоции. Что бы не перегружать нейросеть, убираю "лесной сюжет" с задника (руки уже сразу в перчатках, что б не париться с пальцами). Ну вот - что мы видим.
Зубы, в отличие от той же Stable diffusion, тут ровные и симметричные. А вот с глазами (зрачкам) будут проблемы. Имейте это ввиду.
Ладно. Возвращаюсь к исходному заданию. Глаза пока убираем. Пусть девушка станет в профиль
Возвращаем контровый свет. Ну, что же... по крайне мере, кофе тут реально горячий. К слову сказать, аналогичный тест нейросеть Stable Diffusion выполнила, что называется "без царя в голове"
Тут барышня и будущее всё своё отморозит, и всё своё прошлое нафик пропьёт. И не говорите мне про "трудности перевода".
Хотя, если очень хорошо попросить, экстремальных гражданок Кандинский тоже умеет
Но выполнены они , скажем так - без фанатизма.
Экстерьер и эмоции - хорошо управляются.
Фактура, даже если довести до предела - остаётся корректной.
В целом, генерации от Кандинского выглядят вполне жизнеспособными. Но есть нюанс. Посмотрите на девушку с кофе от Stable Diffusion
Сразу видно: прежде чем двинуться в лес, барышня пробежалась по люксовым бутикам и наведалась к визажисту. Мне, конечно же нравятся красивые ухоженные женщины, но лес - это таки лес.
В лесу на морозе нос должен слегка покраснеть, и на щеках появиться румянц. Кандинский это знает.
А Stable Diffusion - упорно тупит глянцевое промо-фото.
Справедливости ради, "постановочными" выглядят результаты работы обеих нейростетей.
Кандинский наседает на "натурализм" фактуры , хотя свет у него зачастую неуместно "студийный".
Для Stable Diffusion главное "лакшери" во всём
Но реально правдоподобным в таком "люксовом" кадре выглядит только свет.
Моё личное ИМХО: хороши обе сети , каждая - для своих задач. Ну ещё Кандинский при полной бесплатности доступа шевелится быстрее, что так же не может не радовать. И модельки у него - так и пышат здоровьем, когда держат сразу по два бокала в одной руке.
И даже чайник с двумя носиками.
В общем, пробуйте, делитесь впечатлениями.
The picture is clickable for high resolution
. . . . . . . . .
All images shown here
generated by the Neural Network
Fusion Brain
The generation prompt was written by
the author of the post.
Number of iterations 100
Image not edited
. .