SDXL 1.0 – Нова модель від Stability AI

Stability AI презентувала SDXL 1.0 – нову версію генеративної моделі для створення зображень з тексту. SDXL 1.0 – це одна з найкращих відкритих моделей для генерації зображень. Вона здатна створювати зображення в різних стилях мистецтва, надаючи яскравість та фотореалізм. Також SDXL 1.0 розуміє нюанси мови та пропонує можливість легкої настройки.

Я спробував цю модель і перевірив можливість вибору стилю зображення за ім’ям художника. Ось, що з цього вийшло.

За аналогією з відомим 500 Rabbits SDXL Edition, з допомогою SDXL 1.0 я згенерував 13 зображень гуманоїдного кота, що п’є каву в кав’ярні у стилі різних художників.

a humanoid cat drinking coffee at a coffee shop, art by Akihito Tsukushi
У стилі Akihito Tsukushi.
a humanoid cat drinking coffee at a coffee shop, art by Alfredo Volpi
У стилі Alfredo Volpi.
a humanoid cat drinking coffee at a coffee shop, art by Clive Barker
У стилі Clive Barker.
a humanoid cat drinking coffee at a coffee shop, art by David Hockney
У стилі David Hockney.
a humanoid cat drinking coffee at a coffee shop, art by Dorothea Tanning
У стилі Dorothea Tanning.
a humanoid cat drinking coffee at a coffee shop, art by Earl Norem
У стилі Earl Norem.
a humanoid cat drinking coffee at a coffee shop, art by Ed Mell
У стилі Ed Mell.
a humanoid cat drinking coffee at a coffee shop, art by Filippo Lippi
У стилі Filippo Lippi.
a humanoid cat drinking coffee at a coffee shop, art by Gaston Bussiere
У стилі Gaston Bussiere.
a humanoid cat drinking coffee at a coffee shop, art by Gregory Crewdson
У стилі Gregory Crewdson.
a humanoid cat drinking coffee at a coffee shop, art by Hieronymus Bosch
У стилі Hieronymus Bosch.
a humanoid cat drinking coffee at a coffee shop, art by Hokusai
У стилі Katsushika Hokusai.
a humanoid cat drinking coffee at a coffee shop, art by J.C. Leyendecker
У стилі J.C. Leyendecker.

У результаті бачимо, що навіть з невеликим і простим prompt’ом отримуємо доволі непогані результати. У порівнянні зі старою моделлю SD 1.5, нова SDXL 1.0 покращила анатомію та відображення кольорів при генерації зображень.

Хотілось би зауважити, що для генерації інших зображень у моєму блозі я використовував кастомні моделі від спільноти civitai. У порівнянні із ними збільшився час генерації зображень. При використанні моделей від спільноти для генерації зображень роздільною здатністю 768×1024 пікселі йшло в середньому 6-12 хвилин. В SDXL при подібних параметрах на генерацію зображення йшло в основному 20 хвилин. Хоча, в залежності від імені автора, яке використовувалось у prompt’і для досягнення потрібного стилю, час міг варіюватись.

Параметри генерації:

Prompt: a humanoid cat drinking coffee at a coffee shop, art by [ім’я автора]
Steps: 20, Sampler: Euler a, CFG scale: 7, Size: 768×1024, Model hash: 31e35c80fc, Model: sd_xl_base_1.0, Version: v1.6

https://stability.ai/stable-diffusion

https://civitai.com/


Опубліковано

у

,

від

Коментарі

Залишити відповідь

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *