SDXL 1.0 – Нова модель від Stability AI

Stability AI презентувала SDXL 1.0 – нову версію генеративної моделі для створення зображень з тексту. SDXL 1.0 – це одна з найкращих відкритих моделей для генерації зображень. Вона здатна створювати зображення в різних стилях мистецтва, надаючи яскравість та фотореалізм. Також SDXL 1.0 розуміє нюанси мови та пропонує можливість легкої настройки.

Я спробував цю модель і перевірив можливість вибору стилю зображення за ім’ям художника. Ось, що з цього вийшло.

За аналогією з відомим 500 Rabbits SDXL Edition, з допомогою SDXL 1.0 я згенерував 13 зображень гуманоїдного кота, що п’є каву в кав’ярні у стилі різних художників.

a humanoid cat drinking coffee at a coffee shop, art by Akihito Tsukushi — У стилі Akihito Tsukushi.

a humanoid cat drinking coffee at a coffee shop, art by Alfredo Volpi — У стилі Alfredo Volpi.

a humanoid cat drinking coffee at a coffee shop, art by Clive Barker — У стилі Clive Barker.

a humanoid cat drinking coffee at a coffee shop, art by David Hockney — У стилі David Hockney.

a humanoid cat drinking coffee at a coffee shop, art by Dorothea Tanning — У стилі Dorothea Tanning.

a humanoid cat drinking coffee at a coffee shop, art by Earl Norem — У стилі Earl Norem.

a humanoid cat drinking coffee at a coffee shop, art by Ed Mell — У стилі Ed Mell.

a humanoid cat drinking coffee at a coffee shop, art by Filippo Lippi — У стилі Filippo Lippi.

a humanoid cat drinking coffee at a coffee shop, art by Gaston Bussiere — У стилі Gaston Bussiere.

a humanoid cat drinking coffee at a coffee shop, art by Gregory Crewdson — У стилі Gregory Crewdson.

a humanoid cat drinking coffee at a coffee shop, art by Hieronymus Bosch — У стилі Hieronymus Bosch.

a humanoid cat drinking coffee at a coffee shop, art by Hokusai — У стилі *Katsushika Hokusai*.

a humanoid cat drinking coffee at a coffee shop, art by J.C. Leyendecker — У стилі J.C. Leyendecker.

У результаті бачимо, що навіть з невеликим і простим prompt’ом отримуємо доволі непогані результати. У порівнянні зі старою моделлю SD 1.5, нова SDXL 1.0 покращила анатомію та відображення кольорів при генерації зображень.

Хотілось би зауважити, що для генерації інших зображень у моєму блозі я використовував кастомні моделі від спільноти civitai. У порівнянні із ними збільшився час генерації зображень. При використанні моделей від спільноти для генерації зображень роздільною здатністю 768×1024 пікселі йшло в середньому 6-12 хвилин. В SDXL при подібних параметрах на генерацію зображення йшло в основному 20 хвилин. Хоча, в залежності від імені автора, яке використовувалось у prompt’і для досягнення потрібного стилю, час міг варіюватись.

Параметри генерації:

Prompt: a humanoid cat drinking coffee at a coffee shop, art by [ім’я автора]
Steps: 20, Sampler: Euler a, CFG scale: 7, Size: 768×1024, Model hash: 31e35c80fc, Model: sd_xl_base_1.0, Version: v1.6

https://stability.ai/stable-diffusion

https://civitai.com/

SDXL 1.0 – Нова модель від Stability AI

Коментарі

Залишити відповідь Скасувати коментар