Stability AI презентувала SDXL 1.0 – нову версію генеративної моделі для створення зображень з тексту. SDXL 1.0 – це одна з найкращих відкритих моделей для генерації зображень. Вона здатна створювати зображення в різних стилях мистецтва, надаючи яскравість та фотореалізм. Також SDXL 1.0 розуміє нюанси мови та пропонує можливість легкої настройки.
Я спробував цю модель і перевірив можливість вибору стилю зображення за ім’ям художника. Ось, що з цього вийшло.
За аналогією з відомим 500 Rabbits SDXL Edition, з допомогою SDXL 1.0 я згенерував 13 зображень гуманоїдного кота, що п’є каву в кав’ярні у стилі різних художників.
У результаті бачимо, що навіть з невеликим і простим prompt’ом отримуємо доволі непогані результати. У порівнянні зі старою моделлю SD 1.5, нова SDXL 1.0 покращила анатомію та відображення кольорів при генерації зображень.
Хотілось би зауважити, що для генерації інших зображень у моєму блозі я використовував кастомні моделі від спільноти civitai. У порівнянні із ними збільшився час генерації зображень. При використанні моделей від спільноти для генерації зображень роздільною здатністю 768×1024 пікселі йшло в середньому 6-12 хвилин. В SDXL при подібних параметрах на генерацію зображення йшло в основному 20 хвилин. Хоча, в залежності від імені автора, яке використовувалось у prompt’і для досягнення потрібного стилю, час міг варіюватись.
Параметри генерації:
Prompt: a humanoid cat drinking coffee at a coffee shop, art by [ім’я автора]
Steps: 20, Sampler: Euler a, CFG scale: 7, Size: 768×1024, Model hash: 31e35c80fc, Model: sd_xl_base_1.0, Version: v1.6
Залишити відповідь