Глоссарий
Диффузионная модель
Диффузионная модель — это генеративный ИИ, пошагово превращающий случайный шум в изображение.
Диффузионная модель — это тип генеративного искусственного интеллекта, создающий изображение, начиная со случайного визуального шума и постепенно уточняя его в связную картину. Она учится, изучая миллионы изображений и то, как они распадаются в помехи, затем обращает этот процесс: на каждом шаге она убирает немного шума и добавляет немного структуры, медленно проявляя готовый рисунок, соответствующий запросу. Представьте это как скульптора, открывающего форму внутри глыбы мрамора, только мрамор — это зернистые случайные пиксели, а направление исходит из текстового описания или референсного изображения. Для того, кто планирует татуировку, это движок, делающий возможным современное ИИ-искусство. Инструменты вроде Design Forge от wizard.tattoo используют диффузионные модели, чтобы перевести идею, например фразу или набросок, в отполированный тату-замысел, который можно изучить, скорректировать и визуализировать до того, как решиться на краску. Поскольку модель работает итеративно, вы часто можете влиять на то, насколько точно она следует вашей формулировке, сколько творческой свободы берёт и насколько детальным становится результат. Понимание того, что результат вырастает из направляемого шума, помогает объяснить, почему две попытки с одной идеей могут выглядеть по-разному и почему небольшие изменения формулировки могут существенно переформировать искусство, которое вы видите.