Słownik
Model dyfuzyjny
Model dyfuzyjny to generatywna AI, która krok po kroku zamienia losowy szum w obraz.
Model dyfuzyjny to rodzaj generatywnej sztucznej inteligencji, która tworzy obraz, zaczynając od losowego szumu wizualnego i stopniowo dopracowując go w spójny obraz. Uczy się, studiując miliony obrazów oraz to, jak rozpadają się one w szum, a potem odwraca ten proces: na każdym kroku usuwa odrobinę szumu i dodaje odrobinę struktury, powoli odsłaniając gotowy projekt zgodny z tym, o co poproszono. Wyobraź to sobie jak rzeźbiarza odsłaniającego kształt wewnątrz bloku marmuru, z tą różnicą, że marmurem są ziarniste losowe piksele, a wskazówka pochodzi z opisu tekstowego lub obrazu referencyjnego. Dla osoby planującej tatuaż to właśnie silnik, który umożliwia nowoczesną sztukę AI. Narzędzia takie jak Design Forge w wizard.tattoo używają modeli dyfuzyjnych, by przełożyć pomysł, na przykład frazę lub szkic, na dopracowaną koncepcję tatuażu, którą można przestudiować, dostosować i zwizualizować przed zdecydowaniem się na tusz. Ponieważ model pracuje iteracyjnie, często możesz wpłynąć na to, jak ściśle podąża za twoim sformułowaniem, ile swobody twórczej sobie pozwala i jak szczegółowy staje się rezultat. Zrozumienie, że wynik wyrasta z kierowanego szumu, pomaga wyjaśnić, czemu dwie próby tego samego pomysłu mogą wyglądać inaczej.