Slovník
Difúzny model
Difúzny model je generatívna AI, ktorá krok za krokom premieňa náhodný šum na obraz.
Difúzny model je druh generatívnej umelej inteligencie, ktorá vytvára obraz tak, že začína od náhodného vizuálneho šumu a postupne ho zjemňuje do súdržného obrázka. Učí sa štúdiom miliónov obrázkov a toho, ako sa rozkladajú na šum, a potom tento proces obracia: v každom kroku odoberie trochu šumu a pridá trochu štruktúry, pomaly odhaľujúc hotový návrh, ktorý zodpovedá tomu, čo sa žiadalo. Predstavte si to ako sochára odkrývajúceho tvar vnútri kvádra mramoru, len tým mramorom je zrnitý náhodný obraz a usmernenie prichádza z textového opisu alebo referenčného obrázka. Pre niekoho, kto plánuje tetovanie, je toto motorom, ktorý umožňuje moderné AI umenie. Nástroje ako Design Forge od wizard.tattoo používajú difúzne modely na preklad nápadu, napríklad frázy alebo skice, do vyleštenej tetovacej koncepcie, ktorú si môžete preštudovať, upraviť a predstaviť pred záväzkom k atramentu. Keďže model pracuje iteratívne, môžete často ovplyvniť, ako presne sleduje vaše formulácie, koľko tvorivej slobody si vezme a aký detailný je výsledok. Pochopenie, že výstup vyrastá z usmerneného šumu, pomáha vysvetliť, prečo dva pokusy o tú istú myšlienku môžu vyzerať odlišne.