AI TATTOO GENERATION

Yapay zeka dövme oluşturucular nasıl çalışır

Bir YZ dövme oluşturucu, dövme görsellerine ince ayar yapılmış bir difüzyon modelidir. İsteminizi okur, birçok adımda rastgele bir gürültü alanını giderir ve eğitim sırasında öğrendiği kalıplardan şekillenmiş özgün çizimler üretir.

wizard.tattoo ekibi · · 5 dk okuma

Yapay zekâ yardımıyla taslağı hazırlandı ve yayımlanmadan önce wizard.tattoo editöryel ekibi tarafından incelendi.

Tipik bir YZ dövme oluşturucuya hangi model mimarisi güç sağlar?

Çoğu dövme oluşturucu, dövme sanatına ince ayar yapılmış bir gizli difüzyon modeli çalıştırır. Bir metin kodlayıcı istemizi vektörlere dönüştürür, bir U-Net birkaç adımda gizli bir görüntüdeki gürültüyü giderir ve bir çözücü nihai gizliyi görünür bir tasarıma dönüştürür.

Bugün baskın olan mimari gizli difüzyondur — Stable Diffusion, SDXL, Midjourney'nin son sürümleri ve dövmeye özgü çoğu fork'un temelini oluşturan aynı aile. «Gizli» kelimesi kilit önemdedir: model tam piksel çözünürlüğünde gürültü gidermek yerine boyutun yaklaşık onda biri olan sıkıştırılmış bir temsil içinde çalışır; bu nedenle üretim dakikalar yerine saniyeler içinde tamamlanır. Üç bileşen önemlidir. Bir metin kodlayıcı (genellikle CLIP veya T5 çeşidi) yazılı isteminizi anlam yakalayan yüksek boyutlu vektörlere eşler. Bir U-Net, her adımda bu metin vektörü tarafından koşullandırılarak gerçek gürültü giderme işlemini yapar. Değişken otomatik kodlayıcı çözücü nihai gizliyi görünür görüntüye geri genişletir. Dövmeye özgü kısım ince ayar sırasında gerçekleşir. Açık interneti görmüş temel model; flash sayfalar, iyileşmiş dövme fotoğrafları, çizgi sanatı, şablonlar gibi seçilmiş dövme sanatı külliyatı üzerinde ek eğitimden geçirilir ve ağın ağırlıkları dövmelerin görsel gramerini öğrenene kadar bu süreç devam eder. Bunun pratik sonucu, «single needle» ya da «American traditional» ne anlama geldiğini siz yazılı istem yazmadan önce aracın zaten anlamasıdır.

Araç bir metin istemini dövme tasarımına nasıl çevirir?

İsteminiz belirteç haline getirilir, vektöre gömülür ve her gürültü giderme adımında U-Net'e koşullama olarak beslenir. Model saf gürültüden başlar ve istemin vektörüyle örtüşmeyen parçaları yinelemeli olarak kaldırarak geriye örtüşen bir görüntü bırakır.

Kelimelerden görüntüye çeviri bir geri alma işlemi değildir. Model, isteminizle örtüşen şeyler için dövme veritabanı aramaz; eğitim sırasında özümsediği istatistiksel kalıplar tarafından yönlendirilerek daha önce hiç var olmamış bir görüntü üretir. Bu ayrım hem güçlü yanları (özgünlük, sonsuz çeşitlilik) hem de zayıf yanlı (nadir anatomi hataları, istemden sapma) açıklar. Mekanik olarak istem, alt sözcük birimlerine bölen bir belirteçleyiciden geçer; ardından anlam yakalayan vektör dizileri üreten metin kodlayıcıdan geçer. «Bir turna, ince çizgi, negatif alan» — «turna» uzun boyunlu diğer kuşların yakınına, «ince çizgi» minimalist diğer stillerin yakınına, «negatif alan» kasıtlı boşluğa sahip kompozisyonlara doğru çeken koordinatlar haline gelir. Sınıflandırıcısız rehberlik, modelin isteminizi ne kadar kelimesi kelimesine yorumladığını kontrol eden kol. Düşük rehberlik daha yumuşak, daha yaratıcı yorumlar üretir; yüksek rehberlik istemin sıkı biçimde takibini zorlar. Tohum — tek bir tamsayı — başlangıç gürültü alanını belirler; aynı istem ve aynı tohum aynı görüntüyü üretir.

Fotoğraf girişi deriye duyarlı üretimde ne rol oynar?

Fotoğraf girişi modelin gerçek anatomini koşullayabilmesini sağlar. Görüntü istemle birlikte kodlanır; böylece üretim vücut bölümünün eğrilerini, ölçeğini ve yerleşimini dikkate alır — düz bir tasarım üretip sonradan deri üzerine uyarlamak yerine.

Salt metin-görüntü üretimi beyaz arka planda yüzen bir tasarım üretir. Ne istediğinizi seçmek için bu yeterlidir; ancak gerçek bir dövmenin sahip olduğu en önemli kısıtı göz ardı eder: üzerinde durduğu vücut. Deri kavisli, asimetrik ve üç boyutludur. Kare PNG olarak dengeli görünen bir kompozisyon, kolun etrafını sarıp kavramak ya da köprücük kemiğinin hattını takip ettiğinde eğri görünebilir. Fotoğraf koşullu üretim bu boşluğu kapatır. Arka planda sistem, fotoğrafınızdaki bilgileri difüzyon sürecine enjekte etmek için tekniklerden birini kullanır: ControlNet, IP-Adapter, derinlik koşullandırması veya düşük gürültü giderme güçlü img2img. Model kolunuzun konturunu, sırtınızın kas tanımını, kaburgalarınızın eğimini okuyabilir ve tasarımı buna göre uyarlayabilir. Fotoğraf girişinin ikinci kullanımı sanal deneme: modeli koşullandırmak yerine sistem perspektif düzeltmesi, opaklık eşleştirmesi ve gölge işlemiyle bitmiş bir tasarımı fotoğrafınıza bileştirir. Böylece randevu ayırtmadan önce dövmenin nasıl görüneceğini görebilirsiniz.

YZ dövme üretimi insan sanatçıların neresinde hâlâ geride kalır?

YZ fikir üretiminde mükemmel, bitirme işinde zayıftır. Sıkı simetri, yüzler, eller, metin ve bir tasarımın nasıl yaşlanacağı, nedbe bırakacağı ve küçük boyutlarda nasıl okunacağına dair pratik kararla mücadele eder — yetkin bir insan sanatçının içgüdüsel olarak yönettiği tüm şeyler.

Dürüst yanıt şudur: YZ bitirici olmaktan çok beyin fırtınası ortağıdır. Yönleri keşfetmede, çeşitleri oluşturmada ve aynı fikrin yüz farklı versiyonunu size göstermede herhangi bir insandan daha hızlıdır. Bu, dövme tasarlama sürecinin erken aşamasını kökten değiştirir. Ancak «iyi oluşturulmuş görüntü» ile «iyi dövme» arasındaki uçurum gerçektir. Simetri ilk sorundur. Difüzyon modelleri olasılıksal olup sol gözün sağ gözle eşleştiğini, iki çiçek sapının düzgünce aynalamasını veya bir mandalanın on iki sektörünün özdeş olmasını zorlamaz. Daha derin sınır ise yargıdır. Difüzyon modeli hiç dövme iyileşmesi izlemedi. Parmak kenarındaki çok ince çizgilerin iki yıl içinde bulanıklaşacağını, beyaz mürekkep solmasının güneşte gerçekleştiğini, üç santimetredeki sıkıca paketlenmiş bir tasarımın mürekkep yayılmasından tüm ayrıntısını kaybedeceğini ya da sırt parçasının vücudun hareket biçimini göz önünde bulundurması gerektiğini bilmez. Bunlar bir dövme sanatçısının anında söyleyeceği şeylerdir. Oluşturmak, yinelemek ve görseli doğrulamak için YZ kullanın; ardından dosyayı derinin üzerinde mürekkep davranışını izlemeye binlerce saat harcamış birine götürün.

Giriş moduna ve çıktı kalitesine göre oluşturucu türleri
Oluşturucu türüEn iyi girişTipik çıktıDürüst sınır
Genel amaçlı difüzyon (SDXL, MJ)Uzun ayrıntılı metin istemiÖzgün dövme tarzı çizimYerleşik şablon veya deri bilinci yok
Dövmeye ince ayarlı difüzyonKısa istem + stil etiketiDoğru dövme çizgisi ve gölgelendirmesiEğitim setindeki stillerle sınırlı
Fotoğraf koşullu (ControlNet/IP-Adapter)İstem + vücut fotoğrafıYerleşime uyumlu tasarımKullanılabilir referans fotoğraf gerektirir
Şablon dönüştürücüBitmiş tasarım görüntüsüTemiz siyah çizgi şablon PNGKalite kaynak kontrastına bağlıdır

difüzyon modeliAdım adım gürültüleme sürecini tersine çevirmeyi öğrenen üretici bir sinir ağı. Rastgele gürültüden başlayarak bir metin veya görüntü istemiyle yönlendirilerek gürültüyü yinelemeli olarak tahmin eder ve kaldırır; ta ki tutarlı bir görüntü ortaya çıkana dek.

Önemli bilgiler

Temel mimari
Metin kodlayıcı, U-Net gürültü giderici ve VAE çözücüyle gizli difüzyon
Tipik örnekleme adımları
Görüntü başına yirmi ila elli gürültü giderme adımı
Determinizm
Aynı istem ve tohum tam olarak aynı görüntüyü yeniden üretir
Fotoğraf koşullandırması
ControlNet, IP-Adapter veya derinlik haritaları tasarımı gerçek anatomiye uydurur
Bilinen zayıf noktalar
Sıkı simetri, yüzler, eller, küçük metin ve uzun vadeli yaşlanma yargısı

Sırada oku

Bir sonraki dövmeni keşfetmenin eğlenceli yolları

Roulette

Çarkı döndür, kaderine bırak

Lucid

Bilinçaltın tasarımı saklıyor

Pulse

Hissettiğin her şey bir form hak ediyor

Astral

Yıldızlarda yazılı, mürekkepte çizili

Glyphs

Modern işaretlerden kadim izler

Chimera

Beklenmedik birliktelikler en güzel mürekkebi yaratır

Ink Battle

Mürekkep mürekkeple buluşur, kalabalık karar verir

Name That Ink

Mürekkebi oku, zihni keşfet