AI TATTOO GENERATION

Cara penjana tatu AI berfungsi

Penjana tatu AI ialah model resapan yang dilaras halus pada imej tatu. Ia membaca arahan anda, menyahbising medan hingar rawak melalui banyak langkah, dan menghasilkan karya seni asli yang dibentuk oleh corak yang dipelajari semasa latihan.

Pasukan wizard.tattoo · · 7 min bacaan

Dirangka dengan bantuan AI dan disemak oleh pasukan editorial wizard.tattoo sebelum diterbitkan.

Apakah seni bina model yang menjanakan penjana tatu AI tipikal?

Kebanyakan penjana tatu menjalankan model resapan laten yang dilaras halus pada seni tatu. Pengekodan teks menukar arahan anda kepada vektor, U-Net menyahbising imej laten melalui beberapa langkah, dan penyahkod menukar laten akhir kepada reka bentuk yang kelihatan.

Seni bina yang mendominasi hari ini ialah resapan laten — keluarga yang sama yang mendasari Stable Diffusion, SDXL, keluaran terkini Midjourney, dan kebanyakan cabang tatu khusus sumber terbuka. "Laten" ialah kata kunci: daripada menyahbising pada resolusi piksel penuh, model bekerja dalam representasi termampat yang kira-kira satu perenam belas saiznya, itulah sebabnya generasi selesai dalam beberapa saat dan bukannya beberapa minit. Tiga komponen penting. Pengekodan teks — biasanya varian CLIP atau T5 — memetakan arahan bertulis anda ke dalam vektor berdimensi tinggi yang menangkap makna, bukan sekadar kata kunci. U-Net melakukan kerja penyahbisingan sebenar, dikondisikan pada setiap langkah oleh vektor teks tersebut — jadi model terus-menerus diarahkan ke arah "perkara yang kelihatan seperti arahan". Penyahkod autoenkoder variasional kemudian mengembangkan laten akhir kembali kepada imej yang kelihatan. Bahagian khusus tatu berlaku semasa penalaan halus. Model asas yang telah melihat web terbuka dilatih lebih lanjut pada korpus seni tatu yang dipilih — lembaran flash, foto yang telah sembuh, kerja garisan, stensil — sehingga berat rangkaian cenderung ke arah tatabahasa visual tatu: garis besar yang tegas, ruang negatif yang terkawal, bayang titik, konvensyen fine-line berbanding traditional. Sesetengah produk menambah LoRA (penyesuai kepakaran kecil) bagi setiap gaya. Kertas DDPM asal di <a href="https://arxiv.org/abs/2006.11239">arxiv.org/abs/2006.11239</a> ialah rujukan kanonik jika anda mahukan matematik di sebalik proses penyahbisingan. Hasilnya secara praktikal untuk anda ialah alat itu sudah memahami maksud "single needle" atau "American traditional" sebelum anda menaipnya. Jika anda ingin <a href="/blog/best-ai-tattoo-generator">membandingkan alat tatu AI semasa</a>, seni binanya hampir selalu merupakan beberapa varian tumpukan ini — perbezaannya terletak pada data latihan dan lalai inferens.

Bagaimana alat menterjemah arahan teks kepada reka bentuk tatu?

Arahan anda ditokenkan, dibenamkan ke dalam vektor, dan disuapkan ke U-Net sebagai pengkondisian pada setiap langkah penyahbisingan. Model bermula dari hingar tulen dan secara berulang menyingkirkan bahagian yang tidak sepadan dengan vektor arahan, meninggalkan imej yang sepadan.

Terjemahan dari perkataan ke gambar bukan pengambilan semula. Model tidak mencari pangkalan data tatu untuk perkara yang sepadan dengan arahan anda — ia menjana imej yang tidak pernah wujud sebelum ini, dipandu oleh corak statistik yang diserap semasa latihan. Perbezaan itu penting kerana ia menjelaskan kedua-dua kekuatan (keaslian, variasi tanpa had) dan kelemahan (kadang-kadang gangguan anatomi, pelesapan arahan). Secara mekanikal, arahan melalui tokenizer yang memecahnya kepada unit sub-perkataan, kemudian melalui pengekodan teks yang menghasilkan urutan vektor yang menangkap makna semantik. "Burung bangau, fine-line, ruang negatif" menjadi koordinat dalam ruang di mana "burung bangau" berada berhampiran burung berleher panjang lain, "fine-line" berada berhampiran gaya minimalis lain, dan "ruang negatif" menarik ke arah komposisi dengan kekosongan yang disengajakan. U-Net menerima pengkondisian ini dan menggunakannya untuk memutuskan, pada setiap langkah penyahbisingan, corak hingar mana yang perlu dikekalkan dan mana yang perlu dibuang. Panduan bebas pengelas ialah tuil yang mengawal seberapa literal model mentafsir anda. Panduan rendah menghasilkan tafsiran yang lebih lembut dan lebih kreatif; panduan tinggi memaksakan kepatuhan ketat pada arahan — kadang-kadang dengan mengorbankan kualiti imej. Produk yang dilaras untuk tatu biasanya memilih nilai tengah untuk anda. Langkah pensampelan — biasanya dua puluh hingga lima puluh — menukar kelajuan dengan kehalusan. Benih — satu integer — menentukan medan hingar permulaan; arahan yang sama dan benih yang sama menghasilkan imej yang sama, itulah cara iterasi menjadi deterministik dan bukannya seperti mesin judi. Setelah anda mempunyai generasi yang anda suka, anda boleh <a href="/tryon">pratonton tatu yang dijana pada kulit anda</a> atau <a href="/stencil">menukar reka bentuk yang dijana kepada stensil</a> untuk dibawa kepada seniman anda.

Apakah peranan input foto dalam generasi yang sedar kulit?

Input foto membolehkan model dikondisikan pada anatomi sebenar anda. Imej dikodkan bersama arahan, jadi generasi menghormati kelengkungan, skala, dan penempatan bahagian badan — dan bukannya menghasilkan reka bentuk rata yang perlu dipasang pada kulit kemudian.

Generasi teks-ke-imej tulen menghasilkan reka bentuk yang terapung pada latar belakang putih. Itu baik untuk memilih apa yang anda mahukan, tetapi ia mengabaikan kekangan terpenting yang dimiliki tatu sebenar: badan tempat ia berada. Kulit melengkung, tidak simetri, dan tiga dimensi. Komposisi yang kelihatan seimbang sebagai PNG persegi boleh terbaca sebagai senget apabila ia membungkus lengan bawah atau mengikut garisan tulang selangka. Generasi bersyarat foto menutup jurang itu. Di sebalik tabir, sistem menggunakan salah satu daripada beberapa teknik — ControlNet, IP-Adapter, pengkondisian kedalaman, atau img2img dengan kekuatan penyahbisingan rendah — untuk menyuntik maklumat tentang foto anda ke dalam proses resapan. Model boleh membaca kontur lengan anda, definisi otot belakang anda, kecerunan tulang rusuk anda, dan melaraskan reka bentuk dengan sewajarnya. Ular yang dimaksudkan untuk membungkus bisep anda dijana sudah membungkus; kepingan yang bersaiz untuk bahagian dalam lengan bawah anda dijana pada nisbah aspek yang betul. Penggunaan kedua input foto ialah cuba pakai maya: daripada mengkondisikan generasi, sistem menggabungkan reka bentuk yang siap pada foto anda dengan pembetulan perspektif, pemadanan opasiti, dan pengendalian bayang. Ini adalah cara anda melihat seperti apa tatu itu sebelum menempah — dan ini adalah cara termurah untuk mendapati bahawa idea yang anda sukai di skrin adalah salah untuk penempatan yang anda bayangkan.

Di mana generasi tatu AI masih jauh di bawah seniman manusia?

AI sangat baik dalam membuat idea dan lemah dalam kerja kemasan. Ia bergelut dengan simetri ketat, wajah, tangan, teks, dan pertimbangan praktikal tentang bagaimana reka bentuk akan menua, parut, dan terbaca dalam saiz kecil — semua perkara yang ditangani seniman manusia yang cekap secara refleks.

Jawapan jujur ialah AI ialah rakan kongsi percambahan fikiran yang lebih baik daripada penyelesai. Ia lebih pantas daripada mana-mana manusia dalam meneroka hala tuju, menghasilkan variasi, dan menunjukkan kepada anda seperti apa seratus versi berbeza daripada idea yang sama. Itu mengubah segalanya tentang fasa awal mereka bentuk tatu. Tetapi jurang antara "imej yang dijana dengan baik" dan "tatu yang baik" adalah nyata, dan ia muncul di tempat-tempat tertentu. Simetri adalah yang pertama. Model resapan bersifat kebarangkalian — mereka tidak menguatkuasakan bahawa mata kiri sepadan dengan mata kanan, bahawa dua batang bunga mencerminkan dengan bersih, atau bahawa dua belas sektor mandala adalah sama. Anda boleh mendekati ini dengan arahan dan benih yang betul, tetapi manusia yang membersihkan fail biasanya diperlukan jika simetri adalah inti karya. Wajah, tangan, dan teks kecil ialah mod kegagalan kedua atas sebab yang sama: perincian frekuensi tinggi dalam kawasan semantik padat adalah tempat resapan paling kerap berhalusinasi. Keterbatasan yang lebih dalam ialah pertimbangan. Model resapan tidak pernah menyaksikan tatu sembuh. Ia tidak tahu bahawa garisan yang sangat nipis di tepi jari akan kabur dalam dua tahun, bahawa dakwat putih pudar di bawah sinar matahari, bahawa reka bentuk yang dikemas ketat pada tiga sentimeter akan kehilangan semua perinciannya akibat penyebaran dakwat, atau bahawa kepingan belakang perlu mempertimbangkan cara badan bergerak. Itulah perkara yang akan diberitahu oleh seniman tatu yang bekerja kepada anda serta merta. Gunakan AI untuk menjana, mengiterasi, dan mengesahkan visual — kemudian bawa fail kepada seseorang yang telah menghabiskan ribuan jam menyaksikan dakwat berkelakuan pada badan, dan biarkan mereka melakukan bahagian yang tidak dapat dilakukan mesin.

Jenis penjana mengikut modaliti input dan kualiti output
Jenis penjanaInput terbaikOutput tipikalHad nyata
Resapan tujuan umum (SDXL, MJ)Arahan teks panjang dan terperinciKarya seni bergaya tatu asliTiada kesedaran stensil atau kulit asli
Resapan dilaras halus untuk tatuArahan pendek + teg gayaKerja garisan dan lorekan yang betul untuk tatuTerhad kepada gaya dalam set latihan
Bersyarat foto (ControlNet/IP-Adapter)Arahan + foto badanReka bentuk yang sesuai dengan penempatanMemerlukan foto rujukan yang boleh digunakan
Penukar stensilImej reka bentuk yang siapPNG stensil garisan hitam bersihKualiti bergantung pada kontras sumber

model resapanRangkaian saraf generatif yang belajar membalikkan proses penghingaran langkah demi langkah. Bermula dari hingar rawak, ia secara berulang meramalkan dan menyingkirkan hingar — dipandu oleh arahan teks atau imej — sehingga imej yang koheren muncul.

Fakta utama

Seni bina asas
Resapan laten dengan pengekodan teks, penyahbising U-Net, dan penyahkod VAE
Langkah pensampelan tipikal
Dua puluh hingga lima puluh langkah penyahbisingan setiap imej
Determinisme
Arahan dan benih yang sama menghasilkan semula imej yang sama tepat
Pengkondisian foto
ControlNet, IP-Adapter, atau peta kedalaman menyesuaikan reka bentuk dengan anatomi sebenar
Titik lemah yang diketahui
Simetri ketat, wajah, tangan, teks kecil, dan pertimbangan penuaan jangka panjang

Baca seterusnya

Cara-cara kreatif untuk mencari tatu seterusnya

Roulette

Pusing roda, biar nasib menentukan

Lucid

Mimpi anda menyimpan reka bentuk

Pulse

Apa yang anda rasa layak diberi bentuk

Astral

Tertulis di bintang, dilukis dalam dakwat

Glyphs

Simbol purba dari tanda moden

Chimera

Gabungan luar biasa menghasilkan dakwat terbaik

Ink Battle

Dakwat bertemu dakwat, orang ramai memutuskan

Name That Ink

Baca dakwat, dedahkan minda