Thuật ngữ
Diffusion Model (Mô hình khuếch tán)
Mô hình khuếch tán là một AI tạo sinh biến nhiễu ngẫu nhiên thành một hình ảnh từng bước.
Diffusion model là một loại trí tuệ nhân tạo tạo sinh tạo nên một hình ảnh bằng cách bắt đầu từ nhiễu thị giác ngẫu nhiên và dần dần tinh chỉnh nó thành một bức tranh mạch lạc. Nó học bằng cách nghiên cứu hàng triệu hình ảnh và cách chúng phân rã thành nhiễu, rồi đảo ngược quá trình đó: ở mỗi bước nó loại bỏ một chút nhiễu và thêm một chút cấu trúc, từ từ hé lộ một thiết kế hoàn chỉnh khớp với điều được yêu cầu. Hãy hình dung nó như một nhà điêu khắc khám phá một hình dạng bên trong một khối đá cẩm thạch, ngoại trừ đá cẩm thạch là các điểm ảnh ngẫu nhiên dạng hạt và sự hướng dẫn đến từ một mô tả văn bản hoặc hình ảnh tham chiếu. Với một người đang lên kế hoạch cho một hình xăm, đây là động cơ làm cho nghệ thuật AI hiện đại trở nên khả thi. Các công cụ như Design Forge của wizard.tattoo dùng các mô hình khuếch tán để chuyển một ý tưởng, chẳng hạn một cụm từ hoặc một bản phác, thành một ý niệm hình xăm được đánh bóng mà bạn có thể nghiên cứu, điều chỉnh và hình dung trước khi cam kết với mực. Vì mô hình làm việc theo từng vòng lặp, bạn thường có thể ảnh hưởng tới mức độ nó bám theo cách diễn đạt của bạn, mức độ tự do sáng tạo nó lấy, và kết quả trở nên chi tiết đến đâu. Hiểu rằng kết quả lớn lên từ nhiễu được hướng dẫn giúp giải thích vì sao hai lần thử cùng một ý tưởng có thể trông khác nhau.