چگونه بهترین نتایج را از هوش مصنوعی Stable Diffusion 3 بگیریم؟

Stable-Diffusion-3
5/5 - (1 امتیاز)

آخرین بروزرسانی در ۸ تیر ۱۴۰۳ توسط Dr.Arman

باید بدانیم که هوش مصنوعی متن باز Stable Diffusion 3 (SD3)، جدیدترین مدل هوش مصنوعی از Stability AI است که به دلیل قابلیت‌های برجسته‌اش در زمینه تولید تصاویر با کیفیت بالا، مورد توجه بسیاری قرار گرفته است. این مدل که به عنوان یک مدل تبدیل متن به تصویر معرفی شده، توانایی بالایی در تولید تصاویر فوتورئالیستی دارد و می‌تواند جزئیات دقیق را با توجه به دستورات کاربران به خوبی بازتولید کند.

بدلیل متن باز بودن، شما می‌توانید این ابزار را بر روی سیستم خود نصب نمایید!

یکی از مزایای اصلی SD3 توانایی بالای آن در تولید تصاویر فوتورئالیستی است که از نظر وضوح و واقع‌گرایی بسیار برجسته است. همچنین، این مدل به دلیل توانایی‌اش در مدیریت تایپوگرافی و ارائه متن‌های دقیق در تصاویر، از اهمیت ویژه‌ای در بین ابزارهای هوش مصنوعی ساخت عکس برخوردار است. یکی دیگر از ویژگی‌های برجسته SD3، توانایی‌اش در پیروی دقیق از دستورات متنی (پرامپت‌ها) است که به کاربران این امکان را می‌دهد تا با استفاده از توصیفات طولانی و دقیق، تصاویری بسیار نزدیک به آنچه در ذهن دارند، ایجاد کنند.

آشنایی با Stable Diffusion 3

Stable Diffusion 3 یک مدل پیشرفته تبدیل متن به تصویر است که با 2 میلیارد پارامتر، توانایی تولید تصاویر بسیار با کیفیت را داراست. این مدل نسبت به نسخه‌های قبلی خود، بهبودهای قابل توجهی در زمینه پیروی از پرامپت‌های طولانی و توصیفی داشته است و می‌تواند جزئیات بیشتری را در تصاویر تولید کند. SD3 به صورت رسمی بر روی پلتفرم‌های مختلفی مانند Replicate اجرا می‌شود و برای استفاده تجاری نیز در دسترس قرار گرفته است. این مدل همچنین به صورت منبع باز در قالب Diffusers و ComfyUI نیز ارائه شده است که به کاربران امکان می‌دهد تا به راحتی از آن در پروژه‌های خود استفاده کنند.

Stable-Diffusion-3-sample-photo

نسخه‌های مختلف SD3

Stability AI نسخه‌های مختلفی از SD3 Medium را برای مطابقت با نیازهای مختلف کاربران و دستگاه‌ها ارائه کرده است. هر کدام از این نسخه‌ها دارای ویژگی‌ها و نیازهای حافظه متفاوتی هستند که انتخاب نسخه مناسب را بر اساس حافظه گرافیکی (VRAM) موجود تعیین می‌کند.

  • sd3_medium_incl_clips_t5xxlfp8.safetensors: این نسخه شامل وزن‌های مدل، دو رمزگذار متنی CLIP و مدل بزرگ T5-XXL در قالب فشرده fp8 است. این نسخه برای سادگی و دستیابی به بهترین نتایج توصیه می‌شود.
  • sd3_medium_incl_clips_t5xxlfp16.safetensors: این نسخه مشابه نسخه قبلی است با این تفاوت که مدل T5-XXL کمتر فشرده شده است. استفاده از fp16 به جای fp8 بهبود جزئی در کیفیت تصویر ایجاد می‌کند، اما نیاز به حافظه بیشتری دارد.
  • sd3_medium_incl_clips.safetensors: این نسخه بدون مدل T5 است و فقط شامل دو رمزگذار متنی CLIP می‌باشد. این نسخه برای کاربرانی که حافظه گرافیکی محدودی دارند مناسب است، اما ممکن است نتایج متفاوتی نسبت به نسخه کامل داشته باشد و دقت در پیروی از پرامپت‌ها و کیفیت متن در تصاویر کاهش یابد.
  • sd3_medium.safetensors: این نسخه فقط شامل وزن‌های پایه مدل است و هیچ رمزگذار متنی ندارد. کاربران باید رمزگذاران متنی را به صورت جداگانه بارگذاری کنند. Stability AI یک جریان کاری مثال‌زده برای ComfyUI فراهم کرده است که به کاربران کمک می‌کند تا از این نسخه به درستی استفاده کنند.

نحوه استفاده از پرامپت‌ها در هوش مصنوعی Stable Diffusion 3 (SD3)

در Stable Diffusion 3 (SD3) تغییرات مهمی در نحوه استفاده از پرامپت‌ها نسبت به نسخه‌های قبلی اعمال شده است. این تغییرات به کاربران امکان می‌دهد تا با استفاده از پرامپت‌های طولانی و توصیفی، تصاویر بسیار دقیق‌تری تولید کنند. در ادامه به توضیح این تغییرات و نکات کاربردی برای نوشتن پرامپت‌های موثر می‌پردازیم.

تغییرات مهم در نحوه استفاده از پرامپت‌ها در SD3

در نسخه‌های قبلی Stable Diffusion، پرامپت‌ها به 77 کاراکتر محدود بودند که باعث می‌شد کاربران نتوانند جزئیات زیادی را در پرامپت‌های خود بگنجانند. اما در SD3 این محدودیت برداشته شده و کاربران می‌توانند از پرامپت‌هایی با طول 10,000 کاراکتر یا بیشتر استفاده کنند. این به معنی آن است که شما می‌توانید از توصیفات بسیار دقیق و طولانی برای تولید تصاویر با کیفیت بالاتر استفاده کنید.

نکات کاربردی برای نوشتن پرامپت‌های طولانی و توصیفی

  1. استفاده از جملات کامل و توصیفی: به جای استفاده از کلمات کلیدی جدا شده با کاما، از جملات کامل و توصیفی برای توضیح تصویر مورد نظر خود استفاده کنید. این باعث می‌شود که مدل بهتر بتواند تصویر را بر اساس توصیف شما تولید کند.
  2. دقیق و واضح بودن: سعی کنید توصیفات شما دقیق و واضح باشد تا مدل بتواند بهتر جزئیات را درک کند و به تصویر تبدیل کند. از کلمات و عبارات مبهم خودداری کنید.
  3. عدم استفاده از پرامپت‌های منفی: SD3 با پرامپت‌های منفی به خوبی کار نمی‌کند و استفاده از این نوع پرامپت‌ها می‌تواند باعث ایجاد نویز در تصویر شود. به جای حذف عناصر ناخواسته با پرامپت‌های منفی، سعی کنید توصیفات خود را تغییر دهید تا مدل به درستی عناصر مورد نظر را شناسایی کند.

تکنیک‌های پرامپت‌دهی

برای بهبود کیفیت تصاویر تولید شده با SD3، می‌توانید از تکنیک‌های پرامپت‌دهی مختلفی استفاده کنید که در ادامه توضیح داده شده‌اند.

استفاده از جملات کامل و توصیفی به جای کلمات کلیدی جدا شده با کاما

با استفاده از جملات کامل و توصیفی، مدل می‌تواند بهتر جزئیات تصویر را درک کند و تصویری دقیق‌تر تولید کند. برای مثال، به جای استفاده از کلمات کلیدی مانند “man, woman, background, red, gold”، می‌توانید از یک جمله کامل مانند “a man and woman are standing together against a backdrop, the backdrop is divided equally in half down the middle, left side is red, right side is gold” استفاده کنید.

ارائه مثال‌های پرامپت‌های توصیفی که نتایج خوبی در SD3 داشته‌اند

  • مثال 1: “a man and woman are standing together against a backdrop, the backdrop is divided equally in half down the middle, left side is red, right side is gold, the woman is wearing a long sleeve shirt with a yoda motif, she has a long skirt with birds on it, the man is wearing a three piece purple suit, he has spiky blue hair”

نتیجه اجرای مثال 1 در SD3 در لینک:

https://huggingface.co/spaces/stabilityai/stable-diffusion-3-medium

نمونه‌ای از تصاویر خلق شده با Stable-Diffusion-3

  • مثال 2: “a man wearing 1980s red and blue paper 3D glasses is sitting on a motorcycle, it is parked in a supermarket parking lot, midday sun, he is wearing a Slipknot t-shirt and has black pants and cowboy boots”

این پرامپت‌ها نشان می‌دهند که چگونه می‌توان با استفاده از توصیفات دقیق و کامل، تصاویر با کیفیتی تولید کرد.

جمع‌بندی

در نهایت، استفاده از هوش مصنوعی Stable Diffusion 3، نیازمند صبر و خلاقیت است. با دنبال کردن راهنمایی‌ها و نکات مطرح شده در این مقاله، می‌توانید تصاویر با کیفیت و جذابی ایجاد کنید و از توانایی‌های این مدل بهره‌مند شوید. آزمایش و تجربه کردن تنظیمات مختلف می‌تواند به بهبود خروجی‌ها کمک کند. شما می‌توانید تجربیات و نظرات خود را در بخش نظرات مقاله به اشتراک بگذارید تا دیگران نیز از این تجربیات بهره‌مند شوند. همچنین، به اشتراک‌گذاری مقاله در شبکه‌های اجتماعی می‌تواند به گسترش دانش و تبادل ایده‌ها کمک کند.

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *