آخرین بروزرسانی در ۸ تیر ۱۴۰۳ توسط Dr.Arman
باید بدانیم که هوش مصنوعی متن باز Stable Diffusion 3 (SD3)، جدیدترین مدل هوش مصنوعی از Stability AI است که به دلیل قابلیتهای برجستهاش در زمینه تولید تصاویر با کیفیت بالا، مورد توجه بسیاری قرار گرفته است. این مدل که به عنوان یک مدل تبدیل متن به تصویر معرفی شده، توانایی بالایی در تولید تصاویر فوتورئالیستی دارد و میتواند جزئیات دقیق را با توجه به دستورات کاربران به خوبی بازتولید کند.
بدلیل متن باز بودن، شما میتوانید این ابزار را بر روی سیستم خود نصب نمایید!
یکی از مزایای اصلی SD3 توانایی بالای آن در تولید تصاویر فوتورئالیستی است که از نظر وضوح و واقعگرایی بسیار برجسته است. همچنین، این مدل به دلیل تواناییاش در مدیریت تایپوگرافی و ارائه متنهای دقیق در تصاویر، از اهمیت ویژهای در بین ابزارهای هوش مصنوعی ساخت عکس برخوردار است. یکی دیگر از ویژگیهای برجسته SD3، تواناییاش در پیروی دقیق از دستورات متنی (پرامپتها) است که به کاربران این امکان را میدهد تا با استفاده از توصیفات طولانی و دقیق، تصاویری بسیار نزدیک به آنچه در ذهن دارند، ایجاد کنند.
آشنایی با Stable Diffusion 3
Stable Diffusion 3 یک مدل پیشرفته تبدیل متن به تصویر است که با 2 میلیارد پارامتر، توانایی تولید تصاویر بسیار با کیفیت را داراست. این مدل نسبت به نسخههای قبلی خود، بهبودهای قابل توجهی در زمینه پیروی از پرامپتهای طولانی و توصیفی داشته است و میتواند جزئیات بیشتری را در تصاویر تولید کند. SD3 به صورت رسمی بر روی پلتفرمهای مختلفی مانند Replicate اجرا میشود و برای استفاده تجاری نیز در دسترس قرار گرفته است. این مدل همچنین به صورت منبع باز در قالب Diffusers و ComfyUI نیز ارائه شده است که به کاربران امکان میدهد تا به راحتی از آن در پروژههای خود استفاده کنند.
نسخههای مختلف SD3
Stability AI نسخههای مختلفی از SD3 Medium را برای مطابقت با نیازهای مختلف کاربران و دستگاهها ارائه کرده است. هر کدام از این نسخهها دارای ویژگیها و نیازهای حافظه متفاوتی هستند که انتخاب نسخه مناسب را بر اساس حافظه گرافیکی (VRAM) موجود تعیین میکند.
- sd3_medium_incl_clips_t5xxlfp8.safetensors: این نسخه شامل وزنهای مدل، دو رمزگذار متنی CLIP و مدل بزرگ T5-XXL در قالب فشرده fp8 است. این نسخه برای سادگی و دستیابی به بهترین نتایج توصیه میشود.
- sd3_medium_incl_clips_t5xxlfp16.safetensors: این نسخه مشابه نسخه قبلی است با این تفاوت که مدل T5-XXL کمتر فشرده شده است. استفاده از fp16 به جای fp8 بهبود جزئی در کیفیت تصویر ایجاد میکند، اما نیاز به حافظه بیشتری دارد.
- sd3_medium_incl_clips.safetensors: این نسخه بدون مدل T5 است و فقط شامل دو رمزگذار متنی CLIP میباشد. این نسخه برای کاربرانی که حافظه گرافیکی محدودی دارند مناسب است، اما ممکن است نتایج متفاوتی نسبت به نسخه کامل داشته باشد و دقت در پیروی از پرامپتها و کیفیت متن در تصاویر کاهش یابد.
- sd3_medium.safetensors: این نسخه فقط شامل وزنهای پایه مدل است و هیچ رمزگذار متنی ندارد. کاربران باید رمزگذاران متنی را به صورت جداگانه بارگذاری کنند. Stability AI یک جریان کاری مثالزده برای ComfyUI فراهم کرده است که به کاربران کمک میکند تا از این نسخه به درستی استفاده کنند.
نحوه استفاده از پرامپتها در هوش مصنوعی Stable Diffusion 3 (SD3)
در Stable Diffusion 3 (SD3) تغییرات مهمی در نحوه استفاده از پرامپتها نسبت به نسخههای قبلی اعمال شده است. این تغییرات به کاربران امکان میدهد تا با استفاده از پرامپتهای طولانی و توصیفی، تصاویر بسیار دقیقتری تولید کنند. در ادامه به توضیح این تغییرات و نکات کاربردی برای نوشتن پرامپتهای موثر میپردازیم.
تغییرات مهم در نحوه استفاده از پرامپتها در SD3
در نسخههای قبلی Stable Diffusion، پرامپتها به 77 کاراکتر محدود بودند که باعث میشد کاربران نتوانند جزئیات زیادی را در پرامپتهای خود بگنجانند. اما در SD3 این محدودیت برداشته شده و کاربران میتوانند از پرامپتهایی با طول 10,000 کاراکتر یا بیشتر استفاده کنند. این به معنی آن است که شما میتوانید از توصیفات بسیار دقیق و طولانی برای تولید تصاویر با کیفیت بالاتر استفاده کنید.
نکات کاربردی برای نوشتن پرامپتهای طولانی و توصیفی
- استفاده از جملات کامل و توصیفی: به جای استفاده از کلمات کلیدی جدا شده با کاما، از جملات کامل و توصیفی برای توضیح تصویر مورد نظر خود استفاده کنید. این باعث میشود که مدل بهتر بتواند تصویر را بر اساس توصیف شما تولید کند.
- دقیق و واضح بودن: سعی کنید توصیفات شما دقیق و واضح باشد تا مدل بتواند بهتر جزئیات را درک کند و به تصویر تبدیل کند. از کلمات و عبارات مبهم خودداری کنید.
- عدم استفاده از پرامپتهای منفی: SD3 با پرامپتهای منفی به خوبی کار نمیکند و استفاده از این نوع پرامپتها میتواند باعث ایجاد نویز در تصویر شود. به جای حذف عناصر ناخواسته با پرامپتهای منفی، سعی کنید توصیفات خود را تغییر دهید تا مدل به درستی عناصر مورد نظر را شناسایی کند.
تکنیکهای پرامپتدهی
برای بهبود کیفیت تصاویر تولید شده با SD3، میتوانید از تکنیکهای پرامپتدهی مختلفی استفاده کنید که در ادامه توضیح داده شدهاند.
استفاده از جملات کامل و توصیفی به جای کلمات کلیدی جدا شده با کاما
با استفاده از جملات کامل و توصیفی، مدل میتواند بهتر جزئیات تصویر را درک کند و تصویری دقیقتر تولید کند. برای مثال، به جای استفاده از کلمات کلیدی مانند “man, woman, background, red, gold”، میتوانید از یک جمله کامل مانند “a man and woman are standing together against a backdrop, the backdrop is divided equally in half down the middle, left side is red, right side is gold” استفاده کنید.
ارائه مثالهای پرامپتهای توصیفی که نتایج خوبی در SD3 داشتهاند
- مثال 1: “a man and woman are standing together against a backdrop, the backdrop is divided equally in half down the middle, left side is red, right side is gold, the woman is wearing a long sleeve shirt with a yoda motif, she has a long skirt with birds on it, the man is wearing a three piece purple suit, he has spiky blue hair”
نتیجه اجرای مثال 1 در SD3 در لینک:
https://huggingface.co/spaces/stabilityai/stable-diffusion-3-medium
- مثال 2: “a man wearing 1980s red and blue paper 3D glasses is sitting on a motorcycle, it is parked in a supermarket parking lot, midday sun, he is wearing a Slipknot t-shirt and has black pants and cowboy boots”
این پرامپتها نشان میدهند که چگونه میتوان با استفاده از توصیفات دقیق و کامل، تصاویر با کیفیتی تولید کرد.
جمعبندی
در نهایت، استفاده از هوش مصنوعی Stable Diffusion 3، نیازمند صبر و خلاقیت است. با دنبال کردن راهنماییها و نکات مطرح شده در این مقاله، میتوانید تصاویر با کیفیت و جذابی ایجاد کنید و از تواناییهای این مدل بهرهمند شوید. آزمایش و تجربه کردن تنظیمات مختلف میتواند به بهبود خروجیها کمک کند. شما میتوانید تجربیات و نظرات خود را در بخش نظرات مقاله به اشتراک بگذارید تا دیگران نیز از این تجربیات بهرهمند شوند. همچنین، به اشتراکگذاری مقاله در شبکههای اجتماعی میتواند به گسترش دانش و تبادل ایدهها کمک کند.



مطالب مرتبط