پروژه هوش مصنوعی Genie گوگل؛ دنیایی که با یک عکس می‌سازید و در آن راه می‌روید

امتیاز دهید post

آخرین بروزرسانی در ۱۱ بهمن ۱۴۰۴ توسط Dr.Arman

تصور کنید عکسی از حیاط قدیمی خانه‌تان، نقاشی تخیلی فرزندتان یا حتی یک اسکرین‌شات از بازی محبوبتان را به یک سیستم هوش مصنوعی می‌دهید و تنها چند ثانیه بعد، خود را درون آن تصویر می‌بینید. شما دیگر فقط تماشاگر نیستید؛ بلکه می‌توانید با کلیدهای کیبورد در آن محیط حرکت کنید، از موانع بپرید و گوشه و کنار دنیایی را که همین حالا خلق شده، کشف کنید. این جادوی جدید گوگل در حوزه هوش مصنوعی ساخت فیلم و مدل‌های جهانی است که مرز بین تماشای یک ویدیو و تجربه یک بازی ویدیویی را به کل از بین برده است.

چرا پروژه جینی فراتر از یک سرگرمی ساده است؟

شاید بپرسید چرا باید برای چیزی که فقط ۶۰ ثانیه طول می‌کشد، هیجان‌زده باشیم؟ پاسخ در کلمه‌ای به نام «مدل جهانی» (World Model) نهفته است. تا پیش از این، هوش مصنوعی‌هایی مثل Sora یا Veo فقط ویدیوهایی می‌ساختند که ما تماشا می‌کردیم. اما Project Genie محیطی را خلق می‌کند که به ورودی‌های شما پاسخ می‌دهد. این یعنی هوش مصنوعی حالا می‌فهمد که اگر شما کلید «جلو» را فشار دهید، پرسپکتیو تصویر باید چگونه تغییر کند تا حس حرکت واقعی به شما منتقل شود.

این فناوری نشان‌دهنده جهشی بزرگ در درک هوش مصنوعی از فیزیک و فضای سه‌بعدی است. ما در حال گذار از عصر «تولید محتوا» به عصر «تولید تجربه» هستیم. حالا دیگر هوش مصنوعی فقط نویسنده یا نقاش نیست؛ او یک مهندس معمار و طراح مرحله بازی است که در لحظه، دنیایی را برای شما رندر می‌کند که تا قبل از آن وجود خارجی نداشته است.

از مدل تحقیقاتی تا اشتراک ۲۵۰ دلاری

سال گذشته، زمانی که گوگل برای اولین بار از Genie 3 پرده‌برداری کرد، دنیای تکنولوژی شوکه شد. آن مدل قدرت حافظه تصویری عجیبی داشت و می‌توانست ثبات محیط را برای مدت طولانی حفظ کند. اما آن زمان فقط گروه کوچکی از محققان به آن دسترسی داشتند. حالا گوگل این غول مهربان را در قالب Project Genie در دسترس عموم قرار داده است، البته یک شرط بزرگ دارد: شما باید جزو مشترکین سطح بالای گوگل باشید که ماهانه ۲۵۰ دلار پرداخت می‌کنند.

این قیمت بالا نشان‌دهنده یک واقعیت فنی است؛ پردازش و تولید ویدیوهای تعاملی در لحظه، به شدت هزینه‌بر و نیازمند قدرت پردازشی فوق‌العاده‌ای است. گوگل با این کار می‌خواهد قدرت مدل‌های جدید خود مثل Nano Banana Pro و Gemini 3 را به رخ بکشد. در واقع جینی ویترینی است برای آنچه در آینده‌ای نزدیک قرار است به استانداردی در گوشی‌های هوشمند ما تبدیل شود.

جادوی طراحی دنیا یا World Sketching چیست؟

یکی از جذاب‌ترین بخش‌های کار با پروژه جینی، فرآیندی است که گوگل آن را «طراحی دنیا» نامیده است. شما لازم نیست یک برنامه‌نویس یا طراح سه‌بعدی باشید. همه چیز با یک ایده شروع می‌شود. می‌توانید متنی بنویسید مثل: «یک قلعه متروکه در میان جنگلی بنفش با شخصیتی که شبیه به یک ربات کوچک است». ابتدا هوش مصنوعی یک تصویر ثابت (استاتیک) از این محیط می‌سازد.

اگر از تصویر خوشتان نیامد، می‌توانید آن را اصلاح کنید. اینجاست که تعامل واقعی شروع می‌شود. وقتی تصویر نهایی تایید شد، جینی وارد عمل می‌شود و آن عکس مرده را به یک دنیای زنده تبدیل می‌کند. شما می‌توانید با استفاده از کلیدهای معروف WASD در محیط حرکت کنید. جینی با سرعت ۲۴ فریم بر ثانیه و کیفیت 720p، مسیر پیش روی شما را در همان لحظه خلق می‌کند. انگار که هوش مصنوعی جاده‌ای را درست زیر پای شما و در حین راه رفتن، آسفالت می‌کند!

محدودیت‌هایی که هنوز یادآور «آزمایشی» بودن هستند

با وجود تمام این جذابیت‌ها، نباید فراموش کنیم که جینی هنوز یک پروتوتایپ تحقیقاتی است. اگر انتظار تجربه‌ای به روانی بازی‌های تریپل‌ ای (AAA) را دارید، احتمالا ناامید خواهید شد. اولین چیزی که حس می‌کنید، تأخیر یا همان لگ ورودی است. وقتی کلیدی را فشار می‌دهید، چند لحظه طول می‌کشد تا هوش مصنوعی فریم‌های بعدی را تولید کند و به حرکت شما پاسخ دهد.

همچنین، هر ماجراجویی شما در این دنیاهای ساخته شده فقط ۶۰ ثانیه زمان دارد. بعد از یک دقیقه، جادو به پایان می‌رسد. البته می‌توانید دوباره همان پرامپت را اجرا کنید، اما چون با هوش مصنوعی مولد روبرو هستیم، هر بار نتایج کمی متفاوت خواهد بود. جالب است بدانید که گوگل در نسخه‌های اولیه قابلیتی را نمایش داده بود که می‌توانستید در حین حرکت، عناصر جدیدی به دنیا اضافه کنید، اما این ویژگی هنوز در نسخه فعلی Project Genie فعال نشده است.

وقتی هوش مصنوعی کپی‌رایت را به چالش می‌کشد

داستان جالبی که نویسندگان وب‌سایت «ورج» (The Verge) تعریف کرده‌اند، نشان‌دهنده چالش‌های اخلاقی و قانونی این فناوری است. در ابتدای تست، آن‌ها موفق شدند دنیاهایی شبیه به بازی‌های سوپر ماریو و افسانه زلدا بسازند. جینی به راحتی محیط‌های پیکسلی و شخصیت‌های مشابه نینتندو را بازسازی می‌کرد. اما پس از مدتی، گوگل متوجه شد و فیلترهای سختی را اعمال کرد.

حالا اگر بخواهید دنیایی شبیه به آثار کپی‌رایت‌دار بسازید، با پیام خطا روبرو می‌شوید که می‌گوید این درخواست به دلیل «حفظ منافع صاحبان محتوا» مسدود شده است. این نشان می‌دهد که گوگل به شدت نگران مسائل حقوقی است. با این حال، توانایی جینی در تقلید سبک‌های بصری به قدری بالاست که به زودی مرز بین الهام گرفتن و کپی کردن در هوش مصنوعی به یکی از بزرگترین بحث‌های حقوقی قرن تبدیل خواهد شد.

چگونه می‌توانیم از این ابزار استفاده کنیم؟

برای شروع، شما نیاز به دسترسی به اپلیکیشن وب اختصاصی Project Genie دارید. توجه داشته باشید که این ابزار در داخل چت‌بات جمینای (Gemini) ادغام نشده و یک فضای کاملاً مجزا دارد. اگر اشتراک AI Ultra را تهیه کرده‌اید، پیشنهاد می‌کنم ابتدا با دنیاهای پیش‌ساخته خود گوگل بازی کنید. گوگل به شما اجازه می‌دهد این دنیاها را «ریمیکس» کنید؛ یعنی سبک بصری یا شخصیت آن‌ها را به دلخواه خود تغییر دهید.

نکته کاربردی دیگر این است که شما می‌توانید ویدیوی نهایی گشت‌وگذار خود در این دنیا را دانلود کنید. این ویدیوها برای کسانی که در شبکه‌های اجتماعی محتوا تولید می‌کنند یا به دنبال الهام برای ساخت بازی‌های مستقل هستند، گنجینه‌ای ارزشمند محسوب می‌شود. اگرچه فیزیک دنیاها گاهی عجیب و غریب می‌شود و ممکن است از دیوارها رد شوید، اما همین نقص‌ها هم بخشی از جذابیت تماشای تولد یک تکنولوژی جدید است.

آینده‌ای که در آن هر کسی بازیساز است

پروژه جینی فقط یک اسباب‌بازی گران‌قیمت نیست؛ این اولین قدم به سوی دموکراتیزه کردن ساخت بازی و تجربه‌های تعاملی است. روزی را تصور کنید که برای ساختن یک بازی کوچک برای دوستانتان، نیازی به یادگیری موتورهای پیچیده‌ای مثل آنریل انجین یا یونیتی نداشته باشید. فقط کافیست بگویید چه می‌خواهید و هوش مصنوعی آن را برایتان می‌سازد.

در نهایت، Project Genie به ما یادآوری می‌کند که قدرت تخیل انسان تنها مرز باقی‌مانده است. ما از عصر خواندن داستان‌ها به عصر تماشای آن‌ها رفتیم و حالا در آستانه ورود به عصری هستیم که در داستان‌های خودمان زندگی می‌کنیم. اگر به دنیای هوش مصنوعی و آینده تکنولوژی علاقه‌مند هستید، حتماً اخبار مربوط به مدل‌های جهانی را دنبال کنید؛ چرا که جینی تازه اول راه است و دنیای واقعی ما به زودی با نسخه‌های مجازی و هوشمند خود پیوند خواهد خورد.

منبع:

https://arstechnica.com/google/2026/01/google-project-genie-lets-you-create-interactive-worlds-from-a-photo-or-prompt/

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *