پشت پرده ۱۲۰۰ خط کد؛ جمینی چگونه همسفر جدید تاکسی‌های وایمو (Waymo) شد؟

5/5 - (1 امتیاز)

آخرین بروزرسانی در ۴ دی ۱۴۰۴ توسط Dr.Arman

تصور کنید در صندلی عقب یک تاکسی بدون راننده نشسته‌اید و ماشین به آرامی در شلوغی شهر حرکت می‌کند؛ ناگهان صدایی آشنا و دوستانه شما را با نام کوچکتان صدا می‌زند و می‌پرسد که آیا دمای ماشین مناسب است یا خیر. این دقیقاً همان آینده‌ای است که در جدیدترین اخبار دنیای هوش مصنوعی فاش شده است: گوگل در حال تبدیل کردن مدل زبانی «جمینی» به یک دستیار اختصاصی برای روبوتاکسی‌های وایمو (Waymo) است تا تجربه سفر شما را از یک جابه‌جایی ساده به یک تعامل هوشمند تبدیل کند.

چرا این تحول همین حالا برای ما اهمیت دارد؟

ما در دورانی هستیم که خودروهای خودران دیگر یک رویای علمی-تخیلی نیستند، اما هنوز یک مشکل بزرگ وجود دارد: «اعتماد و ارتباط انسانی». وقتی راننده‌ای در کار نباشد، مسافر ممکن است احساس تنهایی یا حتی ناامنی کند. ورود جمینی به خودروهای وایمو، پاسخی هوشمندانه به این خلاء است. گوگل متوجه شده که برای پذیرش عمومی خودروهای بدون راننده، فقط مهندسی دقیق رانندگی کافی نیست؛ بلکه خودرو باید بتواند مانند یک میزبان حرفه‌ای با مسافر تعامل داشته باشد. این ادغام، قدرت تحلیل متنی جمینی را با دنیای فیزیکی پیوند می‌زند و استانداردهای جدیدی برای «هوش مصنوعی درون‌خودرویی» تعریف می‌کند.

افشای بزرگ: ۱۲۰۰ خط کد که رازهای وایمو را برملا کرد

همه چیز از یک کنجکاوی فنی شروع شد. جین منچون وانگ، محققی که به شکار ویژگی‌های منتشرنشده معروف است، در کدهای اپلیکیشن موبایل وایمو به سندی دست یافت که با نام «Meta-Prompt دستیار سفر وایمو» شناخته می‌شود. این سند بیش از ۱۲۰۰ خط دستورالعمل دقیق است که به جمینی دیکته می‌کند دقیقاً چطور باید در داخل خودرو رفتار کند. این کدها نشان می‌دهند که جمینی قرار نیست فقط یک چت‌بات ساده باشد که به سوالات عمومی پاسخ دهد؛ او وظیفه دارد محیط داخلی خودرو را مدیریت کرده و آرامش مسافر را تضمین کند.

جالب است بدانید که این دستیار اجازه دارد به داده‌های سیاق‌مندی (Contextual Data) درباره شما دسترسی داشته باشد. مثلاً او می‌داند شما تا به حال چند بار با وایمو سفر کرده‌اید و بر همین اساس، لحن خوش‌آمدگویی خود را تنظیم می‌کند. طبق این دستورالعمل‌ها، جمینی باید از جملات کوتاه (یک تا سه جمله) استفاده کند و از به کار بردن اصطلاحات فنی پیچیده پرهیز کند تا تجربه‌ای کاملاً صمیمی و راحت برای شما رقم بزند. او یک هم‌سفر است، نه یک تکنسین رباتیک.

مرز باریک میان هوش مصنوعی و سیستم رانندگی

یکی از هوشمندانه‌ترین بخش‌های این ۱۲۰۰ خط کد، تفکیک دقیق هویت جمینی از «راننده وایمو» است. گوگل به شدت تاکید دارد که مسافر نباید این دو را با هم اشتباه بگیرد. اگر از جمینی بپرسید «چطور جاده را می‌بینی؟»، او اجازه ندارد بگوید «من از سنسورها استفاده می‌کنم»؛ بلکه باید پاسخ دهد «راننده وایمو (Waymo Driver) از ترکیبی از سنسورها استفاده می‌کند…». این تفکیک هویت نشان می‌دهد که گوگل می‌خواهد مسئولیت رانندگی را از مسئولیت پاسخگویی جدا کند تا در صورت بروز هرگونه خطا، هوش مصنوعیِ گفتگوکننده زیر سوال نرود.

نکته جالب دیگر، نحوه برخورد جمینی با سوالات چالشی است. طبق دستورالعمل‌ها، اگر مسافری درباره تصادفات قبلی وایمو یا ویدیوهای جنجالی در اینترنت بپرسد، جمینی ماموریت دارد که بحث را منحرف کرده و از موضع تدافعی یا عذرخواهی خودداری کند. او یک سخنگوی روابط عمومی نیست؛ او فقط یک دستیار برای راحتی شماست. حتی در مورد رقبایی مثل تسلا یا کروز، جمینی دستورات خاصی دارد تا چگونه پاسخ دهد که نه تبلیغی برای آن‌ها باشد و نه توهینی به برندهای رقیب.

جمینی در مقابل گِراک؛ رقابت غول‌ها در صندلی جلو

وایمو تنها شرکتی نیست که به فکر دستیار هوشمند افتاده است. ایلان ماسک هم با ادغام هوش مصنوعی Grok در خودروهای تسلا، مسیر مشابهی را طی می‌کند. اما تفاوت فلسفی این دو رویکرد بسیار دیدنی است. گراک (Grok) بیشتر به عنوان یک «رفیق» طراحی شده که می‌تواند گفتگوهای طولانی داشته باشد، شوخی کند و لحنی تند و تیز داشته باشد. اما جمینی در وایمو، بیشتر شبیه به یک «مهماندار مجرب» یا «کنسیرژ هتل» است؛ عمل‌گرا، مودب، و متمرکز بر نیازهای لحظه‌ای مسافر.

در حالی که گراک ممکن است با شما درباره تئوری‌های توطئه بحث کند، جمینی ترجیح می‌دهد دمای کولر را تنظیم کند، نور مخفی خودرو را تغییر دهد یا به شما بگوید که نزدیک‌ترین شعبه فروشگاه مورد نظرتان چه ساعتی بسته می‌شود. این تفاوت نشان می‌دهد که گوگل بر روی «کاربردی بودن» و «ایمنی روانی» تمرکز کرده است، در حالی که تسلا به دنبال «سرگرمی» و «شخصیت‌سازی» برای خودروهای خود است.

ارزش‌های کاربردی: این تغییر چه سودی برای شما دارد؟

شاید بپرسید که داشتن یک چت‌بات در ماشین چه کاربرد واقعی دارد؟ طبق کدهای فاش شده، جمینی به زودی می‌تواند کنترل کامل ویژگی‌های رفاهی خودرو را در دست بگیرد. شما دیگر نیازی ندارید برای کم کردن دمای هوا یا تغییر موسیقی به مانیتور دست بزنید؛ فقط کافی است به جمینی بگویید. اما موضوع فراتر از این‌هاست. این دستیار برای مدیریت اضطراب مسافران آموزش دیده است. اگر خودرو مجبور به توقف ناگهانی شود یا مسیری غیرمعمول را انتخاب کند، جمینی با جملات «آرام‌بخش و اطمینان‌بخش» به شما توضیح می‌دهد که همه چیز تحت کنترل است.

البته محدودیت‌هایی هم وجود دارد. جمینی هنوز اجازه ندارد کارهای دنیای واقعی مثل سفارش غذا یا رزرو رستوران را انجام دهد. همچنین در مواقع اضطراری، او مستقیماً دخالت نمی‌کند و مسئولیت را به تیم‌های پشتیبانی انسانی واگذار می‌کند. با این حال، یادگیری نحوه تعامل با این سیستم‌ها به شما کمک می‌کند تا در آینده‌ای که خودروها به اتاق‌های نشیمن متحرک تبدیل می‌شوند، بیشترین بهره را از زمان خود ببرید. شما می‌توانید از او بخواهید درباره تاریخچه ساختمانی که از کنارش رد می‌شوید بگوید یا نتیجه آخرین مسابقه ورزشی را برایتان چک کند.

آینده‌ای که با هر سفر هوشمندتر می‌شود

ادغام جمینی در وایمو، شروع یک عصر جدید است که در آن اشیاء پیرامون ما نه تنها دستورات را اجرا می‌کنند، بلکه ما را می‌فهمند. گوگل با استفاده از «دانش جهانی» جمینی، حتی در حال آموزش دادن به سیستم رانندگی خود برای درک سناریوهای پیچیده و نادر جاده‌ای است. این یعنی هوش مصنوعی همزمان هم یاد می‌گیرد که چطور بهتر براند و هم یاد می‌گیرد که چطور همسفر بهتری برای انسان‌ها باشد.

در نهایت، هدف گوگل این است که سفر با یک روبوتاکسی را به تجربه‌ای «لذت‌بخش، یکپارچه و مفید» تبدیل کند. اگر روزی گذرتان به شهرهایی افتاد که وایمو در آن‌ها فعال است، یادتان باشد که پشت آن صدای آرام، ۱۲۰۰ خط کد دقیق و یکی از قدرتمندترین مدل‌های هوش مصنوعی جهان قرار دارد که مراقب است شما نه تنها به مقصد برسید، بلکه از مسیر هم لذت ببرید. آیا شما ترجیح می‌دهید دستیار خودرویتان مثل جمینی مبادی آداب باشد یا مثل گراک شوخ و سرکش؟ نظر خود را با ما در میان بگذارید!

منبع:

Waymo is testing Gemini as an in-car AI assistant in its robotaxis

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *