آخرین بروزرسانی در ۴ دی ۱۴۰۴ توسط Dr.Arman
تصور کنید در صندلی عقب یک تاکسی بدون راننده نشستهاید و ماشین به آرامی در شلوغی شهر حرکت میکند؛ ناگهان صدایی آشنا و دوستانه شما را با نام کوچکتان صدا میزند و میپرسد که آیا دمای ماشین مناسب است یا خیر. این دقیقاً همان آیندهای است که در جدیدترین اخبار دنیای هوش مصنوعی فاش شده است: گوگل در حال تبدیل کردن مدل زبانی «جمینی» به یک دستیار اختصاصی برای روبوتاکسیهای وایمو (Waymo) است تا تجربه سفر شما را از یک جابهجایی ساده به یک تعامل هوشمند تبدیل کند.
چرا این تحول همین حالا برای ما اهمیت دارد؟
ما در دورانی هستیم که خودروهای خودران دیگر یک رویای علمی-تخیلی نیستند، اما هنوز یک مشکل بزرگ وجود دارد: «اعتماد و ارتباط انسانی». وقتی رانندهای در کار نباشد، مسافر ممکن است احساس تنهایی یا حتی ناامنی کند. ورود جمینی به خودروهای وایمو، پاسخی هوشمندانه به این خلاء است. گوگل متوجه شده که برای پذیرش عمومی خودروهای بدون راننده، فقط مهندسی دقیق رانندگی کافی نیست؛ بلکه خودرو باید بتواند مانند یک میزبان حرفهای با مسافر تعامل داشته باشد. این ادغام، قدرت تحلیل متنی جمینی را با دنیای فیزیکی پیوند میزند و استانداردهای جدیدی برای «هوش مصنوعی درونخودرویی» تعریف میکند.
افشای بزرگ: ۱۲۰۰ خط کد که رازهای وایمو را برملا کرد
همه چیز از یک کنجکاوی فنی شروع شد. جین منچون وانگ، محققی که به شکار ویژگیهای منتشرنشده معروف است، در کدهای اپلیکیشن موبایل وایمو به سندی دست یافت که با نام «Meta-Prompt دستیار سفر وایمو» شناخته میشود. این سند بیش از ۱۲۰۰ خط دستورالعمل دقیق است که به جمینی دیکته میکند دقیقاً چطور باید در داخل خودرو رفتار کند. این کدها نشان میدهند که جمینی قرار نیست فقط یک چتبات ساده باشد که به سوالات عمومی پاسخ دهد؛ او وظیفه دارد محیط داخلی خودرو را مدیریت کرده و آرامش مسافر را تضمین کند.
جالب است بدانید که این دستیار اجازه دارد به دادههای سیاقمندی (Contextual Data) درباره شما دسترسی داشته باشد. مثلاً او میداند شما تا به حال چند بار با وایمو سفر کردهاید و بر همین اساس، لحن خوشآمدگویی خود را تنظیم میکند. طبق این دستورالعملها، جمینی باید از جملات کوتاه (یک تا سه جمله) استفاده کند و از به کار بردن اصطلاحات فنی پیچیده پرهیز کند تا تجربهای کاملاً صمیمی و راحت برای شما رقم بزند. او یک همسفر است، نه یک تکنسین رباتیک.
مرز باریک میان هوش مصنوعی و سیستم رانندگی
یکی از هوشمندانهترین بخشهای این ۱۲۰۰ خط کد، تفکیک دقیق هویت جمینی از «راننده وایمو» است. گوگل به شدت تاکید دارد که مسافر نباید این دو را با هم اشتباه بگیرد. اگر از جمینی بپرسید «چطور جاده را میبینی؟»، او اجازه ندارد بگوید «من از سنسورها استفاده میکنم»؛ بلکه باید پاسخ دهد «راننده وایمو (Waymo Driver) از ترکیبی از سنسورها استفاده میکند…». این تفکیک هویت نشان میدهد که گوگل میخواهد مسئولیت رانندگی را از مسئولیت پاسخگویی جدا کند تا در صورت بروز هرگونه خطا، هوش مصنوعیِ گفتگوکننده زیر سوال نرود.
نکته جالب دیگر، نحوه برخورد جمینی با سوالات چالشی است. طبق دستورالعملها، اگر مسافری درباره تصادفات قبلی وایمو یا ویدیوهای جنجالی در اینترنت بپرسد، جمینی ماموریت دارد که بحث را منحرف کرده و از موضع تدافعی یا عذرخواهی خودداری کند. او یک سخنگوی روابط عمومی نیست؛ او فقط یک دستیار برای راحتی شماست. حتی در مورد رقبایی مثل تسلا یا کروز، جمینی دستورات خاصی دارد تا چگونه پاسخ دهد که نه تبلیغی برای آنها باشد و نه توهینی به برندهای رقیب.
جمینی در مقابل گِراک؛ رقابت غولها در صندلی جلو
وایمو تنها شرکتی نیست که به فکر دستیار هوشمند افتاده است. ایلان ماسک هم با ادغام هوش مصنوعی Grok در خودروهای تسلا، مسیر مشابهی را طی میکند. اما تفاوت فلسفی این دو رویکرد بسیار دیدنی است. گراک (Grok) بیشتر به عنوان یک «رفیق» طراحی شده که میتواند گفتگوهای طولانی داشته باشد، شوخی کند و لحنی تند و تیز داشته باشد. اما جمینی در وایمو، بیشتر شبیه به یک «مهماندار مجرب» یا «کنسیرژ هتل» است؛ عملگرا، مودب، و متمرکز بر نیازهای لحظهای مسافر.
در حالی که گراک ممکن است با شما درباره تئوریهای توطئه بحث کند، جمینی ترجیح میدهد دمای کولر را تنظیم کند، نور مخفی خودرو را تغییر دهد یا به شما بگوید که نزدیکترین شعبه فروشگاه مورد نظرتان چه ساعتی بسته میشود. این تفاوت نشان میدهد که گوگل بر روی «کاربردی بودن» و «ایمنی روانی» تمرکز کرده است، در حالی که تسلا به دنبال «سرگرمی» و «شخصیتسازی» برای خودروهای خود است.
ارزشهای کاربردی: این تغییر چه سودی برای شما دارد؟
شاید بپرسید که داشتن یک چتبات در ماشین چه کاربرد واقعی دارد؟ طبق کدهای فاش شده، جمینی به زودی میتواند کنترل کامل ویژگیهای رفاهی خودرو را در دست بگیرد. شما دیگر نیازی ندارید برای کم کردن دمای هوا یا تغییر موسیقی به مانیتور دست بزنید؛ فقط کافی است به جمینی بگویید. اما موضوع فراتر از اینهاست. این دستیار برای مدیریت اضطراب مسافران آموزش دیده است. اگر خودرو مجبور به توقف ناگهانی شود یا مسیری غیرمعمول را انتخاب کند، جمینی با جملات «آرامبخش و اطمینانبخش» به شما توضیح میدهد که همه چیز تحت کنترل است.
البته محدودیتهایی هم وجود دارد. جمینی هنوز اجازه ندارد کارهای دنیای واقعی مثل سفارش غذا یا رزرو رستوران را انجام دهد. همچنین در مواقع اضطراری، او مستقیماً دخالت نمیکند و مسئولیت را به تیمهای پشتیبانی انسانی واگذار میکند. با این حال، یادگیری نحوه تعامل با این سیستمها به شما کمک میکند تا در آیندهای که خودروها به اتاقهای نشیمن متحرک تبدیل میشوند، بیشترین بهره را از زمان خود ببرید. شما میتوانید از او بخواهید درباره تاریخچه ساختمانی که از کنارش رد میشوید بگوید یا نتیجه آخرین مسابقه ورزشی را برایتان چک کند.
آیندهای که با هر سفر هوشمندتر میشود
ادغام جمینی در وایمو، شروع یک عصر جدید است که در آن اشیاء پیرامون ما نه تنها دستورات را اجرا میکنند، بلکه ما را میفهمند. گوگل با استفاده از «دانش جهانی» جمینی، حتی در حال آموزش دادن به سیستم رانندگی خود برای درک سناریوهای پیچیده و نادر جادهای است. این یعنی هوش مصنوعی همزمان هم یاد میگیرد که چطور بهتر براند و هم یاد میگیرد که چطور همسفر بهتری برای انسانها باشد.
در نهایت، هدف گوگل این است که سفر با یک روبوتاکسی را به تجربهای «لذتبخش، یکپارچه و مفید» تبدیل کند. اگر روزی گذرتان به شهرهایی افتاد که وایمو در آنها فعال است، یادتان باشد که پشت آن صدای آرام، ۱۲۰۰ خط کد دقیق و یکی از قدرتمندترین مدلهای هوش مصنوعی جهان قرار دارد که مراقب است شما نه تنها به مقصد برسید، بلکه از مسیر هم لذت ببرید. آیا شما ترجیح میدهید دستیار خودرویتان مثل جمینی مبادی آداب باشد یا مثل گراک شوخ و سرکش؟ نظر خود را با ما در میان بگذارید!
منبع:
Waymo is testing Gemini as an in-car AI assistant in its robotaxis

مطالب مرتبط