وقتی گوگل کروم به جای شما وب‌گردی می‌کند: آزمون واقعی عامل‌های هوش مصنوعی

امتیاز دهید post

آخرین بروزرسانی در ۷ اسفند ۱۴۰۴ توسط Dr.Arman

تصور کنید به جای باز کردن ده‌ها تب خسته‌کننده برای پیدا کردن ارزان‌ترین قبض یا مرتب کردن ایمیل‌ها، فقط به مرورگرتان بگویید: «این کار را برایم انجام بده.» این دقیقاً همان قولی است که عامل‌های هوش مصنوعی به ما می‌دهند. اما آیا واقعاً به آن نقطه رسیده‌ایم که با خیال راحت قهوه بنوشیم و کار را به آن‌ها بسپاریم؟

فهرست مطالب

چرا حالا؟ نبرد بر سر «انجام دادن» به جای «حرف زدن»

ما اکنون چند سالی است که در میانه انقلاب هوش مصنوعی هستیم. تا همین چند ماه پیش، تمام بحث‌ها سر این بود که کدام چت‌بات باهوش‌تر است یا کدام‌یک بهتر شعر می‌گوید. اما حالا ورق برگشته است. دیگر کسی فقط به دنبال حرف زدن با ماشین نیست؛ ما می‌خواهیم ماشین‌ها برایمان «کار» انجام دهند. به همین دلیل است که غول‌های فناوری حالا به سراغ توسعه «عامل‌ها» یا همان Agentها رفته‌اند.

گوگل به تازگی از عامل جدید خود به نام Auto Browse در مرورگر کروم پرده‌برداری کرده است. تفاوت بزرگ این ابزار با Atlasِ شرکت OpenAI در این است که کروم محبوب‌ترین مرورگر جهان است و این عامل، به طور مستقیم در تار و پود وب‌گردی ما تنیده شده. اما آیا این دسترسی بی‌نظیر به معنای عملکرد بی‌نقص است؟ من تصمیم گرفتم این ربات را در سناریوهای واقعی به چالش بکشم تا ببینم چقدر می‌توان به آن اعتماد کرد.

بازی ۲۰۴۸ و اولین چالش: وقتی هوش مصنوعی کلید جهت‌نما ندارد!

برای شروع، سراغ یک بازی معروف رفتم: ۲۰۴۸. هدف ساده بود؛ به هوش مصنوعی گفتم بازی را تا زمانی که حرکت‌هایش تمام شود ادامه دهد. اما در کمال تعجب متوجه شدم که Auto Browse نمی‌تواند از کلیدهای جهت‌نمای کیبورد استفاده کند! گوگل معتقد است این کلیدها برای کارهای بهره‌وری ضروری نیستند. مجبور شدم نسخه خاصی از بازی را پیدا کنم که دکمه‌های لمسی روی صفحه داشت.

نتیجه جالب بود. ربات بازی را بلد بود اما دستورات را بیش از حد تحت‌اللفظی اجرا می‌کرد. وقتی به نقطه‌ای می‌رسید که هیچ خانه‌ای با هم ادغام نمی‌شد، دست از کار می‌کشید، در حالی که هنوز فضاهای خالی روی صفحه وجود داشت. انگار هوش مصنوعی نمی‌خواست ریسک کند. در نهایت با کمی تشویق و تغییر دستور، توانست حدود ۲۰ دقیقه بازی کند و ۱۴۹ حرکت انجام دهد. نمره ۸ از ۱۰ برای شروع بد نیست، اما هنوز هم نیاز به یک ناظر انسانی داشت.

طنز ماجرا: هوش مصنوعی گوگل که یوتیوب موزیک را نمی‌فهمد

یکی از بزرگ‌ترین ناامیدی‌ها زمانی رخ داد که از Auto Browse خواستم یک لیست پخش از آهنگ‌های یک ایستگاه رادیویی در یوتیوب موزیک بسازد. در حالی که انتظار داشتم محصولات گوگل با هم هماهنگ باشند، ربات در محیط یوتیوب موزیک کاملاً گیج شد! او نمی‌توانست دکمه‌های طراحی شده توسط خودِ گوگل را پیدا کند.

نکته عجیب‌تر این بود که وقتی دستور را تغییر دادم و از او خواستم همین کار را در اسپاتیفای انجام دهد، در اولین تلاش موفق شد. این یک درس بزرگ برای ماست: صرفاً چون دو محصول متعلق به یک شرکت هستند، به معنای همکاری بی‌نقص آن‌ها نیست. همچنین متوجه شدم این عامل‌ها نمی‌توانند برای مدت طولانی (مثلاً یک ساعت) روی یک صفحه بمانند تا اتفاقی را رصد کنند؛ آن‌ها زود خسته می‌شوند و وانمود می‌کنند که زمان گذشته است!

فاجعه در جیمیل: چرا نباید فعلاً به ایجنت‌ها اعتماد کامل کرد؟

اگر فکر می‌کنید می‌توانید مدیریت ایمیل‌هایتان را به این عامل‌ها بسپارید، بهتر است کمی صبر کنید. من از Auto Browse خواستم ایمیل‌های تبلیغاتی یک ماه گذشته را بررسی کند و اطلاعات تماس آن‌ها را در یک فایل گوگل شیتس (Spreadsheets) ثبت کند. نتیجه یک فاجعه تمام‌عیار بود.

ربات به جای ده‌ها ایمیل، فقط دو مورد را پیدا کرد و آن‌ها را هم با فرمت کاملاً اشتباه در جدول وارد کرد؛ طوری که تاریخ‌ها در ستون‌های بی‌ربط نوشته شده بودند و اطلاعات روی هم می‌افتادند. با اینکه گوگل ابزارهای داخلی قدرتمندی برای جستجو در جیمیل دارد، اما انگار این عامل هنوز نمی‌داند چگونه داده‌ها را به درستی استخراج و دسته‌بندی کند. نمره ۱ از ۱۰ برای این بخش، هشداری جدی است که فعلاً کارهای حساس اداری را به تنهایی به هوش مصنوعی نسپارید.

درخشش ناگهانی در تگزاس: وقتی هوش مصنوعی واقعاً مفید می‌شود

اما همه چیز هم بد نبود. سخت‌ترین آزمون من مربوط به پیدا کردن یک طرح برق ارزان در ایالت تگزاس بود که سیستم پیچیده و گیج‌کننده‌ای دارد. من پارامترهای بسیار دقیقی به ربات دادم: میزان مصرف، محدوده قرارداد و نام شرکت توزیع‌کننده. Auto Browse مثل یک حرفه‌ای عمل کرد. او به سایت مربوطه رفت، فیلترها را به درستی اعمال کرد، نتایج را مرتب کرد و در عرض چند دقیقه، دقیق‌ترین پیشنهاد ممکن را به همراه برگه مشخصات فنی تحویل داد.

اینجا بود که پتانسیل واقعی عامل‌های هوش مصنوعی را دیدم. در جایی که نیاز به پر کردن فرم‌های طولانی، انتخاب از دراپ‌داون‌ها و تحلیل اعداد و ارقام خشک بود، Auto Browse بدون هیچ اشتباهی و با نمره کامل ۱۰ از ۱۰ پیروز شد. انگار این ربات‌ها در محیط‌های ساختاریافته و دیتامحور، بسیار بهتر از محیط‌های بصری و خلاقانه عمل می‌کنند.

چگونه از این عامل‌های نوپا بیشترین بهره را ببرید؟

اگر شما هم جزو مشترکین AI Pro گوگل هستید و می‌خواهید از این قابلیت استفاده کنید، چند نکته کلیدی وجود دارد که باید بدانید. اول اینکه، هرگز ربات را به حال خود رها نکنید. همان‌طور که در آزمایش‌های من مشخص شد، شما باید بالای سر او بایستید و مثل یک کودک که به تازگی راه رفتن یاد گرفته، او را راهنمایی کنید.

دوم، دستورات یا همان «پرامپت‌های» خود را مرحله‌بندی کنید. به جای اینکه یکباره یک پروژه بزرگ بخواهید، کار را به تکه‌های کوچک تقسیم کنید. مثلاً ابتدا بخواهید اطلاعات را پیدا کند، و در مرحله بعد بخواهید آن‌ها را وارد جدول کند. و نکته آخر اینکه، اگر ربات در سایتی گیر کرد، احتمالاً مشکل از منوهای شناور (Hover) است؛ در این مواقع از او بخواهید از نمای لیست (List View) استفاده کند.

نتیجه‌گیری: رویای بزرگ، قدم‌های کوچک

در نهایت، میانگین نمرات Auto Browse در آزمایش‌های من چیزی حدود ۶.۵ از ۱۰ بود. این یعنی ما هنوز با آن «دستیار همه‌فن‌حریف» که در فیلم‌های علمی-تخیلی می‌بینیم، فاصله داریم. تماشای مرورگری که خودش تب‌ها را باز می‌کند و فرم‌ها را پر می‌کند بسیار هیجان‌انگیز است، اما در حال حاضر بیشتر شبیه به پرستاری از رباتی است که زود حواسش پرت می‌شود.

با این حال، سرعت پیشرفت باورنکردنی است. همین که کروم می‌تواند کارهای پیچیده اداری را در برخی سایت‌ها به درستی انجام دهد، نیمی از راه است. آیا شما حاضرید اجازه دهید هوش مصنوعی به جای شما در وب بگردد و خرید کند؟ یا فکر می‌کنید هنوز برای سپردن کنترلِ ماوس به دست ماشین‌ها زود است؟ آینده همین‌جاست، اما فعلاً بهتر است دستتان را از روی ترمز برندارید!

منبع:

https://arstechnica.com/google/2026/02/tested-how-chromes-auto-browse-agent-handles-common-web-tasks/