آخرین بروزرسانی در ۷ اسفند ۱۴۰۴ توسط Dr.Arman
تصور کنید به جای باز کردن دهها تب خستهکننده برای پیدا کردن ارزانترین قبض یا مرتب کردن ایمیلها، فقط به مرورگرتان بگویید: «این کار را برایم انجام بده.» این دقیقاً همان قولی است که عاملهای هوش مصنوعی به ما میدهند. اما آیا واقعاً به آن نقطه رسیدهایم که با خیال راحت قهوه بنوشیم و کار را به آنها بسپاریم؟
چرا حالا؟ نبرد بر سر «انجام دادن» به جای «حرف زدن»
ما اکنون چند سالی است که در میانه انقلاب هوش مصنوعی هستیم. تا همین چند ماه پیش، تمام بحثها سر این بود که کدام چتبات باهوشتر است یا کدامیک بهتر شعر میگوید. اما حالا ورق برگشته است. دیگر کسی فقط به دنبال حرف زدن با ماشین نیست؛ ما میخواهیم ماشینها برایمان «کار» انجام دهند. به همین دلیل است که غولهای فناوری حالا به سراغ توسعه «عاملها» یا همان Agentها رفتهاند.
گوگل به تازگی از عامل جدید خود به نام Auto Browse در مرورگر کروم پردهبرداری کرده است. تفاوت بزرگ این ابزار با Atlasِ شرکت OpenAI در این است که کروم محبوبترین مرورگر جهان است و این عامل، به طور مستقیم در تار و پود وبگردی ما تنیده شده. اما آیا این دسترسی بینظیر به معنای عملکرد بینقص است؟ من تصمیم گرفتم این ربات را در سناریوهای واقعی به چالش بکشم تا ببینم چقدر میتوان به آن اعتماد کرد.
بازی ۲۰۴۸ و اولین چالش: وقتی هوش مصنوعی کلید جهتنما ندارد!
برای شروع، سراغ یک بازی معروف رفتم: ۲۰۴۸. هدف ساده بود؛ به هوش مصنوعی گفتم بازی را تا زمانی که حرکتهایش تمام شود ادامه دهد. اما در کمال تعجب متوجه شدم که Auto Browse نمیتواند از کلیدهای جهتنمای کیبورد استفاده کند! گوگل معتقد است این کلیدها برای کارهای بهرهوری ضروری نیستند. مجبور شدم نسخه خاصی از بازی را پیدا کنم که دکمههای لمسی روی صفحه داشت.
نتیجه جالب بود. ربات بازی را بلد بود اما دستورات را بیش از حد تحتاللفظی اجرا میکرد. وقتی به نقطهای میرسید که هیچ خانهای با هم ادغام نمیشد، دست از کار میکشید، در حالی که هنوز فضاهای خالی روی صفحه وجود داشت. انگار هوش مصنوعی نمیخواست ریسک کند. در نهایت با کمی تشویق و تغییر دستور، توانست حدود ۲۰ دقیقه بازی کند و ۱۴۹ حرکت انجام دهد. نمره ۸ از ۱۰ برای شروع بد نیست، اما هنوز هم نیاز به یک ناظر انسانی داشت.
طنز ماجرا: هوش مصنوعی گوگل که یوتیوب موزیک را نمیفهمد
یکی از بزرگترین ناامیدیها زمانی رخ داد که از Auto Browse خواستم یک لیست پخش از آهنگهای یک ایستگاه رادیویی در یوتیوب موزیک بسازد. در حالی که انتظار داشتم محصولات گوگل با هم هماهنگ باشند، ربات در محیط یوتیوب موزیک کاملاً گیج شد! او نمیتوانست دکمههای طراحی شده توسط خودِ گوگل را پیدا کند.
نکته عجیبتر این بود که وقتی دستور را تغییر دادم و از او خواستم همین کار را در اسپاتیفای انجام دهد، در اولین تلاش موفق شد. این یک درس بزرگ برای ماست: صرفاً چون دو محصول متعلق به یک شرکت هستند، به معنای همکاری بینقص آنها نیست. همچنین متوجه شدم این عاملها نمیتوانند برای مدت طولانی (مثلاً یک ساعت) روی یک صفحه بمانند تا اتفاقی را رصد کنند؛ آنها زود خسته میشوند و وانمود میکنند که زمان گذشته است!
فاجعه در جیمیل: چرا نباید فعلاً به ایجنتها اعتماد کامل کرد؟
اگر فکر میکنید میتوانید مدیریت ایمیلهایتان را به این عاملها بسپارید، بهتر است کمی صبر کنید. من از Auto Browse خواستم ایمیلهای تبلیغاتی یک ماه گذشته را بررسی کند و اطلاعات تماس آنها را در یک فایل گوگل شیتس (Spreadsheets) ثبت کند. نتیجه یک فاجعه تمامعیار بود.
ربات به جای دهها ایمیل، فقط دو مورد را پیدا کرد و آنها را هم با فرمت کاملاً اشتباه در جدول وارد کرد؛ طوری که تاریخها در ستونهای بیربط نوشته شده بودند و اطلاعات روی هم میافتادند. با اینکه گوگل ابزارهای داخلی قدرتمندی برای جستجو در جیمیل دارد، اما انگار این عامل هنوز نمیداند چگونه دادهها را به درستی استخراج و دستهبندی کند. نمره ۱ از ۱۰ برای این بخش، هشداری جدی است که فعلاً کارهای حساس اداری را به تنهایی به هوش مصنوعی نسپارید.
درخشش ناگهانی در تگزاس: وقتی هوش مصنوعی واقعاً مفید میشود
اما همه چیز هم بد نبود. سختترین آزمون من مربوط به پیدا کردن یک طرح برق ارزان در ایالت تگزاس بود که سیستم پیچیده و گیجکنندهای دارد. من پارامترهای بسیار دقیقی به ربات دادم: میزان مصرف، محدوده قرارداد و نام شرکت توزیعکننده. Auto Browse مثل یک حرفهای عمل کرد. او به سایت مربوطه رفت، فیلترها را به درستی اعمال کرد، نتایج را مرتب کرد و در عرض چند دقیقه، دقیقترین پیشنهاد ممکن را به همراه برگه مشخصات فنی تحویل داد.
اینجا بود که پتانسیل واقعی عاملهای هوش مصنوعی را دیدم. در جایی که نیاز به پر کردن فرمهای طولانی، انتخاب از دراپداونها و تحلیل اعداد و ارقام خشک بود، Auto Browse بدون هیچ اشتباهی و با نمره کامل ۱۰ از ۱۰ پیروز شد. انگار این رباتها در محیطهای ساختاریافته و دیتامحور، بسیار بهتر از محیطهای بصری و خلاقانه عمل میکنند.
چگونه از این عاملهای نوپا بیشترین بهره را ببرید؟
اگر شما هم جزو مشترکین AI Pro گوگل هستید و میخواهید از این قابلیت استفاده کنید، چند نکته کلیدی وجود دارد که باید بدانید. اول اینکه، هرگز ربات را به حال خود رها نکنید. همانطور که در آزمایشهای من مشخص شد، شما باید بالای سر او بایستید و مثل یک کودک که به تازگی راه رفتن یاد گرفته، او را راهنمایی کنید.
دوم، دستورات یا همان «پرامپتهای» خود را مرحلهبندی کنید. به جای اینکه یکباره یک پروژه بزرگ بخواهید، کار را به تکههای کوچک تقسیم کنید. مثلاً ابتدا بخواهید اطلاعات را پیدا کند، و در مرحله بعد بخواهید آنها را وارد جدول کند. و نکته آخر اینکه، اگر ربات در سایتی گیر کرد، احتمالاً مشکل از منوهای شناور (Hover) است؛ در این مواقع از او بخواهید از نمای لیست (List View) استفاده کند.
نتیجهگیری: رویای بزرگ، قدمهای کوچک
در نهایت، میانگین نمرات Auto Browse در آزمایشهای من چیزی حدود ۶.۵ از ۱۰ بود. این یعنی ما هنوز با آن «دستیار همهفنحریف» که در فیلمهای علمی-تخیلی میبینیم، فاصله داریم. تماشای مرورگری که خودش تبها را باز میکند و فرمها را پر میکند بسیار هیجانانگیز است، اما در حال حاضر بیشتر شبیه به پرستاری از رباتی است که زود حواسش پرت میشود.
با این حال، سرعت پیشرفت باورنکردنی است. همین که کروم میتواند کارهای پیچیده اداری را در برخی سایتها به درستی انجام دهد، نیمی از راه است. آیا شما حاضرید اجازه دهید هوش مصنوعی به جای شما در وب بگردد و خرید کند؟ یا فکر میکنید هنوز برای سپردن کنترلِ ماوس به دست ماشینها زود است؟ آینده همینجاست، اما فعلاً بهتر است دستتان را از روی ترمز برندارید!
منبع:
https://arstechnica.com/google/2026/02/tested-how-chromes-auto-browse-agent-handles-common-web-tasks/

مطالب مرتبط