آخرین بروزرسانی در ۱۸ بهمن ۱۴۰۴ توسط Dr.Arman
تصور کنید در دنیایی زندگی میکنیم که ماشینها میتوانند کارهایی را که ساعتها از ما زمان میبرند، در چشمبههمزدنی انجام دهند. هر بار که شرکتهایی مثل OpenAI، گوگل یا آنتروپیک مدل جدیدی را روانه بازار میکنند، جامعه هوش مصنوعی نفسش را در سینه حبس میکند. این انتظار فقط برای دیدن قابلیتهای جدید نیست؛ بلکه همه منتظرند ببینند نمودار مشهور موسسه METR چه تغییری میکند. آیا به مرزهای هوش مصنوعی عمومی رسیدهایم یا فقط در حال تماشای یک نمایش تبلیغاتی بزرگ هستیم؟
چرا این نمودار لرزه بر تن مهندسان انداخته است؟
داستان از نوامبر گذشته شروع شد، وقتی آنتروپیک از مدل «Claude Opus 4.5» رونمایی کرد. بلافاصله پس از آن، موسسه METR که کارش ارزیابی تهدیدات و توانمندیهای مدلهای پیشرو است، نمودار نمادین خود را بهروزرسانی کرد. نتیجه شوکهکننده بود: این مدل میتوانست کارهایی را انجام دهد که انجام آنها برای یک انسان متخصص حدود ۵ ساعت زمان میبرد. این یعنی پیشرفتی بسیار فراتر از آن چیزی که حتی روندهای صعودی قبلی پیشبینی میکردند.
واکنشها آنقدر دراماتیک بود که یکی از محققان ایمنی آنتروپیک در توییتی نوشت: «مامان بیا دنبال من، من میترسم!» اما حقیقت، مثل همیشه، کمی پیچیدهتر از تیترهای هیجانزده رسانهها و توییتر است. اگر شما هم جزو عاشقان هوش مصنوعی هستید، باید بدانید که زیر لایههای این نمودار درخشان، واقعیتهایی پنهان شده که میتواند نگاه شما را به آینده تغییر دهد.
معمای «افق زمانی»؛ عددی که همه را به اشتباه انداخت
بیایید با هم روراست باشیم؛ وقتی عددی مثل «۵ ساعت» را روی محور عمودی یک نمودار میبینیم، اولین چیزی که به ذهنمان میرسد این است که هوش مصنوعی میتواند ۵ ساعت به طور مستقل بنشیند و کار کند. اما این دقیقاً همان جایی است که سوءتفاهم بزرگ رخ میدهد. سیدنی فون آرکس، از اعضای تیم فنی METR، میگوید مردم بیش از حد از این نمودار برداشت میکنند.
آنچه METR اندازه میگیرد، «افق زمانی» نام دارد. این یک واحد اندازهگیری منحصربهفرد است که توسط خود این موسسه ابداع شده. برای محاسبه آن، آنها مجموعهای از وظایف برنامهنویسی را به انسانها دادند و زمان لازم برای حل آنها را ثبت کردند. سپس همان کارها را به هوش مصنوعی سپردند. عدد ۵ ساعت به این معنا نیست که مدل ۵ ساعت کار کرده، بلکه به این معناست که آن مدل توانسته وظایفی را که «انسانها» در ۵ ساعت انجام میدهند، با موفقیت ۵۰ درصدی پشت سر بگذارد.
چرا نباید زندگیتان را به این نمودار گره بزنید؟
شاید بپرسید خب، چه فرقی میکند؟ تفاوت در اینجاست که مدل ممکن است آن کار ۵ ساعته را در عرض چند دقیقه انجام دهد یا اصلاً در میانه راه گیج شود و شکست بخورد. توماس کوا، یکی از نویسندگان اصلی این تحقیق، میگوید که ماشین تبلیغاتی دنیای تکنولوژی معمولاً تمام هشدارهای علمی و «اما و اگرها» را حذف میکند تا فقط یک روند صعودی خیرهکننده را نشان دهد.
یکی از بزرگترین محدودیتهای این نمودار، تمرکز شدید آن بر «کدنویسی» است. این درست است که هوش مصنوعی در نوشتن کد به سرعت در حال پیشرفت است، اما آیا پیشرفت در پایتون به معنای پیشرفت در حل مسائل پیچیده اخلاقی یا مدیریت یک پروژه واقعی است؟ دانیل کانگ، استاد علوم کامپیوتر، معتقد است که بهتر شدن در کدنویسی به طور جادویی به معنای بهتر شدن در همه زمینههای دیگر نیست.
وقتی دنیای واقعی از آزمایشگاه کثیفتر است
در آزمایشگاههای METR، وظایف در محیطی کنترلشده به هوش مصنوعی داده میشوند. اما در دنیای واقعی، کارها «کثیف» هستند. کثیف بودن در اینجا یعنی شما دقیقاً نمیدانید چه کسی قرار است به شما امتیاز بدهد، منابع تغییر میکنند و اگر اشتباهی کنید، به این راحتی نمیتوانید دکمه «ریست» را بزنید. تحقیقات نشان داده که وقتی وظایف کمی از حالت استاندارد خارج شده و به واقعیت نزدیک میشوند، عملکرد مدلها به شدت افت میکند.
حتی یک مطالعه در جولای ۲۰۲۵ نشان داد که دستیاران کدنویسی هوش مصنوعی ممکن است در واقع سرعت مهندسان نرمافزار را «کاهش» دهند! این پارادوکسی است که در نمودارهای صعودی دیده نمیشود. مدل ممکن است یک مسئله ریاضی پیچیده را حل کند، اما وقتی از او بخواهید یک ایمیل ساده اما با لحن مناسب به رئیستان بزند، ممکن است کاملاً شکست بخورد.
چگونه مثل یک حرفهای به اخبار هوش مصنوعی نگاه کنیم؟
حالا که با واقعیت پشت این نمودار آشنا شدید، احتمالاً میپرسید که چطور باید اخبار بعدی را فیلتر کنیم؟ اولین قدم این است که به «خطاهای آماری» توجه کنید. خودِ موسسه METR اعتراف کرده که تخمینهایشان بازه خطای بزرگی دارد. مثلاً مدل Opus 4.5 ممکن است کارهای ۲ ساعته را انجام دهد یا شاید کارهای ۲۰ ساعته را؛ ما هنوز دقیقاً نمیدانیم.
دوم اینکه، همیشه به یاد داشته باشید که «پیشرفت در یک حوزه» به معنای «پیشرفت در همه حوزهها» نیست. هوش مصنوعی در حال حاضر مثل یک متخصص است که در یک رشته خاص (مثل کدنویسی) فوقالعاده عمل میکند، اما در مهارتهای عمومی زندگی هنوز مثل یک کودک است. پس هر زمان که نموداری با رشد نمایی دیدید، بپرسید: «این دقیقاً چه چیزی را اندازه میگیرد؟»
آینده در دست کیست؟ ابزار یا پیشگو؟
با تمام این اوصاف، نباید از ارزش کار METR غافل شد. حتی منتقدان سرسختی مثل گری مارکوس هم اعتراف میکنند که این تلاش برای تبدیل کردن شهود ما از پیشرفت هوش مصنوعی به اعداد و ارقام، بسیار ارزشمند است. این نمودار یک «پیشگو» نیست که تاریخ دقیق نابودی یا نجات بشریت را بگوید؛ بلکه یک ابزار علمی است که با تمام نقصهایش، بهترین چیزی است که در حال حاضر در اختیار داریم.
سیدنی فون آرکس در نهایت میگوید: «این ابزار از جهات بسیاری عمیقاً ناقص است، اما فکر میکنم یکی از بهترین نمونهها در نوع خودش باشد.» پیشرفت هوش مصنوعی واقعی است و سرعت آن هم سرسامآور است، اما برای درک آن، باید فراتر از نمودارهای ساده نگاه کنیم و به دنبال حقیقت در جزئیات باشیم.
جمعبندی: هوشمندانه دنبال کنید
ما در میانه یکی از هیجانانگیزترین دورانهای تاریخ بشر هستیم. هوش مصنوعی عمومی دیگر یک رویای دور نیست، بلکه موضوع بحثهای جدی علمی است. اما نباید اجازه دهیم هیاهوی رسانهای، قدرت تحلیل ما را بگیرد. نمودار METR به ما میگوید که توانایی ماشینها در حل مسائل سخت (به زبان انسانها) هر ۷ ماه دو برابر میشود. این یک واقعیت بزرگ است، اما اینکه این توانایی چطور در زندگی روزمره شما ظاهر میشود، داستانی است که هنوز در حال نوشته شدن است.
نظر شما چیست؟ آیا فکر میکنید هوش مصنوعی واقعاً میتواند به زودی جایگزین بخش بزرگی از کارهای روزانه ما شود، یا این نمودارها فقط بخشی از یک حباب بزرگ تکنولوژی هستند؟ نظرات خود را با ما در میان بگذارید و اگر این مطلب برایتان مفید بود، آن را با دیگر دوستان عاشق تکنولوژی خود به اشتراک بگذارید.
منبع:
https://www.technologyreview.com/2026/02/05/1132254/this-is-the-most-misunderstood-graph-in-ai/

مطالب مرتبط