آخرین بروزرسانی در ۱۷ مهر ۱۴۰۳ توسط Dr.Arman
سری جدیدی از مدلهای Chatgpt OpenAI o1-preview یا به عبارت بهتر چت جی پی تی o1، که به خوبی قابلیت استدلال برای حل مسائل دشوار را دارا میباشد، رونمایی شد. در ادامه، توضیحات شرکت OpenAI را در خصوص این مدل خواهید خواند:
ما یک سری جدید از مدلهای هوش مصنوعی طراحی کردهایم که زمان بیشتری را به تفکر قبل از پاسخ اختصاص میدهند. این مدلها قادر به استدلال در مورد وظایف پیچیده و حل مسائل دشوارتر از مدلهای قبلی در علم، برنامهنویسی و ریاضیات هستند. امروز اولین مدل از این سری را در ChatGPT و API خود منتشر میکنیم. این یک پیشنمایش است و ما انتظار داریم که بهروزرسانیها و بهبودهای منظم داشته باشیم. همراه با این انتشار، ما همچنین ارزیابیهایی را برای بهروزرسانی بعدی که در حال توسعه است، ارائه میدهیم.
Chatgpt OpenAI o1-preview چگونه کار میکند؟
ما این مدلها را آموزش دادهایم تا زمان بیشتری را برای فکر کردن به مشکلات قبل از پاسخ دادن اختصاص دهند، دقیقاً مانند یک انسان. در طی آموزش، آنها یاد میگیرند که فرآیند تفکر خود را تصحیح کنند، استراتژیهای مختلف را امتحان کنند و اشتباهات خود را تشخیص دهند.
در آزمایشات ما، بهروزرسانی مدل بعدی در وظایف پیچیده مانند فیزیک، شیمی و زیستشناسی به مشابه دانشجویان دکترا عمل کرده است. همچنین دریافتیم که این مدل در ریاضیات و برنامهنویسی بسیار برتر است. در آزمون مقدماتی المپیاد بینالمللی ریاضیات (IMO)، GPT-4o تنها 13 درصد از مسائل را حل کرد، در حالی که مدل استدلال ما 83 درصد موفقیت داشت. قابلیتهای کدنویسی آن نیز در مسابقات بررسی شد و به رتبه 89 درصدی در مسابقات Codeforces دست یافت. شما میتوانید بیشتر در مورد این موضوع را در پست تحقیقات فنی ما بخوانید.
به عنوان یک مدل اولیه، هنوز بسیاری از ویژگیهایی که ChatGPT را مفید میکند، مانند مرور وب برای اطلاعات و آپلود فایلها و تصاویر، ندارد. اما برای وظایف استدلال پیچیده، این یک پیشرفت مهم است و نمایانگر یک سطح جدید از توانایی هوش مصنوعی است. با توجه به این موضوع، ما شماره مدل را به 1 بازنشانی کرده و این سری را OpenAI o1 نامیدهایم.
ایمنی مدل Chatgpt OpenAI o1-preview
به عنوان بخشی از توسعه این مدلهای جدید، ما یک رویکرد آموزشی ایمنی جدید ایجاد کردهایم که از قابلیتهای استدلال آنها استفاده میکند تا از دستورالعملهای ایمنی و همراستایی پیروی کنند. با توانایی استدلال در مورد قوانین ایمنی ما در متن، این مدلها قادر به اعمال آنها به طور موثرتر هستند.
یکی از راههایی که ما ایمنی را اندازهگیری میکنیم، آزمایش این است که چقدر مدل ما در پیروی از قوانین ایمنی خود پایدار میماند اگر کاربر سعی کند آنها را دور بزند (که به عنوان “جیلبریکینگ” شناخته میشود). در یکی از سختترین آزمایشهای جیلبریکینگ ما، GPT-4o امتیاز 22 (در مقیاس 0 تا 100) را کسب کرد، در حالی که مدل پیشنمایش o1 امتیاز 84 را به دست آورد.
برای مطابقت با تواناییهای جدید این مدلها، ما کارهای ایمنی خود را تقویت کردهایم. این شامل تستهای دقیق و ارزیابیهایی با استفاده از چارچوب آمادگی ما، تیمهای قرمز برتر و فرایندهای بررسی در سطح هیئت مدیره، از جمله کمیته ایمنی و امنیت ما است. برای پیشبرد تعهد ما به ایمنی هوش مصنوعی، ما اخیراً توافقاتی با موسسات ایمنی هوش مصنوعی در ایالات متحده و بریتانیا رسمی کردهایم. ما شروع به عملیاتی کردن این توافقات کردهایم که شامل ارائه دسترسی اولیه به نسخه تحقیقاتی این مدل به موسسات است. این اولین گام مهم در همکاری ما بود که به ایجاد فرآیند برای ارزیابی و آزمایش مدلهای آینده قبل و پس از انتشار عمومی آنها کمک کرد.
Chatgpt OpenAI o1-preview برای چه کسانی طراحی شده است؟
این قابلیتهای استدلال پیشرفته ممکن است به ویژه مفید باشد اگر شما در حال حل مشکلات پیچیده در زمینههای علمی، برنامهنویسی، ریاضیات و زمینههای مشابه هستید. به عنوان مثال، Chatgpt OpenAI o1-preview میتواند توسط محققان حوزه سلامت برای حاشیهنویسی دادههای توالییابی سلولی، توسط فیزیکدانان برای تولید فرمولهای ریاضی پیچیده مورد نیاز برای اپتیک کوانتومی و توسط توسعهدهندگان در تمام زمینهها برای ساخت و اجرای فرآیندهای چندمرحلهای مورد استفاده قرار گیرد.
سری OpenAI o1-mini، در تولید و رفع اشکال دقیق کدهای پیچیده بسیار برجسته است. برای ارائه راهحل کارآمدتر به توسعهدهندگان، ما همچنین OpenAI o1-mini را معرفی میکنیم، یک مدل استدلال سریعتر و ارزانتر که به طور خاص در برنامهنویسی بسیار موثر است. به عنوان یک مدل کوچکتر، o1-mini 80 درصد ارزانتر از o1-preview است و آن را به یک مدل قدرتمند و مقرون به صرفه برای کاربردهایی که نیاز به استدلال دارند اما نه دانش جهانی گسترده، تبدیل کرده است.
چگونه از چت جی پی تی o1 استفاده کنیم؟
کاربران ChatGPT Plus و Team از امروز میتوانند به مدلهای o1 در ChatGPT دسترسی داشته باشند. هر دو مدل o1-preview و o1-mini به صورت دستی در انتخابگر مدل قابل انتخاب هستند و در آغاز محدودیتهای نرخ هفتگی 30 پیام برای o1-preview و 50 پیام برای o1-mini وجود خواهد داشت. ما در حال کار بر روی افزایش این نرخها و فعالسازی ChatGPT برای انتخاب خودکار مدل مناسب برای یک درخواست خاص هستیم.
کاربران ChatGPT Enterprise و Edu هفته آینده به هر دو مدل دسترسی خواهند داشت. توسعهدهندگانی که برای استفاده از API در سطح 5 واجد شرایط هستند میتوانند از امروز با هر دو مدل در API کار کنند، با محدودیت نرخ 20 RPM. ما در حال کار بر روی افزایش این محدودیتها پس از آزمایشهای اضافی هستیم. API برای این مدلها در حال حاضر شامل فراخوانی توابع، پشتیبانی از جریان برای پیامهای سیستمی و دیگر ویژگیها نمیشود.
ما همچنین برنامهریزی کردهایم که دسترسی به o1-mini را برای همه کاربران رایگان ChatGPT فراهم کنیم.
چه چیزی در آینده میآید؟
این یک پیشنمایش اولیه از این مدلهای استدلال در ChatGPT و API است. علاوه بر بهروزرسانی مدل، ما انتظار داریم که قابلیتهایی مانند مرور، آپلود فایل و تصویر و ویژگیهای دیگر را اضافه کنیم تا آنها را برای همه مفیدتر کنیم.
ما همچنین قصد داریم به توسعه و انتشار مدلهای جدید در سری GPT خود ادامه دهیم، علاوه بر سری جدید Chatgpt OpenAI o1-preview یا به بیان دیگر چت جی پی تی o1.

مطالب مرتبط