جدیدترین مدل «ChatGPT» عرضه شد

فهرست مطالب

به گزارش خبرآنلاین، به نقل از ایسنا، علاوه بر نسخه استاندارد، GPT-۵.۴ به عنوان یک مدل استدلالی در نسخه Thinking یا بهینه‌سازی‌شده برای عملکرد بالا در نسخه Pro نیز در دسترس است.

نسخه API این مدل با پنجره‌های متنی به بزرگی یک میلیون توکن در دسترس خواهد بود که بزرگترین پنجره متنی اوپن‌ای‌آی تا به امروز است. همچنین، اوپن‌ای‌آی بر بهبود کارآیی توکن‌ها تأکید کرد و گفت GPT-۵.۴ توانسته مشکلات مشابه را با توکن‌های بسیار کمتری نسبت به نسخه پیشین خود حل کند.

مدل جدید با نتایج قابل توجهی همراه بوده است که از جمله آنها می‌توان به امتیازات بی‌سابقه در معیارهای OSWorld-Verified و WebArena Verified اشاره کرد. مدل جدید در آزمون GDPval شرکت اوپن‌ای‌آی برای وظایف مربوط به دانش نیز امتیاز بی‌سابقه ۸۳ درصد را به دست آورد.

مدل GPT-۵.۴ تلاش‌های اوپن‌ای‌آی را برای محدود کردن توهمات و خطاها نشان می‌دهد. اوپن‌ای‌آی اعلام کرد که مدل جدید در مقایسه با GPT ۵.۲ تا ۳۳ درصد کمتر در ادعاهای فردی خطا می‌کند و پاسخ‌های کلی آن ۱۸ درصد کمتر احتمال دارد حاوی خطا باشند.

به عنوان بخشی از این رونمایی، اوپن‌ای‌آی نحوه مدیریت تعامل با برنامه‌های بیرونی توسط API مدل GPT-۵.۴ را تغییر داده و سیستم جدیدی را به نام Tool Search معرفی کرده است. پیش از این، پیام‌های سیستم تعاریفی را برای همه ابزارهای موجود ارائه می‌دادند؛ فرآیندی که با افزایش تعداد ابزارهای موجود می‌توانست توکن‌های زیادی را مصرف کند. سیستم جدید به مدل‌ها امکان می‌دهد تا در صورت نیاز، تعاریفی را جست‌وجو کنند و در نتیجه، درخواست‌ها در سیستم‌هایی با ابزارهای زیاد، سریع‌تر و ارزان‌تر انجام شود.

ادامه مطلب  ChatGPT بی‌صدا در حال تصاحب مهم‌ترین صفحه گوگل/ عصر جست‌وجو به پایان رسید؟

همچنین، اوپن‌ای‌آی یک ارزیابی ایمنی جدید را برای آزمایش زنجیره فکری مدل‌های خود در نظر گرفته که تفسیر جاری ارائه‌شده توسط مدل‌ها برای نشان دادن فرآیند تفکر از طریق وظایف چند مرحله‌ای است. پژوهشگران ایمنی هوش مصنوعی مدت‌هاست نگران این هستند که مدل‌های استدلالی ممکن است زنجیره فکری خود را به اشتباه نشان دهند و آزمایش‌ها ثابت می‌کنند که این اتفاق امکان دارد در شرایط مناسب رخ دهد.

ارزیابی جدید اوپن‌ای‌آی نشان می‌دهد احتمال فریب در نسخه Thinking مدل GPT-۵.۴ کمتر است که نشان می‌دهد این مدل توانایی پنهان کردن استدلال خود را ندارد و نظارت زنجیره فکری همچنان یک روش ایمنی مؤثر است.

۵۸۵۸

کد مطلب 2190950

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *