07 مهر 1404
انتشار GPT-5، در حالی که پیشرفتهای فنی قابلتوجهی را به نمایش گذاشت، با استقبال متفاوتی از سوی کاربرانی مواجه شد که انتظار یک جهش انقلابی را داشتند. بسیاری آن را به جای تحول پیشگامانهای که در مدلهای قبلی مانند GPT-4 مشاهده شده بود، یک ارتقاء تکاملی دانستند.

GPT-5 پس از انتشار، بازخوردهای متفاوتی دریافت کرد و این سوال را مطرح کرد که آیا این مدل نشاندهنده جهش انقلابی مورد انتظار بود یا صرفاً یک ارتقاء جزئی برای کاربران.
OpenAI ادعا میکند که پیشرفتهای فنی چشمگیری داشته است، به ویژه در کدنویسی، جایی که GPT-5 به نمره بیسابقه 74.9% در معیار StableBench و 82.8 از 100 در معیار Polyglot برای برنامهنویسی چندزبانه دست یافت و ابزاری قدرتمندتر برای توسعهدهندگان ارائه کرد.
GPT-5 دقت بالاتری در پاسخ به سوالات پیچیده پزشکی و علمی از خود نشان میدهد، با نرخ توهمزایی که به طور قابل توجهی به تنها 1.6% در آزمایشات سوالات پزشکی کاهش یافته است، که یک بهبود اساسی نسبت به GPT-4 (12.9%) و GPT-3 (15.8%) است.
با وجود پیشرفتهای فنی، بسیاری از کاربران ناامیدی خود را ابراز کردند و GPT-5 را به جای یک جهش انقلابی، یک گام تکاملی قلمداد کردند، بر خلاف تأثیر GPT-4 بر تعامل انسان و هوش مصنوعی. کاربران انتظار پیشرفتهای عمدهای در استدلال پیچیده، درک جهان و پاسخهای خلاقانه داشتند که محقق نشد.
OpenAI مدل GPT-5 را بهترین سیستم هوش مصنوعی خود تاکنون و جهشی چشمگیر در هوش توصیف کرد که قادر به عملکرد در سطح متخصص در زمینههای مختلف است. با این حال، کاربران مواردی را گزارش کردند که مدل 'متخصص در سطح پزشک' خطاهای اساسی مرتکب شده است، مانند اشتباه شمردن حروف در یک کلمه یا توهمزایی در نام ایالتهای آمریکا، که با ادعاهای رسمی در تضاد است.
گری مارکوس، دانشمند و منتقد هوش مصنوعی، توییت کرد که با وجود سه سال و میلیاردها دلار توسعه، GPT-5 در بسیاری از زمینهها پیشرفت خوبی نشان میدهد اما یک 'جهش بزرگ' یا AGI نیست، و سوالات زیادی را در مورد عملکرد واقعی آن بیپاسخ گذاشته و خستگی عمومی خود را از ادعاهای 'پیشرفت نمایی' ابراز کرد.
کاربران به تغییری در لحن GPT-5 اشاره کردند و آن را سردتر، رباتیکتر و کمتر شخصی توصیف کردند در مقایسه با نسخههای قبلی که پاسخهای طبیعی و خلاقانهای ارائه میدادند. این تغییر به ویژه برای کاربرانی که برای نگارش خلاقانه و مکالمه معمولی به مدل متکی بودند، ناخوشایند بود.
سم آلتمن به بازخورد کاربران در مورد شخصیت مدل رسیدگی کرد و بهروزرسانیهایی را برای گرمتر کردن لحن GPT-5 اعلام کرد، بدون اینکه به اندازه GPT-4o 'آزاردهنده' باشد. آلتمن همچنین لزوم سفارشیسازی شخصیت مدل به صورت شخصیتر برای هر کاربر در آینده را تأیید کرد.
GPT-5 به عنوان یک مدل قدرتمند شناخته شده است، نه ضعیف، اما ممکن است در زمانی با انتظارات فوقالعاده بالای کاربران معرفی شده باشد، که منجر به درک آن به عنوان یک ارتقاء فنی و نه یک تجربه کاربری جدید و پیشگامانه شده است. پیشنهاد میشود که نامی مانند GPT-4.5 ممکن بود استقبال مثبتتری به همراه داشته باشد.
OpenAI آشکارا بهبود قابلیت اطمینان و دقت مدل را با GPT-5 در اولویت قرار داد و به این هدف دست یافت. با این حال، به نظر میرسد این پیگیری ناخواسته برخی از 'روح و خلاقیت' را که کاربران در نسخههای قبلی ارزش قائل بودند، فدا کرده است.
GPT-5 مدل ضعیفی نیست، بلکه مدلی قدرتمند است که شاید صرفاً در زمان نامناسبی و با انتظارات بسیار بالا معرفی شد.
| دسته | موضع/دستاورد OpenAI | بازخورد کاربر/منتقد |
|---|---|---|
| ماهیت مدل | بهترین سیستم هوش مصنوعی، جهش قابل توجه، عملکرد پیشرفته جهانی. | گام تکاملی، نه یک جهش انقلابی مانند GPT-4؛ انتظارات برای استدلال پیچیده برآورده نشد. |
| عملکرد فنی | نمرات بیسابقه در کدنویسی (StableBench 74.9%, Polyglot 82.8%)، دقت بالا در پرسشهای پزشکی/علمی، کاهش توهمزایی (1.6%). | گزارش خطاهای اساسی علیرغم ادعاهای 'سطح پزشک' (مثلاً: اشتباه شمردن حروف، توهمزایی نام ایالتها). |
| توسعه و سرمایهگذاری | OpenAI صراحتاً این موضوع را بیان نکرد، اما زمینه به سرمایهگذاری قابل توجه برای پیشرفتها اشاره دارد. | گری مارکوس به 3 سال و میلیاردها دلار اشاره کرد، با این حال 'جهش بزرگ رو به جلو' و 'نه AGI' نیست، با سوالاتی در مورد عملکرد واقعی. |
| شخصیت و لحن | سم آلتمن بهروزرسانیها را برای گرمتر کردن لحن اعلام کرد، نیاز به سفارشیسازی را تأیید کرد. | سردتر، رباتیکتر و کمتر خلاق/طبیعیتر از نسخههای قبلی درک شد؛ کاربران احساس کردند 'روح و خلاقیت' خود را از دست داده است. |
| تأثیر کلی | قابلیت اطمینان و دقت بهبود یافته. | مدلی قدرتمند اما به دلیل انتظارات بالا در زمان نامناسبی منتشر شد؛ به عنوان یک ارتقاء فنی (مثلاً GPT-4.5) و نه یک پارادایم جدید درک شد. |
