OpenAI از مدل هوش مصنوعی استدلال‌گر o3 رونمایی کرد؛ آغاز آزمایش‌های جانشین o1

دیجیاتو شنبه 01 دی 1403 - 09:03

AI ادعا می‌کند که خانواده مدل هوش مصنوعی o3 برای اولین بار حداقل از برخی جهات به سطح AGI نزدیک شده است. The post OpenAI از مدل هوش مصنوعی استدلال‌گر o3 رونمایی کرد؛ آغاز آزمایش‌های جانشین o1 appeared first on دیجیاتو.

در آخرین روز از رویداد 12 روزه معرفی محصولات و قابلیت‌های جدید مدل‌های هوش مصنوعی OpenAI، این شرکت بزرگ‌ترین خبر خود را اعلام کرد. شب گذشته از مدل استدلال‌گر o3 به‌عنوان جایگزین o1 رونمایی شد، اما هنوز فاصله زیادی تا عرضه عمومی آن داریم.

به‌گزارش تک‌کرانچ، مدل هوش مصنوعی o3 که در واقع خانواده‌ای از مدل‌ها شامل o3 و o3-mini است. مدل مینی کوچک‌تر و سبک‌تر خواهد بود تا برای امور خاص کارایی بیشتری داشته باشد. OpenAI ادعا می‌کند که خانواده o3 حداقل در برخی شرایط خاص به سطح هوش جامع مصنوعی (AGI) نزدیک می‌شود. اما البته هنوز کاستی‌های زیادی وجود دارد و راه زیادی تا رسیدن به یک مدل AGI واقعی وجود دارد.

مدل هوش مصنوعی o3 جانشین o1 است، اما چرا نام آن o2 نیست؟ احتمالاً مشکلات حقوقی مانع از این مسئله شده است. طبق گزارش نشریه اینفورمیشن، OpenAI از روی o2 پریده تا با اپراتور مخابراتی بریتانیایی O2 دچار درگیری حقوقی نشود. «سم آلتمن»، مدیرعامل OpenAI به‌نحوی این مسئله را در پخش زنده این شرکت تأیید کرد.

عرضه پیش‌نمایش مدل هوش مصنوعی OpenAI o3

مدل‌های o3 و o3-mini هنوز به‌صورت گسترده در دسترس قرار نگرفته‌اند، اما کارشناسان ایمنی می‌توانند برای دسترسی به پیش‌نمایش o3-mini از امروز نام‌نویسی کنند. پیش‌نمایش o3 در آینده عرضه می‌شود، اما OpenAI هنوز تاریخی اعلام نکرده است. آلتمن می‌گوید برنامه آنها این است که o3-mini در اواخر ژانویه و پس از آن o3 در دسترس قرار بگیرد.

مدل هوش مصنوعی o3 با روشی موسوم به «یادگیری تقویتی» آموزش داده شده است تا پیش از پاسخ‌دادن با فرایندی که OpenAI آن را «زنجیره خصوصی تفکر» می‌نامد، فکر کند. این مدل قادر است در حین انجام یک کار استدلال و قدم‌های بعدی را از پیش برنامه‌ریزی کند. در نتیجه می‌تواند با برداشتن مجموعه‌ای از قدم‌ها یک مسئله را حل کند.

یکی از تفاوت‌های o3 با o1 قابلیت مدل جدید در تنظیم زمان استدلال است. این مدل‌ها را می‌توان تنظیم کرد تا زمان رایانش (یا تفکر) کوتاه، متوسط یا طولانی داشته باشند. هرچه زمان بیشتری در اختیار مدل o3 برای فکرکردن وجود داشته باشد، کارها را بهتر انجام می‌دهد.

در خصوص ادعای نزدیک‌شدن o3 به سطح AGI، این مدل در بنچمارک ARC-AGI که نشان می‌دهد یک سیستم هوش مصنوعی تا چه حد می‌تواند مهارت‌های جدید را خارج از داده‌های آموزشی خود یاد بگیرد، به امتیاز 87.5 درصد دست یافته است. این امتیاز البته در حالت تفکر طولانی به‌دست آمده است. o3 در بدترین حالت (با زمان تفکر کوتاه) 3 برابر عملکرد بهتری نسبت به o1 دارد.

مشاهده متن کامل خبر در "دیجیاتو"