شرکت OpenAI و دیگر شرکتهای پیشرو در زمینه هوش مصنوعی در حال توسعه تکنیکهای جدید آموزشی هستند تا محدودیتهای روشهای فعلی را برطرف کنند. با پرداختن به تأخیرها و پیچیدگیهای غیرمنتظره در توسعه مدلهای زبانی بزرگتر و قدرتمندتر، این تکنیکهای جدید بر رفتار انسانی تمرکز دارند تا الگوریتمها را به “فکر کردن” آموزش دهند. گزارش شده است که این تکنیکهای آموزشی جدید که مدل اخیر OpenAI به نام ‘o1’ (که قبلاً Q* و Strawberry نامیده میشد) را پشتیبانی میکند، توسط دوازده محقق هوش مصنوعی، دانشمند و سرمایهگذار هدایت میشود و پتانسیل تغییر چشمانداز توسعه هوش مصنوعی را دارد.
پیشرفتهای گزارش شده ممکن است بر نوع یا مقدار منابعی که شرکتهای هوش مصنوعی به طور پیوسته نیاز دارند، از جمله سختافزارهای تخصصی و انرژی برای کمک به توسعه مدلهای هوش مصنوعی، تأثیر بگذارد. مدل o1 به گونهای طراحی شده است که مسائل را به شیوهای که شبیه به استدلال و تفکر انسانی است، حل کند و کارهای متعدد را به مراحل کوچکتری تقسیم کند.
این مدل همچنین از دادههای تخصصی و بازخوردهای ارائه شده توسط کارشناسان صنعت هوش مصنوعی برای بهبود عملکرد خود استفاده میکند.
از زمان رونمایی ChatGPT توسط OpenAI در سال ۲۰۲۲، نوآوری در هوش مصنوعی به شدت افزایش یافته است و بسیاری از شرکتهای فناوری ادعا میکنند که مدلهای هوش مصنوعی موجود نیاز به گسترش دارند، چه از طریق مقدار بیشتری از دادهها و چه منابع محاسباتی بهبود یافته. تنها در این صورت است که مدلهای هوش مصنوعی میتوانند به طور مداوم بهبود یابند. اکنون، کارشناسان هوش مصنوعی محدودیتهایی در افزایش مقیاس مدلهای هوش مصنوعی گزارش کردهاند. دهه ۲۰۱۰ دورهای انقلابی برای افزایش مقیاس بود، اما ایلیا سوتسکِوِر، همبنیانگذار آزمایشگاههای هوش مصنوعی Safe Superintelligence (SSI) و OpenAI، میگوید که آموزش مدلهای هوش مصنوعی، به ویژه در درک ساختارها و الگوهای زبانی، به یک سطح ثابت رسیده است.
او گفت: “دهه ۲۰۱۰ عصر افزایش مقیاس بود، اکنون دوباره به عصر شگفتی و کشف بازگشتهایم. انتخاب درست برای افزایش مقیاس اکنون بیشتر اهمیت دارد.” در زمانهای اخیر، محققان آزمایشگاههای هوش مصنوعی با تأخیرها و چالشهایی در توسعه و انتشار مدلهای زبانی بزرگ (LLM) که از مدل GPT-4 OpenAI قدرتمندتر هستند، مواجه شدهاند. اولاً، هزینه آموزش مدلهای بزرگ اغلب به دهها میلیون دلار میرسد. و به دلیل پیچیدگیهایی که بروز میکند، مانند خرابی سختافزار به دلیل پیچیدگی سیستم، تجزیه و تحلیل نهایی از نحوه عملکرد این مدلها ممکن است ماهها طول بکشد. علاوه بر این چالشها، روندهای آموزشی نیاز به مقادیر قابل توجهی انرژی دارند که اغلب منجر به کمبود برق میشود و میتواند فرآیندها را مختل کند و بر شبکه برق گستردهتر تأثیر بگذارد.
مسئله دیگر حجم عظیم دادههایی است که مدلهای زبانی بزرگ استفاده میکنند، به طوری که گزارش شده است مدلهای هوش مصنوعی همه دادههای قابل دسترسی در سراسر جهان را مصرف کردهاند.
محققان در حال بررسی تکنیکی به نام ‘محاسبات زمان آزمون’ هستند تا مدلهای فعلی هوش مصنوعی را در هنگام آموزش یا در مراحل استنتاج بهبود بخشند. این روش میتواند شامل تولید چندین پاسخ در زمان واقعی برای تصمیمگیری در مورد مجموعهای از بهترین راهحلها باشد.
بنابراین، مدل میتواند منابع پردازشی بیشتری را به وظایف دشواری که نیاز به تصمیمگیری و استدلالی شبیه به انسان دارند، اختصاص دهد. هدف این است که مدل دقیقتر و توانمندتر شود. نوآم براون، محقق OpenAI که در توسعه مدل o1 کمک کرده است، مثالی از چگونگی دستیابی یک روش جدید به نتایج شگفتانگیز ارائه کرد. در کنفرانس TED AI در سانفرانسیسکو ماه گذشته، براون توضیح داد که “داشتن یک ربات که فقط ۲۰ ثانیه در یک دست پوکر فکر کند به همان عملکرد تقویتی رسید که با افزایش اندازه مدل به ۱۰۰,۰۰۰ برابر و آموزش آن برای ۱۰۰,۰۰۰ بار طولانیتر حاصل میشد.” این میتواند به جای صرفاً افزایش اندازه مدل و زمان آموزش، نحوه پردازش اطلاعات توسط مدلهای هوش مصنوعی را تغییر دهد و به سیستمهایی قدرتمندتر و کارآمدتر منجر شود.
گزارش شده است که دیگر آزمایشگاههای هوش مصنوعی نسخههایی از تکنیک o1 را توسعه دادهاند. این شامل xAI، گوگل دیپمایند و آنتروپیک است. رقابت در دنیای هوش مصنوعی چیز جدیدی نیست، اما ممکن است شاهد تأثیر قابل توجهی بر بازار سختافزار هوش مصنوعی به دلیل تکنیکهای جدید باشیم. شرکتهایی مانند انویدیا، که در حال حاضر به دلیل تقاضای بالا برای محصولاتشان بر عرضه چیپهای هوش مصنوعی تسلط دارند، ممکن است به خصوص تحت تأثیر تکنیکهای بهروزشده آموزشی هوش مصنوعی قرار گیرند. انویدیا در ماه اکتبر به باارزشترین شرکت جهان تبدیل شد و افزایش ثروت آن به طور عمده به استفاده از چیپهایش در آرایههای هوش مصنوعی نسبت داده میشود. تکنیکهای جدید ممکن است بر موقعیت بازار انویدیا تأثیر بگذارد و این شرکت را مجبور به تطبیق محصولات خود برای پاسخگویی به تقاضای در حال تکامل سختافزار هوش مصنوعی کند. این پتانسیل را دارد که راههای بیشتری برای رقبا جدید در بازار استنتاج باز کند. ممکن است یک عصر جدید از توسعه هوش مصنوعی در افق باشد، که با تقاضاهای سختافزاری در حال تکامل و روشهای آموزشی کارآمدتر مانند آنهایی که در مدل o1 به کار گرفته شدهاند، هدایت شود. آینده مدلهای هوش مصنوعی و شرکتهای پشت آنها ممکن است بازسازی شود، امکانهای بیسابقه و رقابت بیشتری را باز کند.