در حوزه هوش مصنوعی، یک رقیب جدید به نام QwQ-32B-Preview ظهور کرده است که توجهات را به خود جلب کرده است. این مدل هوش مصنوعی که به “استدلال” شهرت دارد، با مدل OpenAI o1 مقایسه میشود و یکی از معدود مدلهایی است که میتوان آن را تحت یک مجوز مجاز دانلود کرد. برای توسعهدهندگان و محققانی که مشتاق به آزمایش هستند، این یک امتیاز بزرگ محسوب میشود.
QwQ-32B-Preview که توسط تیم Qwen شرکت علیبابا ساخته شده است، به هیچ وجه سبکوزن نیست. این مدل دارای ۳۲.۵ میلیارد پارامتر است که میتوان آنها را به عنوان اجزای ساختاری تواناییهای حل مسئله در نظر گرفت و میتواند به درخواستهایی تا ۳۲,۰۰۰ کلمه پاسخ دهد؛ طولانیتر از برخی رمانها! آزمایشها نشان میدهند که این مدل در معیارهایی مانند AIME و MATH از OpenAI o1-preview و o1-mini پیشی گرفته است. برای توضیح، AIME از مدلهای دیگر هوش مصنوعی برای ارزیابی عملکرد استفاده میکند، در حالی که MATH مجموعهای از مسائل کلمهای است. اما این مدل تنها درباره مسائل ریاضیاتی یا معماهای منطقی نیست. چیزی که آن را متمایز میکند، نحوه برخوردش با وظایف است. QwQ-32B-Preview از قبل برنامهریزی میکند، کار خود را بررسی میکند و از اشتباهات رایج هوش مصنوعی اجتناب میکند. البته، نقصهایی هم دارد؛
علیبابا به مشکلاتی مانند تغییر زبان، حلقههای گاهبهگاه و دشواریهای مربوط به استدلال “عقل سلیم” اذعان دارد. با اینحال، این مدل گامی به سوی سیستمهای هوش مصنوعی هوشمندتر به شمار میرود. QwQ-32B-Preview قابل دسترسی است: شما میتوانید آن را از طریق Hugging Face اجرا یا دانلود کنید. با این حال، مانند سایر هوش مصنوعیهای توسعهیافته در چین، این مدل در چارچوبهای قانونی عمل میکند. این به معنای این است که با احتیاط از موضوعات حساس سیاسی پرهیز میکند تا با قوانین چین مطابقت داشته باشد و با “ارزشهای سوسیالیستی اصلی” همسو باشد.
علیبابا در این عرصه تنها نیست. Llama 3.1 محصول متا نیز یک گزینه متنباز دیگر است، اگرچه رویکرد متفاوتی را دنبال میکند و بر هوش مصنوعی مولد تمرکز دارد تا استدلال. در حالی که هر دو مدل نوآورانه هستند، QwQ-32B-Preview در حل مسئله با رویکردی شبیه به انسان تخصص دارد و آن را در دسته استدلال قرار میدهد. رقابت در هوش مصنوعی در چین در حال شدت گرفتن است. شرکتهایی مانند DeepSeek، آزمایشگاه هوش مصنوعی شانگهای و تکنولوژی Kunlun وارد مسابقه هوش مصنوعی استدلال شدهاند و مدلهای خود را با سرعت ارائه میدهند. برای مثال، r1 محصول DeepSeek ادعا میکند که در نیمی از آزمونهای معیار خود، به ویژه در ریاضیات و برنامهنویسی، از OpenAI’s o1 پیشی گرفته است. InternThinker محصول آزمایشگاه هوش مصنوعی شانگهای رویکردی ساختاریافته به حل مسئله دارد و مراحلی مانند درک سوالات، یادآوری دانش، برنامهریزی راهحلها و انعکاس بر پاسخهای خود را شامل میشود. این فعالیتهای پرشتاب نشان میدهد که شرکتهای چینی چقدر سریع در حال رسیدن به غولهای فناوری ایالات متحده هستند.
شو لیانگ، یک کارآفرین هوش مصنوعی از هانگژو، اینگونه خلاصه کرد: “OpenAI جهت را به ما نشان داد؛ با تحقیق، شرکتهای فناوری چینی در حال پیشرفت هستند.”
انتشار QwQ-32B-Preview و رقبای آن نشان میدهد که تا چد حد زمین بازی هوش مصنوعی را تحت پوشش قرار میدهند. اما این موضوع فقط به همین سطح محدود نمیشود. هوش مصنوعی استدلال، تغییری در نحوه طراحی و استفاده از مدلها را بنیان میگذارد. بر خلاف سیستمهای هوش مصنوعی قدیمی که بر نیروی خام برای تولید پاسخها متکی بودند، مدلهای استدلالی مانند QwQ-32B-Preview هدفشان تقلید از حل مسئله انسانی است. این رویکرد نه تنها آنها را برای وظایف پیچیده مؤثرتر میکند بلکه استفادههای بالقوه آنها را نیز گسترش میدهد، مانند حل مسائل ریاضی پیشرفته یا ارائه مشاوره مالی دقیق.
چه برای حل معما و چه برای استدلال در مسائل پیچیده، یا گسترش دستاوردهای هوش مصنوعی متنباز، یک چیز روشن است: تکامل هوش مصنوعی در حال تسریع است. آماده باشید—این تنها آغاز است. (عکس از Unsplash) همچنین ببینید: تغییرات در ابتکار همکار هوش مصنوعی علیبابا آیا میخواهید بیشتر درباره هوش مصنوعی و دادههای بزرگ از رهبران صنعت یاد بگیرید؟ نمایشگاه AI & Big Data Expo را که در آمستردام، کالیفرنیا و لندن برگزار میشود، بررسی کنید. این رویداد جامع به صورت مشترک با سایر رویدادهای پیشرو از جمله کنفرانس اتوماسیون هوشمند، BlockX، هفته تحول دیجیتال و نمایشگاه امنیت سایبری و ابر برگزار میشود. سایر رویدادها و وبینارهای فناوری سازمانی آینده که توسط TechForge قدرت گرفتهاند را اینجا بررسی کنید.