همانطور که ChatGPT شرکت OpenAI به پدیدهای جهانی تبدیل شده و یکی از بیشترین سرعتهای رشد محصولات مصرفی تاریخ را داشته است، چتبات گوگل بارد به نوعی در پسزمینه مانده و به تدریج ویژگیهای جدیدی از جمله دسترسی به دادههای کاربران در سایر سرویسهای گوگل را کسب کرده است، اما نمیتوان پاسخها و اطلاعات آن را با آنچه ChatGPT و سایر پلتفرمهای مبتنیبر GPT-3 و GPT-4 ارائه میدهند، مقایسه کرد.
اکنون بارد قابل دفاعتر شده و از امروز، برای کاربران انگلیسی زبان در ۱۷۰ کشور، توسط مدل جدید Gemini گوگل تغذیه میشود که به گفتهی غول دنیای جستوجو، در برخی موارد با فناوری OpenAI همخوانی دارد و حتی از آن سبقت میگیرد. گوگل میگوید که Gemini بهزودی در بیشتر زبانها و کشورها عرضه خواهد شد.
بر اساس بیانیهی مطبوعاتی گوگل، بارد اکنون از Gemini Pro، نسخهی میانی مدل Gemini، پشتیبانی میکند. اولترا بزرگترین و کندترین نسخهی جمنای است که بیشترین کیفیت را دارد و Nano کوچک و سریع و برای وظایف دم دستی مناسب است. Pro درست در وسط قرار دارد، سریع و کارآمد است در عین حال کیفیت مناسبی ارائه میدهد.
در حال حاضر، بارد هنوز فقط یک چتبات است: شما تایپ میکنید، بارد پاسخ میدهد. نسخهی جدیدی از بارد بهزودی منتشر خواهد شد که ممکن است قابلیتهای بسیار بیشتری داشته باشد.
سال آینده، گوگل قصد دارد نسخهی Bard Advanced را با Gemini Ultra، قدرتمندترین مدل زبانی بزرگ جدید گوگل، منتشر کند. Gemini اولترا نسخهی چندحالته این مدل است، به این معنی که علاوه بر متن، تصاویر، صدا و ویدیو را هم میتواند تحلیل یا تولید کند.
سوندار پیچای، مدیرعامل گوگل، میگوید که انتشار نسخهی جدید بارد را بهعنوان لحظهای بزرگ برای بارد و آغاز عصر Gemini میشناسد. اگر پیشبینی توسعهدهندگان درست باشد، مدل جدید ممکن است بارد را به چتباتی بهتر از ChatGPT تبدیل کند.
حضور جمنی Gemini در گوشیهای اندرویدی
جمنای (Gemini) بزرگترین و قدرتمندترین مدل زبانی بزرگی است که گوگل تا به امروز توسعه داده و بیشتر به درد دیتاسنترها میخورد، با اینحال گوگل نسخهی ویژهای از آن را با نام Gemini Nano معرفی کرده است که تفاوتهای نسبتا زیادی با مدلهای Pro و Ultra دارد.
بر اساس بیانیهی مطبوعاتی گوگل، مدل زبانی جمنای نانو نسخهی اصلاحشدهی جمنای است که بهصورت محلی و آفلاین روی گوشی و سایر دستگاههای اندرویدی اجرا میشود.
در حال حاضر پیکسل ۸ پرو تنها دستگاه سازگار با جمنای نانو است، اما این مدل هوش مصنوعی در نهایت به یکی از بخشهای اصلی سیستمعامل اندروید تبدیل خواهد شد.
اگر از گوشی گوگل پیکسل ۸ پرو استفاده میکنید، از امروز دو چیز در گوشی شما بر پایهی جمنای نانو اجرا خواهد شد: قابلیت خلاصهسازی خودکار در اپلیکیشن Recorder و قابلیت Smart Reply در کیبورد Gboard.
هر دو قابلیت ازطریق بهروزرسانی ویژهی این ماه (که گوگل آن را فیچر دراپ خطاب میکند) از راه خواهند رسید. از آنجایی که جمنای نانو روی خود دستگاه اجرا میشود، هر دو قابلیت موردبحث بدون نیاز به اینترنت کار خواهند کرد. پردازش محلی باعث میشود که قابلیت خلاصهسازی خودکار در ریکوردر و قابلیت Smart Reply در جیبورد عملکرد بسیار سریعی داشته باشند.
گوگل پروژهی پر اهمیت جمنای نانو را فعلا در ابعاد بسیار کوچکی شروع کرده است و حتی قابلیت Smart Reply صرفا در پیامرسان واتساپ از جمنای استفاده میکند. البته گوگل میگوید که این قابلیت در سال ۲۰۲۴ وارد اپلیکیشنهای دیگر نیز میشود.
مدل زبانی بزرگ جمنای فعلا فقط در زبان انگلیسی ارائه میشود، بدین ترتیب بسیاری از کاربران در حال حاضر امکان استفاده از آن را ندارند.
پیکسل ۸ پرو قرار نیست بهلطف جمنای بهیکباره دستگاهی کاملا متفاوت و ارتقایافته باشد، اما قطعا در طول زمان کاربران این گوشی تغییرات را حس خواهند کرد. گوگل گفته است که سال آینده باردِ مبتنیبر جمنای را وارد دستیار گوگل اسیستنت در گوشیهای پیکسل میکند.
نانو کوچکترین نسخه از هوش مصنوعی جمنای است، اما همچنان قابلیتهای زیادی دارد. یکی از مدیران ارشد گوگل میگوید جمنای نانو بهگونهای توسعه داده شده است که با محدودیتهای دستگاهی مثل گوشی سازگار شود. گوگل میگوید با در نظر گرفتن محدودیتهای حافظه و سرعت پردازشی گوشی، جمنای نانو عملکردی شگفتانگیز دارد.
گوگل میگوید هدف از توسعهی جمنای نانو ساخت مدلی هوش مصنوعی بوده است که بدون اشغال فضای ذخیرهسازی گوشی یا افزایش دمای دستگاه، قابلیتهایی هیجانانگیز بر پایهی هوش مصنوعی ارائه دهد.
در حال حاضر Tensor 3 تنها پردازندهای است که میتواند مدل زبانی جمنای نانو را اجرا کند؛ با وجود این، گوگل در تلاش است جمنای نانو را وارد کل سیستمعامل اندروید کند. این شرکت سرویس جدیدی به نام AICore معرفی کرده است که اضافهکردن هوش مصنوعی را به انواع اپلیکیشنها امکانپذیر میکند.
گوشیهای هوشمند برای اجرای جمنای نانو به پردازندهی پرقدرت نیاز دارند. گوگل گفته است که کوالکام، سامسونگ و مدیاتک در حال ساخت پردازندههای سازگار با جمنای نانو هستند. مشخص نیست که جمنای نانو روی قیمت گوشی اثر میگذارد یا نه.
مقایسه مدل هوش مصنوعی Gemini گوگل با GPT-4
«دمیس هاسابیس»، مدیرعامل دیپمایند که در توسعه Gemini نقش اساسی داشته است، میگوید آنها بنچمارکهای زیادی را روی این مدل انجام دادهاند. در واقع از بین ۳۲ بنچمارک مهمی که روی جمینای انجام شده است، این مدل در ۳۰ مورد جلوتر از رقبا بوده است.
آشکارترین برتری جمینای در بنچمارکها به توانایی درک و تعامل با صوت و ویدیو برمیگردد. قابلیت چندوجهی ظاهراً از ابتدا یکی از اهداف توسعه جمینای بوده و گوگل قصد نداشته است تا مانند OpenAI برای امور مختلف مدلهای گوناگونی مثل DALL-E یا Whisper بسازد.
جمینای نانو در حال حاضر فقط میتواند ورودی و خروجی متنی داشته باشد، اما نسخه قدرتمند آن یعنی اولترا قادر به کار با متن، تصویر، ویدیو و صدا است. هاسابیس میگوید در آینده قابلیتهای بیشتری مثل تشخیص لمس و حرکت هم توسط این مدل هوش مصنوعی قابل درک خواهد بود.
گوگل در زمینه کدنویسی ظاهراً تمرکز ویژهای روی جمینای داشته است. این مدل هوش مصنوعی از سیستم تولید کد جدید AlphaCode 2 استفاده میکند که این شرکت میگوید میتواند ۸۵ درصد بهتر از رقبا و ۵۰ درصد بهتر از نسل قبلی خود کدنویسی کند.
مدل هوش مصنوعی Gemini از نظر مصرف انرژی هم ظاهراً بسیار بهینه است. گوگل این مدل را روی واحد پردازش تنسور (TPU) خودش آموزش داده تا نسبت به مدلهای قبلی ازجمله PaLM سریعتر و ارزانتر باشد. این شرکت در کنار این مدل از نسخه جدید سیستم TPU موسوم به TPU v5p هم پرده برداشته که یک سیستم رایانش مخصوص دیتاسنترهاست و در زمینه آموزش و اجرای مدلهای زبانی بزرگ میتواند مورد استفاده قرار گیرد.
گوگل میگوید تلاش زیادی کرده است تا از ایمنی و مسئولیتپذیری Gemini مطمئن شود و آزمایشهای زیادی را در این زمینه انجام داده است. بااینحال، باید منتظر بمانیم تا ببینیم این مدل در جهان واقعی چه عملکردی از خود نشان خواهد داد.
ساندار پیچای و دمیس هاسابیس ظاهراً اعتقاد دارند که راهاندازی هوش مصنوعی Gemini آغازگر پروژهای بزرگتر و گامی در مسیر تغییر است. این همان مدلی است که گوگل سالها در حال توسعه آن بوده و حالا برای تغییر صحنه رقابت با OpenAI به آن نیاز دارد.
منابع:
لینک منبع