مجله خبری و آموزشی هوش مصنوعی

جمنای Gemini، هوش مصنوعی انقلابی گوگل رونمایی شد؛ همه چیز درباره جمنای، رقیب قدرتمند ChatGPT

توسط هم‌نگار بلاگ
۰ اظهار نظر

همانطور که ChatGPT شرکت OpenAI به پدیده‌ای جهانی تبدیل شده و یکی از بیشترین سرعت‌های رشد محصولات مصرفی تاریخ را داشته است، چت‌بات گوگل بارد به نوعی در پس‌زمینه مانده و به تدریج ویژگی‌های جدیدی از جمله دسترسی به داده‌های کاربران در سایر سرویس‌های گوگل را کسب کرده است، اما نمی‌توان پاسخ‌ها و اطلاعات آن را با آنچه ChatGPT و سایر پلتفرم‌های مبتنی‌بر GPT-3 و GPT-4 ارائه می‌دهند، مقایسه کرد.

اکنون بارد قابل دفاع‌تر شده و از امروز، برای کاربران انگلیسی زبان در ۱۷۰ کشور، توسط مدل جدید Gemini گوگل تغذیه می‌شود که به گفته‌ی غول دنیای جست‌وجو، در برخی موارد با فناوری OpenAI همخوانی دارد و حتی از آن سبقت می‌گیرد. گوگل می‌گوید که Gemini به‌زودی در بیشتر زبان‌ها و کشورها عرضه خواهد شد.

بر اساس بیانیه‌ی مطبوعاتی گوگل، بارد اکنون از Gemini Pro، نسخه‌ی میانی مدل Gemini، پشتیبانی می‌کند. اولترا بزرگترین و کندترین نسخه‌ی جمنای است که بیشترین کیفیت را دارد و Nano کوچک و سریع و برای وظایف دم دستی مناسب است. Pro درست در وسط قرار دارد، سریع و کارآمد است در عین حال کیفیت مناسبی ارائه می‌دهد.

در حال حاضر، بارد هنوز فقط یک چت‌بات است: شما تایپ می‌کنید، بارد پاسخ می‌دهد. نسخه‌ی جدیدی از بارد به‌زودی منتشر خواهد شد که ممکن است قابلیت‌های بسیار بیشتری داشته باشد.

سال آینده، گوگل قصد دارد نسخه‌ی Bard Advanced را با Gemini Ultra، قدرتمندترین مدل زبانی بزرگ جدید گوگل، منتشر کند. Gemini اولترا نسخه‌ی چندحالته این مدل است، به این معنی که علاوه بر متن، تصاویر، صدا و ویدیو را هم می‌تواند تحلیل یا تولید کند.

سوندار پیچای، مدیرعامل گوگل، می‌گوید که انتشار نسخه‌ی جدید بارد را به‌عنوان لحظه‌ای بزرگ برای بارد و آغاز عصر Gemini می‌شناسد. اگر پیش‌بینی توسعه‌دهندگان درست باشد، مدل جدید ممکن است بارد را به چت‌باتی بهتر از ChatGPT تبدیل کند.

حضور جمنی Gemini در گوشی‌های اندرویدی

هوش مصنوعی جمنای گوگل که فعلا در گوشی پیکسل ۸ پرو ارائه می‌شود، در نهایت وارد کل سیستم‌عامل اندروید خواهد شد.

جمنای (Gemini) بزرگ‌ترین و قدرتمندترین مدل زبانی بزرگی است که گوگل تا به امروز توسعه داده و بیشتر به درد دیتاسنترها می‌خورد، با این‌حال گوگل نسخه‌ی ویژه‌ای از آن را با نام Gemini Nano معرفی کرده است که تفاوت‌های نسبتا زیادی با مدل‌های Pro و Ultra دارد.

بر اساس بیانیه‌ی مطبوعاتی گوگل، مدل زبانی جمنای نانو نسخه‌ی اصلاح‌شده‌ی جمنای است که به‌صورت محلی و آفلاین روی گوشی و سایر دستگاه‌های اندرویدی اجرا می‌شود.

در حال حاضر پیکسل ۸ پرو تنها دستگاه سازگار با جمنای نانو است، اما این مدل هوش مصنوعی در نهایت به یکی از بخش‌های اصلی سیستم‌عامل اندروید تبدیل خواهد شد.

اگر از گوشی گوگل پیکسل ۸ پرو استفاده می‌کنید، از امروز دو چیز در گوشی شما بر پایه‌ی جمنای نانو اجرا خواهد شد: قابلیت خلاصه‌سازی خودکار در اپلیکیشن Recorder و قابلیت Smart Reply در کیبورد Gboard.

هر دو قابلیت ازطریق به‌روزرسانی ویژه‌ی این ماه (که گوگل آن را فیچر دراپ خطاب می‌کند) از راه خواهند رسید. از آن‌جایی که جمنای نانو روی خود دستگاه اجرا می‌شود، هر دو قابلیت موردبحث بدون نیاز به اینترنت کار خواهند کرد. پردازش محلی باعث می‌شود که قابلیت خلاصه‌سازی خودکار در ریکوردر و قابلیت Smart Reply در جی‌بورد عملکرد بسیار سریعی داشته باشند.

گوگل پروژه‌ی پر اهمیت جمنای نانو را فعلا در ابعاد بسیار کوچکی شروع کرده است و حتی قابلیت Smart Reply صرفا در پیام‌رسان واتساپ از جمنای استفاده می‌کند. البته گوگل می‌گوید که این قابلیت در سال ۲۰۲۴ وارد اپلیکیشن‌های دیگر نیز می‌شود.

مدل زبانی بزرگ جمنای فعلا فقط در زبان انگلیسی ارائه می‌شود، بدین ترتیب بسیاری از کاربران در حال حاضر امکان استفاده از آن را ندارند.

پیکسل ۸ پرو قرار نیست به‌لطف جمنای به‌یک‌باره دستگاهی کاملا متفاوت و ارتقایافته باشد، اما قطعا در طول زمان کاربران این گوشی تغییرات را حس خواهند کرد. گوگل گفته است که سال آینده باردِ مبتنی‌بر جمنای را وارد دستیار گوگل اسیستنت در گوشی‌های پیکسل می‌کند.

نانو کوچک‌ترین نسخه از هوش مصنوعی جمنای است، اما همچنان قابلیت‌های زیادی دارد. یکی از مدیران ارشد گوگل می‌گوید جمنای نانو به‌گونه‌ای توسعه داده شده است که با محدودیت‌های دستگاهی مثل گوشی سازگار شود. گوگل می‌گوید با در نظر گرفتن محدودیت‌های حافظه و سرعت پردازشی گوشی، جمنای نانو عملکردی شگفت‌انگیز دارد.

گوگل می‌گوید هدف از توسعه‌ی جمنای نانو ساخت مدلی هوش مصنوعی بوده است که بدون اشغال فضای ذخیره‌سازی گوشی یا افزایش دمای دستگاه، قابلیت‌هایی هیجان‌انگیز بر پایه‌ی هوش مصنوعی ارائه دهد.

در حال حاضر Tensor 3 تنها پردازنده‌ای است که می‌تواند مدل زبانی جمنای نانو را اجرا کند؛ با وجود این، گوگل در تلاش است جمنای نانو را وارد کل سیستم‌عامل اندروید کند. این شرکت سرویس جدیدی به نام AICore معرفی کرده است که اضافه‌کردن هوش مصنوعی را به انواع اپلیکیشن‌ها امکان‌پذیر می‌کند.

گوشی‌های هوشمند برای اجرای جمنای نانو به پردازنده‌ی پرقدرت نیاز دارند. گوگل گفته است که کوالکام، سامسونگ و مدیاتک در حال ساخت پردازنده‌های سازگار با جمنای نانو هستند. مشخص نیست که جمنای نانو روی قیمت گوشی اثر می‌گذارد یا نه.

مقایسه مدل هوش مصنوعی Gemini گوگل با GPT-4

«دمیس هاسابیس»، مدیرعامل دیپ‌مایند که در توسعه Gemini نقش اساسی داشته است، می‌گوید آن‌ها بنچمارک‌های زیادی را روی این مدل انجام داده‌اند. در واقع از بین ۳۲ بنچمارک مهمی که روی جمینای انجام شده است، این مدل در ۳۰ مورد جلوتر از رقبا بوده است.

آشکارترین برتری جمینای در بنچمارک‌ها به توانایی درک و تعامل با صوت و ویدیو برمی‌گردد. قابلیت چندوجهی ظاهراً از ابتدا یکی از اهداف توسعه جمینای بوده و گوگل قصد نداشته است تا مانند OpenAI برای امور مختلف مدل‌های گوناگونی مثل DALL-E یا Whisper بسازد.

جمینای نانو در حال حاضر فقط می‌تواند ورودی و خروجی متنی داشته باشد، اما نسخه قدرتمند آن یعنی اولترا قادر به کار با متن، تصویر، ویدیو و صدا است. هاسابیس می‌گوید در آینده قابلیت‌های بیشتری مثل تشخیص لمس و حرکت هم توسط این مدل هوش مصنوعی قابل درک خواهد بود.

گوگل در زمینه کدنویسی ظاهراً تمرکز ویژه‌ای روی جمینای داشته است. این مدل هوش مصنوعی از سیستم تولید کد جدید AlphaCode 2 استفاده می‌کند که این شرکت می‌گوید می‌تواند ۸۵ درصد بهتر از رقبا و ۵۰ درصد بهتر از نسل قبلی خود کدنویسی کند.

مدل هوش مصنوعی Gemini از نظر مصرف انرژی هم ظاهراً بسیار بهینه است. گوگل این مدل را روی واحد پردازش تنسور (TPU) خودش آموزش داده تا نسبت به مدل‌های قبلی ازجمله PaLM سریع‌تر و ارزان‌تر باشد. این شرکت در کنار این مدل از نسخه جدید سیستم TPU موسوم به TPU v5p هم پرده برداشته که یک سیستم رایانش مخصوص دیتاسنترهاست و در زمینه آموزش و اجرای مدل‌های زبانی بزرگ می‌تواند مورد استفاده قرار گیرد.

گوگل می‌گوید تلاش زیادی کرده است تا از ایمنی و مسئولیت‌پذیری Gemini مطمئن شود و آزمایش‌های زیادی را در این زمینه انجام داده است. بااین‌حال، باید منتظر بمانیم تا ببینیم این مدل در جهان واقعی چه عملکردی از خود نشان خواهد داد.

ساندار پیچای و دمیس هاسابیس ظاهراً اعتقاد دارند که راه‌اندازی هوش مصنوعی Gemini آغازگر پروژه‌ای بزرگ‌تر و گامی در مسیر تغییر است. این همان مدلی است که گوگل سال‌ها در حال توسعه آن بوده و حالا برای تغییر صحنه رقابت با OpenAI به آن نیاز دارد.

 

 

منابع:
لینک منبع

منبع دوم

منبع سوم

این مطالب هم پیشنهاد می‌شود

پیام بگذارید