مجله خبری و آموزشی هوش مصنوعی

گوگل از Gemini 1.5 Pro با امکان پردازش ویدیوهای یک ساعته رونمایی کرد

توسط هم‌نگار بلاگ
منتشر شده: آخرین بروز رسانی در تاریخ ۰ اظهار نظر
گوگل از Gemini 1.5 Pro با امکان پردازش ویدیوهای یک ساعته رونمایی کرد

گوگل که هفته گذشته نام چت‌بات Bard خود را به Gemini تغییر داده بود، حالا از مدل Gemini 1.5 Pro رونمایی کرده است که به‌عنوان جایگزین Gemini 1.0 Pro طراحی شده است. عملکرد Gemini 1.5 Pro در برخی زمینه‌ها نسبت به نسل قبلی خود بهبود یافته است که احتمالاً مهم‌ترین بهبود آن به میزان داده‌هایی مربوط می‌شود که می‌تواند پردازش کند.

براساس بیانیه گوگل، Gemini 1.5 Pro می‌تواند حدود ۷۰۰ هزار کلمه یا ۳۰ هزار خط کد بنویسد (۳۵ برابر بیشتر از Gemini 1.0 Pro) و یک مدل چندوجهی است، به این معنی که عملکرد آن به متن محدود نمی‌شود. علاوه بر این، Gemini 1.5 Pro می‌تواند تا ۱۱ ساعت صدا یا یک ساعت ویدیو به زبان‌های مختلف را دریافت کند.

Gemini 1.5 Pro که از روز گذشته (به‌عنوان نسخه پیش‌نمایش محدود) برای اکثر توسعه‌دهندگان و مشتریان در دسترس است، ابتدا فقط می‌تواند ۱۰۰ هزار کلمه را به‌طور همزمان پردازش کند. همچنین فقط توسعه‌دهندگان تأیید شده اجازه دارند تا از طریق ابزار توسعه‌دهنده GenAI AI Studio گوگل آن را آزمایش کنند. علاوه بر این، برخی مشتریان که از پلتفرم Vertex AI گوگل استفاده می کنند نیز به Gemini 1.5 Pro دسترسی دارند.

معاون تحقیقات Google DeepMind از این مدل به‌عنوان یک دستاورد بزرگ یاد کرده است و می‌گوید:

«زمانی که شما با مدل‌های GenAI تعامل می‌کنید، اطلاعاتی که وارد و دریافت می‌کنید به زمینه تبدیل می‌شوند و هرچه سوالات و تعاملات شما طولانی‌تر و پیچیده‌تر باشد، زمینه‌ای که مدل به آن نیاز دارد نیز طولانی‌تر می‌شود. ما امکان دسترسی به زمینه طولانی را به روشی بسیار گسترده فراهم کرده‌ایم.»

زمینه یک مدل هوش مصنوعی به داده‌های ورودی (مثلا متن) اشاره دارد که مدل قبل از تولید خروجی خود باید آن‌ها را در نظر بگیرد. یک سوال ساده، مانند «چه کسی در انتخابات ریاست جمهوری ۲۰۲۰ آمریکا پیروز شد؟» یا حتی یک فیلمنامه، ایمیل یا کتاب الکترونیکی می‌توانند به‌عنوان یک زمینه عمل کنند.

لینک منبع

این مطالب هم پیشنهاد می‌شود

پیام بگذارید