گوگل که هفته گذشته نام چتبات Bard خود را به Gemini تغییر داده بود، حالا از مدل Gemini 1.5 Pro رونمایی کرده است که بهعنوان جایگزین Gemini 1.0 Pro طراحی شده است. عملکرد Gemini 1.5 Pro در برخی زمینهها نسبت به نسل قبلی خود بهبود یافته است که احتمالاً مهمترین بهبود آن به میزان دادههایی مربوط میشود که میتواند پردازش کند.
براساس بیانیه گوگل، Gemini 1.5 Pro میتواند حدود ۷۰۰ هزار کلمه یا ۳۰ هزار خط کد بنویسد (۳۵ برابر بیشتر از Gemini 1.0 Pro) و یک مدل چندوجهی است، به این معنی که عملکرد آن به متن محدود نمیشود. علاوه بر این، Gemini 1.5 Pro میتواند تا ۱۱ ساعت صدا یا یک ساعت ویدیو به زبانهای مختلف را دریافت کند.
Gemini 1.5 Pro که از روز گذشته (بهعنوان نسخه پیشنمایش محدود) برای اکثر توسعهدهندگان و مشتریان در دسترس است، ابتدا فقط میتواند ۱۰۰ هزار کلمه را بهطور همزمان پردازش کند. همچنین فقط توسعهدهندگان تأیید شده اجازه دارند تا از طریق ابزار توسعهدهنده GenAI AI Studio گوگل آن را آزمایش کنند. علاوه بر این، برخی مشتریان که از پلتفرم Vertex AI گوگل استفاده می کنند نیز به Gemini 1.5 Pro دسترسی دارند.
معاون تحقیقات Google DeepMind از این مدل بهعنوان یک دستاورد بزرگ یاد کرده است و میگوید:
«زمانی که شما با مدلهای GenAI تعامل میکنید، اطلاعاتی که وارد و دریافت میکنید به زمینه تبدیل میشوند و هرچه سوالات و تعاملات شما طولانیتر و پیچیدهتر باشد، زمینهای که مدل به آن نیاز دارد نیز طولانیتر میشود. ما امکان دسترسی به زمینه طولانی را به روشی بسیار گسترده فراهم کردهایم.»
زمینه یک مدل هوش مصنوعی به دادههای ورودی (مثلا متن) اشاره دارد که مدل قبل از تولید خروجی خود باید آنها را در نظر بگیرد. یک سوال ساده، مانند «چه کسی در انتخابات ریاست جمهوری ۲۰۲۰ آمریکا پیروز شد؟» یا حتی یک فیلمنامه، ایمیل یا کتاب الکترونیکی میتوانند بهعنوان یک زمینه عمل کنند.