L
LLM مدل زبانی بزرگ
مدل زبانی بزرگ (LLM) نوعی برنامه هوش مصنوعی (AI) است که میتواند متن را تشخیص داده و تولید کند، در میان کارهای دیگر. LLM ها بر روی مجموعه های عظیمی از داده ها آموزش می بینند – از این رو به آن “بزرگ” می گویند. LLM ها بر اساس یادگیری ماشین ساخته شده اند: به طور خاص، نوعی شبکه عصبی به نام مدل ترانسفورماتور.
به عبارت ساده تر، LLM یک برنامه کامپیوتری است که از نمونههای بسیاری استفاده کرده تا بتواند زبان انسان یا دیگر انواع دادههای پیچیده را تشخیص دهد و تفسیر کند. بسیاری از LLM ها بر روی داده هایی که از اینترنت جمع آوری شدهاند – هزاران یا میلیونها گیگابایت متن آموزش دیدهاند. اما کیفیت نمونهها بر چگونگی یادگیری زبان طبیعی توسط LLM تأثیر میگذارد، بنابراین برنامهنویسان LLM ممکن است از مجموعه دادههای مدیریتشدهتری استفاده کنند.
R
RAG
Retrieval-Augmented Generation (RAG) فرآیند بهینه سازی خروجی یک مدل زبانی بزرگ است، به طوری که قبل از ایجاد پاسخ، به یک پایگاه دانش معتبر، خارج از منابع داده آموزشی خود ارجاع می دهد. مدلهای زبانی بزرگ (LLM) بر روی حجم وسیعی از دادهها آموزش میبینند و از میلیاردها پارامتر برای تولید خروجی اصلی برای کارهایی مثل پاسخ دادن به سؤالات، ترجمه زبانها و تکمیل جملات استفاده میکنند. RAG، قابلیتهای قدرتمند LLM را به حوزههای خاصتری مثل پایگاه دانش داخلی یک سازمان گسترش میدهد، همه بدون نیاز به آموزش مجدد مدل. این یک رویکرد مقرون به صرفه برای بهبود خروجی LLM است بنابراین در زمینه های مختلف مرتبط، دقیق و مفید باقی می ماند.
پ
پرامپت
پرامپت یا Prompt به درخواست یا سوالی گفته میشود که شما از یک چتبات یا ابزار هوش مصنوعی میپرسید. مثلا شما این سوال را از یک چتبات هوش مصنوعی میپرسید: «چند کلمه کلیدی متناسب برای مقالهای با موضوع روباتهای هوش مصنوعی به من معرفی کن». جمله داخل گیومه یک پرامپت است.
با توجه به اینکه هوش مصنوعی یک ماشین تربیت یافته و آموزش دیده از جانب انسان است برای همین درک او از مطالب با درک انسانی کمی متفاوت است. به خاطر همین ممکن است شما یک سوال را به گونهای بپرسید که جواب دقیقی از هوش مصنوعی دریافت نکنید و فرد دیگری همان سوال/موضوع را طوری مطرح کند که جواب دقیقتری از همان روبات هوش مصنوعی دریافت کند.
اگر بخواهیم مثال مناسبتری بزنیم میتوانیم به جستجو در گوگل اشاره کنیم. همان طور که میدانید برای دریافت نتایج بهتر، باید از کلمات کلیدی مناسبی در جستجوی گوگل استفاده کنیم. درباره پرامپت هم با همین مساله مواجه هستیم.
مساله دیگر درباره پرامپتها مساله زبان است. هوش مصنوعی قاقلبیت درک اغلب زبانهای زنده دنیا را دارد اما بیتردید برخی زبانها مثل انگلیسی را بهتر میفهمد. بنابراین بیشتر پرامپتها به زبان انگلیسی نوشته میشوند و موضوع اصلی در آنها به زبان مورد نظر مطرح میشود. مثلا ما میخواهیم از هوش مصنوعی در تولید یک کپشن اینستاگرام با موضوع اهمیت تغذیه سالم کمک بگیریم. پرامپت ما به زبان انگلیسی چنین چیزی میشود:
Write an engaging Instagram caption for an image featuring اهمیت تغذیه سالم
اگر این پرامپت را بخواهیم به صورت عمومی درآوریم، یعنی از آن بتوانیم برای تولید کپشن اینستاگرام در هر موضوعی استفاده کنیم (که این مورد بیشتر در مقالات آموزشی وجود دارد، مثلا در یک مقاله میخواهیم پرامپتی به کاربران معرفی کنیم که از آن در تولید انواع کپشن اینستاگرام با موضوعات مختلف استفاده کنند) آن وقت پرامپت ما به این شکل در میآید:
Write an engaging Instagram caption for an image featuring [describe the image].