فصل سوم: حرکت به سمت گفتگو (Chat) 💬
تو فصل قبلی، با معماری ترنسفورمر و نحوه کارکرد مدلهای زبان آشنا شدیم. روشی که این مدلها آموزش میبینن، تاثیر خیلی زیادی روی رفتارشون داره. یه «مدل پایه» (Base Model)، مدلیه که فقط مرحله پیشآموزش رو گذرونده. یعنی با میلیاردها متن و سند از سراسر اینترنت آموزش دیده. اگه شما نصف یه متن رو به این مدل بدید، اون یه ادامه کاملاً باورپذیر براش تولید میکنه. همین قابلیت به تنهایی خیلی کاربردیه و ما تو این کتاب بهتون نشون میدیم که چطور میشه این مدلها رو «گول زد» تا کلی کار دیگه غیر از تکمیل متن هم برامون انجام بدن!
اما استفاده از مدلهای پایه تو اپلیکیشنهای واقعی، به چند دلیل میتونه سخت و چالشبرانگیز باشه.
چالش شماره ۱: جنبه تاریک اینترنت! ...
با احترام، به دلیل هزینههای سرویسهای سایت
برای مشاهده کامل این مقاله و دسترسی به محتوای کامل سایت، نیاز به اکانت پرو دارید.
با اکانت پرو به تمامی مقالات، دورهها و محتوای ویژه دسترسی خواهید داشت.