اپیزود نهم - مدل‌های زبانی بزرگ چطوری ساخته شدند؟


Episode Artwork
1.0x
0% played 00:00 00:00
Jun 15 2024 44 mins   3

سلام. من امیر پورمند هستم و این قسمت نهم از ایستگاه هوش مصنوعیه. تو قسمت‌های قبل راجع به مدل‌های زبانی بزرگ حرف‌هایی زدیم ولی هرگز نگفتم که مدل زبانی چیه و چطوری درست شده. 


تو این قسمت می‌خوام راجع به این صحبت کنم. واقعاً هم نمی‌خوام بحث تئوری کنم. می‌خوام راجع به این‌ها صحبت کنم که وقتی قسمت‌های بعد راجع به نقاط ضعف و محدویت‌های مدل‌های زبانی صحبت کردم، یه ایده‌ای داشته باشید که چرا این نقاط ضعف بوجود اومدند یا حتی اینطوری خودتون می‌تونید راجع به کاربردهای این مدل‌ها تو صنعت خودتون بهتر فکر کنید. 


در واقع این قسمت معرفی مدل‌های زبانی بزرگ بر مبنای یک داستانه. داستان دانش‌آموزی که میره دبستان، خوندن و نوشتن یاد می‌گیره. بعد تو دبیرستان، یک سری مفاهیم رو از بر می‌کنه و تو دانشگاه نحوه تعامل با آدم‌ها رو یاد می‌گیره. 


همچنین قبلاً هم این پست راجع به مدل‌های زبانی نوشتم و بعضی چیزهایی که میگم رو اون‌جا با شکل توضیح دادم. در واقع یک چیز رو با دو بیان مختلف گفتم:


https://aprd.ir/large-language-models-training/


متن این قسمت رو هم می‌تونید در اینجا بصورت کامل ببینید:


https://aprd.ir/ai-station-e09-llm-training/