Unsupervised Learning Introduction
یادگیری بدون نظارت
در این بخش میخواهیم بحث درباره خوشهبندی یا clustering را آغاز کنیم. در حقیقت این بخش آغازی بر شروع مبحث یادگیری بدون نظارت است و میخواهیم اولین الگوریتم یادگیری براساس دادههای بدون برچسب را معرفی کنیم. اما یادگیری بدون نظارت چیست؟ تا اینجا در مورد یادگیری با نظارت صحبت کردیم. در ابتدا با مقایسه آن با یادگیری بدون نظارت میخواهیم به درک بهتری از تفاوت این دو مبحث برسیم.
در یادگیری با نظارت دادههای ما دارای برچسب بودند و هدف ما پیدا کردن مرزی بود که دادههای با برچسب متفاوت را را از هم جدا کند.
در مقابل یادگیری بدون نظارت قرار میگیرد که در آن دادههای ما برچسب ندارند و به مانند شکل زیر خواهند بود، یک سری نقاط بدون برچسب.
چنانکه مشاهده میکنید دیگر برچسب y در مجموعه دادهها وجود ندارد. بنابراین آنچه که ما از الگوریتم یادگیری بدون نظارت میخواهیم آن است که در مجموعه دادههای بدون برچسب یک ساختار را پیدا کند. به عبارت دیگر دادهها را به خوشههایی تقسیم کند و به همین جهت هم است که به آن الگوریتم خوشهبندی میگویند.
البته الگوریتمهای دیگری هم وجود دارند که ساختارهای متفاوت دیگری را می توانند در دادهها پیدا کنند که در فصلهای بعدی بعضی از آنها را معرفی خواهیم کرد.
کاربردهای خوشهبندی
تحلیل شبکههای اجتماعی: مانند فیس بوک و اینستاگرام و ... که سعی میکنند افراد مرتبط با یکدیگر را گروهبندی کند.
تقسیمبندی بازار: دیتابیسی از مشتریان را دارید و میخواهید آنها را به گروههایی تقسیم کنید تا محصولات بخشهای مختلف را به صورت جداگانه به آنها بفروشید.
سازماندهی خوشههای محاسباتی: برای سازماندهی و طراحی بهتر مرکز داده و ارتباطات.
تحلیل دادههای نجومی: مثلا نحوهی شکلگیری کهکشانها.