Unsupervised Learning Introduction

یادگیری بدون نظارت

در این بخش می‌‌خواهیم بحث درباره‌ خوشه‌بندی یا clustering را آغاز کنیم. در حقیقت این بخش آغازی بر شروع مبحث یادگیری بدون نظارت است و می‌خواهیم اولین الگوریتم یادگیری براساس داده‌های بدون برچسب را معرفی کنیم. اما یادگیری بدون نظارت چیست؟ تا اینجا در مورد یادگیری با نظارت صحبت کردیم. در ابتدا با مقایسه‌ آن با یادگیری بدون نظارت می‌خواهیم به درک بهتری از تفاوت این دو مبحث برسیم.

در یادگیری با نظارت داده‌های ما دارای برچسب بودند و هدف ما پیدا کردن مرزی بود که داده‌های با برچسب متفاوت را را از هم جدا کند.

$$ \text{training set:} \{(x^{(1)},y^{(1)}),(x^{(2)},y^{(2)}),...,(x^{(m)},y^{(m)})\}$$

در مقابل یادگیری بدون نظارت قرار می‌گیرد که در آن داده‌های ما برچسب ندارند و به مانند شکل‌ زیر خواهند بود، یک سری نقاط بدون برچسب.

$$ \text{training set:} \{x^{(1)},x^{(2)},...,x^{(m)}\}$$

چنانکه مشاهده می‌کنید دیگر برچسب y در مجموعه داده‌ها وجود ندارد. بنابراین آنچه که ما از الگوریتم یادگیری بدون نظارت می‌خواهیم آن است که در مجموعه داده‌های بدون برچسب یک ساختار را پیدا کند. به عبارت دیگر داده‌ها را به خوشه‌هایی تقسیم کند و به همین جهت هم است که به آن الگوریتم خوشه‌بندی می‌گویند.

البته الگوریتم‌های دیگری هم وجود دارند که ساختارهای متفاوت دیگری را می توانند در داده‌ها پیدا کنند که در فصل‌های بعدی بعضی از آن‌ها را معرفی خواهیم کرد.

کاربردهای خوشه‌بندی

تحلیل شبکه‌های اجتماعی: مانند فیس بوک و اینستاگرام و ... که سعی می‌کنند افراد مرتبط با یکدیگر را گروه‌بندی کند.

تقسیم‌بندی بازار: دیتابیسی از مشتریان را دارید و می‌خواهید آن‌ها را به گروه‌هایی تقسیم کنید تا محصولات بخش‌های مختلف را به صورت جداگانه به آن‌ها بفروشید.

سازماندهی خوشه‌های محاسباتی: برای سازماندهی و طراحی بهتر مرکز داده و ارتباطات.

تحلیل داده‌های نجومی: مثلا نحوه‌ی شکل‌گیری کهکشان‌ها.