Pandas Introduction
Pandas چیست؟
Pandas یک کتابخانه پایتون جهت کار با مجموعه دادهها است.
دارای توابعی جهت تحلیل، تمیز کردن (cleaning) و دستکاری داده است.
اسم Pandas به هردوی Panel Data و Python Data Analysis اشاره دارد و در سال 2008 توسط Wes McKinney ساخته شده است.
چرا از Pandas استفاده کنیم؟
Pandas به ما این امکان را میدهد که دادههای حجیم را تحلیل و بر اساس نظریههای آماری از آنها نتایجی را استخراج کنیم.
Pandas میتواند مجموعه دادههای به هم ریخته را تمیز کرده و آنها را قابل خواندن و مرتبط (relevant) سازد.
در علم داده، دادههای مرتبط (relevant data) بسیار با اهمیت هستند.
Pandas چه کاری میتواند انجام دهد؟
Pandas به سوالاتی نظیر سوالات زیر در مورد داده پاسخ میدهد:
- آیا ارتباطی (correlation) بین دو یا چند ستون وجود دارد؟
- مقدار میانگین چیست؟
- مقدار بیشینه؟
- مقدار کمینه؟
Pandas همچنین قادر است سطرهای نامرتبط یا دارای مقادیر اشتباه، خالی یا Null را حذف کند. به این عمل تمیز کردن داده گفته میشود.
پایگاه کد Pandas کجاست؟
منبع کد Pandas در https://github.com/pandas-dev/pandas واقع است.