Pandas Introduction

Pandas چیست؟

Pandas یک کتابخانه پایتون جهت کار با مجموعه داده‌‌ها است.

دارای توابعی جهت تحلیل، تمیز کردن (cleaning) و دستکاری داده است.

اسم Pandas به هردوی Panel Data و Python Data Analysis اشاره دارد و در سال 2008 توسط Wes McKinney ساخته شده است.

چرا از Pandas استفاده کنیم؟

Pandas به ما این امکان را می‌دهد که داده‌های حجیم را تحلیل و بر اساس نظریه‌های آماری از آن‌ها نتایجی را استخراج کنیم.

Pandas می‌تواند مجموعه داده‌های به هم ریخته را تمیز کرده و آن‌ها را قابل خواندن و مرتبط (relevant) سازد.

در علم داده، داده‌های مرتبط (relevant data) بسیار با اهمیت هستند.

علم داده، شاخه‌ای از علوم کامپیوتر است که در آن به مطالعه چگونگی نگهداری و تحلیل داده‌ها برای استخراج نتیجه از آن‌ها پرداخته می‌شود.

Pandas چه کاری می‌تواند انجام دهد؟

Pandas به سوالاتی نظیر سوالات زیر در مورد داده پاسخ می‌دهد:

  • آیا ارتباطی (correlation) بین دو یا چند ستون وجود دارد؟
  • مقدار میانگین چیست؟
  • مقدار بیشینه؟
  • مقدار کمینه؟

Pandas همچنین قادر است سطرهای نامرتبط یا دارای مقادیر اشتباه، خالی یا Null را حذف کند. به این عمل تمیز کردن داده گفته می‌شود.

پایگاه کد Pandas کجاست؟

منبع کد Pandas در https://github.com/pandas-dev/pandas واقع است.