Pandas Read CSV

خواندن فایل‌های CSV

یک راه ساده برای ذخیره مجموعه داده‌های بزرگ، استفاده از فایل‌های CSV است که کوتاه شده عبارت comma separated files است.

فایل‌های CSV به صورت Plain Text هستند و یک فرمت بسیار شناخته شده است که تقریباً توسط همه از جمله Pandas قابل خواندن هستند.

در مثال‌های این بخش از یک فایل به اسم 'data.csv' استفاده می‌کنیم.

دانلود data.csv


import pandas as pd

df = pd.read_csv('data.csv')

print(df.to_string())

از to_string() جهت نمایش کل چارچوب داده استفاده شده است.

اگر یک چارچوب داده بزرگ با تعداد سطرهای زیاد داشته باشید، Pandas فقط 5 سطر ابتدایی و 5 سطر پایانی را نمایش می‌دهد.

در کد زیر بدون استفاده از تابع شیء to_string() چارچوب داده رانمایش می‌دهیم.


import pandas as pd

df = pd.read_csv('data.csv')

print(df)

خروجی:

max_rows

حداکثر تعداد سطرهای برگردانده شده توسط Pandas در تنظیمات آن تعیین می‌شود.

با استفاده از دستور pd.options.display.max_rows می‌توانید مشاهده کنید که در سیستم شما حداکثر تعداد سطرهایی که Pandas برمی‌گرداند چقدر است.


import pandas as pd

print(pd.options.display.max_rows)

خروجی:

چنانکه ملاحظه می‌کنید در سیستم من حداکثر تعداد سطرهایی که برگردانده می‌شود برابر 60 است. این بدان معنا است که اگر مجموعه داده بیشتر از 60 سطر داشته باشد، آنگاه دستور print(df) تنها سر عنوان‌ها (headers) و 5 سطر ابتدایی و پایانی را نمایش می‌دهد.

جهت تغییر حداکثر تعداد سطرهای برگردانده شده توسط Pandas می‌توانید تعداد آن را به صورت زیر تعیین کنید.

pd.options.display.max_rows = 9999