Pandas DataFrames

چارچوب داده چیست؟

چارچوب داده (DataFrame) در Pandas یک داده با ساختار دو بعدی، مانند یک آرایه دو بعدی یا یک جدول دارای سطرها و ستون‌ها است.

در کد زیر یک چارچوب داده ساده را ایجاد کرده‌ایم.


import pandas as pd

data = {
  "calories": [420, 380, 390],
  "duration": [50, 40, 45]
}

#load data into a DataFrame object:
df = pd.DataFrame(data)

print(df)

خروجی:

تعیین سطر

چنانکه در مثال بالا می‌بینید، چارچوب داده مثل یک جدول شامل سطرها و ستون‌ها است.

در Pandas برای برگرداندن یک یا چند سطر از ویژگی loc استفاده می‌کنیم.


import pandas as pd

data = {
  "calories": [420, 380, 390],
  "duration": [50, 40, 45]
}

#load data into a DataFrame object:
df = pd.DataFrame(data)

print(df.loc[0])

خروجی:

توجه داشته باشید که در این مثال یک سری Pandas برگردانده شده است.

در کد زیر سطرهای صفر و یک برگردانده می‌شوند.


import pandas as pd

data = {
  "calories": [420, 380, 390],
  "duration": [50, 40, 45]
}

#load data into a DataFrame object:
df = pd.DataFrame(data)

print(df.loc[[0, 1]])

خروجی:

زمانیکه از [] استفاده می‌کنیم، مانند مثال بالا، یک چارچوب داده برگردانده می‌شود.

ایندکس‌های نامگذاری شده

با استفاده از آرگومان index می‌توانید اسم‌های دلخواه خود را روی ایندکس‌ها قرار دهید.


import pandas as pd

data = {
  "calories": [420, 380, 390],
  "duration": [50, 40, 45]
}

df = pd.DataFrame(data, index = ["day1", "day2", "day3"])

print(df)

خروجی:

پیدا کردن ایندکس نامگذاری شده

می‌تواند اسامی ایندکس‌های مورد نظر را داخل ویژگی loc بنویسید و سطرهای مربوطه را برگردانید.


import pandas as pd

data = {
  "calories": [420, 380, 390],
  "duration": [50, 40, 45]
}

df = pd.DataFrame(data, index = ["day1", "day2", "day3"])

print(df.loc["day2"])

خروجی: