Python Pandas как создать dataframe
Сегодня мы ответим на вопрос как создать python pandas dataframe.
class pandas.DataFrame(data=None, index=None, columns=None, dtype=None, copy=None)[source]
Pandas DataFrame — это двумерная структура данных, подобная любой таблице со строками и столбцами. Размер и значения фрейма данных изменяемы, т. е. могут быть изменены. Это наиболее часто используемый объект панд. Pandas DataFrame можно создать несколькими способами. Давайте обсудим различные способы создания DataFrame один за другим.
@data_analysis_ml – прокачай свои python навыки в нашем канале.
pandas.DataFrame(data, index, columns)
data: это набор данных, из которого должен быть создан фрейм данных. Это может быть список, словарь, скалярное значение, series, ndarrays и т. д.
index: это необязательно, по умолчанию индекс фрейма данных начинается с 0 и заканчивается последним значением данных (n-1). Он явно определяет метку строки.
columns: этот параметр используется для предоставления имен столбцов в кадре данных. Если имя столбца не определено по умолчанию, оно будет принимать значение от 0 до n-1.
Importing Pandas to create DataFrame
import pandas as pd
# Creating Empty DataFrame and Storing it in variable df
df = pd.DataFrame()
# Printing Empty DataFrame
print(df)
Вывод:
Функция DataFrame() pandas используется для создания фрейма данных.
Переменная df — это имя фрейма данных в нашем примере.
Метод № 1: создание фрейма данных из списка
# Import pandas library
import pandas as pd
# initialize list elements
data = [10,20,30,40,50,60]
# Create the pandas DataFrame with column name is provided explicitly
df = pd.DataFrame(data, columns=['Numbers'])
# print dataframe.
df
Способ № 2: создание Pandas DataFrame из списков списков.
# Import pandas library
import pandas as pd
# initialize list of lists
data = [['tom', 10], ['nick', 15], ['juli', 14]]
# Create the pandas DataFrame
df = pd.DataFrame(data, columns=['Name', 'Age'])
# print dataframe.
df
Метод № 3: Создание DataFrame из списка narray/lists
Чтобы создать DataFrame из списка narray/list, все narray должны быть одинаковой длины. Если передается индекс, то индекс длины должен быть равен длине массивов. Если индекс не передается, то по умолчанию индекс будет равен диапазону (n), где n — длина массива.
# Python code demonstrate creating
# DataFrame from dict narray / lists
# By default addresses.
import pandas as pd
# initialize data of lists.
data = {'Name': ['Tom', 'nick', 'krish', 'jack'],
'Age': [20, 21, 19, 18]}
# Create DataFrame
df = pd.DataFrame(data)
# Print the output.
df
Примечание. При создании фрейма данных с использованием словаря ключами словаря по умолчанию будут имена столбцов. Мы также можем указать имя столбца явно, используя параметр столбца.
Метод № 4: Создание DataFrame путем явного объявления метки индекса.
# Python code demonstrate creating
# pandas DataFrame with indexed by
# DataFrame using arrays.
import pandas as pd
# initialize data of lists.
data = {'Name': ['Tom', 'Jack', 'nick', 'juli'],
'marks': [99, 98, 95, 90]}
# Creates pandas DataFrame.
df = pd.DataFrame(data, index=['rank1',
'rank2',
'rank3',
'rank4'])
# print the data
df
Метод № 5: создание Dataframe из списка диктов
Pandas DataFrame можно создать, передав списки словарей в качестве входных данных. По умолчанию ключи словаря будут восприниматься как столбцы.
# Python code demonstrate how to create
# Pandas DataFrame by lists of dicts.
import pandas as pd
# Initialize data to lists.
data = [{'a': 1, 'b': 2, 'c': 3},
{'a': 10, 'b': 20, 'c': 30}]
# Creates DataFrame.
df = pd.DataFrame(data)
# Print the data
df
Вывод:
Способ № 6: Создание DataFrame с помощью функции zip().
Два списка можно объединить с помощью функции list(zip()). Теперь создайте DataFrame pandas, вызвав функцию pd.DataFrame().
# Python program to demonstrate creating
# pandas Dataframe from lists using zip.
import pandas as pd
# List1
Name = ['tom', 'krish', 'nick', 'juli']
# List2
Age = [25, 30, 26, 22]
# get the list of tuples from two lists.
# and merge them by using zip().
list_of_tuples = list(zip(Name, Age))
# Assign data to tuples.
list_of_tuples
# Converting lists of tuples into
# pandas Dataframe.
df = pd.DataFrame(list_of_tuples,
columns=['Name', 'Age'])
# Print data.
df
Метод № 7: Создание фрейма данных из серии
Чтобы создать кадр данных из series, мы должны передать series в качестве аргумента функции DataFrame().
# Python code demonstrate creating
# Pandas Dataframe from series.
import pandas as pd
# Initialize data to series.
d = pd.Series([10, 20, 30, 40])
# creates Dataframe.
df = pd.DataFrame(d)
# print the data.
df
Метод № 8: Создание DataFrame из словаря серий.
Чтобы создать DataFrame из серии Dict, можно передать словарь для формирования DataFrame. Результирующий индекс представляет собой объединение всех пройденных индексированных серий.
# Python code demonstrate creating
# Pandas Dataframe from Dicts of series.
import pandas as pd
# Initialize data to Dicts of series.
d = {'one': pd.Series([10, 20, 30, 40],
index=['a', 'b', 'c', 'd']),
'two': pd.Series([10, 20, 30, 40],
index=['a', 'b', 'c', 'd'])}
# creates Dataframe.
df = pd.DataFrame(d)
# print the data.
df