Pular para o conteúdo

Como criar facilmente um DataFrame vazio utilizando pandas

[

Pandas: Criando um DataFrame vazio

O Pandas é uma biblioteca Python popular para análise de dados. Uma das tarefas básicas ao trabalhar com o Pandas é criar um DataFrame vazio. Um DataFrame é uma estrutura de dados tabular que contém linhas e colunas, similar a uma planilha. Neste tutorial, vamos aprender como criar um DataFrame vazio utilizando o Pandas.

Sumário

  1. Introdução
  2. Criando um DataFrame vazio usando o construtor pd.DataFrame()
  3. Especificando as colunas ao criar um DataFrame vazio
  4. Definindo um índice personalizado para o DataFrame vazio
  5. Adicionando linhas a um DataFrame vazio
  6. Definindo o tipo de dado das colunas ao criar um DataFrame vazio
  7. Criando um DataFrame vazio com diferentes tipos de dados
  8. Adicionando valores nulos a um DataFrame vazio
  9. Criando um DataFrame vazio a partir de um dicionário
  10. Utilizando o método pd.DataFrame.from_records() para criar um DataFrame vazio
  11. Conclusão

1. Introdução

Ao trabalhar com o Pandas, é comum precisar iniciar com um DataFrame vazio e preenchê-lo posteriormente com os dados desejados. Felizmente, criar um DataFrame vazio é simples e pode ser realizado de várias maneiras. Neste tutorial, veremos várias opções para criar um DataFrame vazio usando o Pandas.

2. Criando um DataFrame vazio usando o construtor pd.DataFrame()

A maneira mais simples de criar um DataFrame vazio é usar o construtor pd.DataFrame(). Basta chamar esse construtor sem passar nenhum argumento para obter um DataFrame vazio.

import pandas as pd
df = pd.DataFrame()
print(df)

A saída será um DataFrame vazio, sem nenhuma coluna ou linha:

Empty DataFrame
Columns: []
Index: []

3. Especificando as colunas ao criar um DataFrame vazio

Embora o DataFrame criado anteriormente seja vazio, podemos especificar as colunas desejadas na criação dele. Podemos fazer isso passando uma lista de nomes de colunas como argumento para o construtor pd.DataFrame().

import pandas as pd
colunas = ['Nome', 'Idade', 'Cidade']
df = pd.DataFrame(columns=colunas)
print(df)

A saída será um DataFrame vazio com as colunas especificadas:

Empty DataFrame
Columns: [Nome, Idade, Cidade]
Index: []

4. Definindo um índice personalizado para o DataFrame vazio

Por padrão, os DataFrames vazios têm um índice numérico padrão. No entanto, podemos definir um índice personalizado durante a criação do DataFrame.

import pandas as pd
indices = ['A', 'B', 'C']
df = pd.DataFrame(index=indices)
print(df)

A saída será um DataFrame vazio com o índice personalizado:

Empty DataFrame
Columns: []
Index: [A, B, C]

5. Adicionando linhas a um DataFrame vazio

Podemos adicionar linhas a um DataFrame vazio usando os métodos loc[] ou append(). Vamos utilizar o método loc[] para adicionar uma única linha.

import pandas as pd
colunas = ['Nome', 'Idade', 'Cidade']
df = pd.DataFrame(columns=colunas)
df.loc[0] = ['João', 25, 'São Paulo']
print(df)

A saída será um DataFrame com a linha adicionada:

Nome Idade Cidade
0 João 25 São Paulo

6. Definindo o tipo de dado das colunas ao criar um DataFrame vazio

Quando criamos um DataFrame vazio, o Pandas infere automaticamente o tipo de dado de cada coluna com base nos valores que serão inseridos nela posteriormente. No entanto, podemos especificar o tipo de dado de cada coluna durante a criação do DataFrame para alocar a quantidade de memória correta.

import pandas as pd
colunas = ['Nome', 'Idade', 'Cidade']
dtypes = ['str', 'int', 'str']
df = pd.DataFrame(columns=colunas, dtype=dtypes)
print(df.dtypes)

A saída será a especificação dos tipos de dados das colunas:

Nome object
Idade int64
Cidade object
dtype: object

7. Criando um DataFrame vazio com diferentes tipos de dados

Podemos criar um DataFrame vazio com diferentes tipos de dados para cada coluna especificando os tipos de dados desejados em uma lista de tuplas.

import pandas as pd
colunas = ['Nome', 'Idade', 'Nota']
dtypes = [('Nome', 'str'), ('Idade', 'int'), ('Nota', 'float')]
df = pd.DataFrame(columns=colunas, dtype=dtypes)
print(df.dtypes)

A saída será a especificação dos tipos de dados das colunas:

Nome object
Idade int64
Nota float64
dtype: object

8. Adicionando valores nulos a um DataFrame vazio

Podemos adicionar valores nulos às células de um DataFrame vazio usando o construtor pd.NaT.

import pandas as pd
colunas = ['Nome', 'Idade', 'Cidade']
df = pd.DataFrame(columns=colunas)
df.loc[0] = [pd.NaT, pd.NaT, pd.NaT]
print(df)

A saída será um DataFrame com valores nulos nas células:

Nome Idade Cidade
0 NaT NaT NaT

9. Criando um DataFrame vazio a partir de um dicionário

Também é possível criar um DataFrame vazio a partir de um dicionário, especificando as colunas como chaves e uma lista vazia como valor.

import pandas as pd
dados = {'Nome': [], 'Idade': [], 'Cidade': []}
df = pd.DataFrame(dados)
print(df)

A saída será um DataFrame vazio:

Empty DataFrame
Columns: [Nome, Idade, Cidade]
Index: []

10. Utilizando o método pd.DataFrame.from_records() para criar um DataFrame vazio

Outra opção é usar o método pd.DataFrame.from_records() para criar um DataFrame vazio. Esse método aceita uma lista vazia como argumento para criar um DataFrame sem nenhuma coluna ou linha.

import pandas as pd
df = pd.DataFrame.from_records([])
print(df)

A saída será um DataFrame vazio:

Empty DataFrame
Columns: []
Index: []

11. Conclusão

Neste tutorial, aprendemos diversas maneiras de criar um DataFrame vazio usando o Pandas. Vimos como criar um DataFrame vazio com ou sem colunas, como especificar tipos de dados, adicionar linhas e valores nulos. Agora você está pronto para criar DataFrames vazios e preenchê-los com os dados adequados em suas análises.

5 FAQs sobre criar um DataFrame vazio

  1. Por que eu preciso criar um DataFrame vazio? R: Criar um DataFrame vazio é útil quando você pretende preenchê-lo posteriormente com dados específicos.

  2. Posso criar um DataFrame vazio com colunas de diferentes tipos de dados? R: Sim, é possível criar um DataFrame vazio com colunas de diferentes tipos de dados especificando os tipos desejados durante a criação.

  3. Como adiciono uma linha a um DataFrame vazio? R: Você pode adicionar uma linha a um DataFrame vazio usando o método loc[] ou append().

  4. Posso definir um índice personalizado para um DataFrame vazio? R: Sim, é possível definir um índice personalizado especificando os valores desejados durante a criação do DataFrame.

  5. É possível criar um DataFrame vazio a partir de um dicionário? R: Sim, você pode criar um DataFrame vazio a partir de um dicionário especificando as chaves como colunas e listas vazias como valores.