Pular para o conteúdo

Adicionando Linhas a um DataFrame no Python

[

Como adicionar linhas a um dataframe em Python

Os dataframes são estruturas de dados muito utilizadas na análise de dados em Python. Eles permitem armazenar e manipular dados tabulares, semelhantes a uma tabela ou planilha, tornando a análise e a visualização de dados mais fáceis. Uma tarefa comum na manipulação de dataframes é adicionar novas linhas de dados a eles. Neste tutorial, vamos aprender como adicionar linhas a um dataframe em Python, passo a passo, com exemplos executáveis detalhados.

Pré-requisitos

Antes de começar, é necessário ter o Python instalado em sua máquina. Você também precisará instalar a biblioteca pandas, que é uma poderosa ferramenta para a manipulação de dataframes. Você pode instalá-la usando o seguinte comando no seu terminal:

pip install pandas

Passo 1: Importar a biblioteca pandas

Antes de começar a trabalhar com dataframes, é necessário importar a biblioteca pandas no seu código Python. Você pode fazer isso usando o seguinte comando:

import pandas as pd

Passo 2: Criar um dataframe vazio

Para adicionar linhas a um dataframe, primeiro precisamos criar um dataframe vazio. Podemos fazer isso usando o construtor da classe DataFrame do pandas. Aqui está um exemplo de como criar um dataframe vazio:

df = pd.DataFrame(columns=['Nome', 'Idade', 'Cidade'])

Neste exemplo, estamos criando um dataframe com três colunas: “Nome”, “Idade” e “Cidade”. O dataframe está vazio porque não adicionamos nenhuma linha ainda.

Passo 3: Adicionar linhas ao dataframe

Agora que temos um dataframe vazio, podemos começar a adicionar linhas a ele. Existem várias maneiras de fazer isso, mas a mais comum é usando o método append() do pandas.

Para adicionar uma única linha ao dataframe, podemos criar uma série pandas com os valores da nova linha e usar o método append(). Aqui está um exemplo:

nova_linha = pd.Series(['João', 25, 'São Paulo'], index=df.columns)
df = df.append(nova_linha, ignore_index=True)

Neste exemplo, criamos a série nova_linha com os valores que queremos adicionar ao dataframe. Usamos o parâmetro index para garantir que os valores sejam atribuídos às colunas corretas do dataframe. Em seguida, usamos o método append() para adicionar a nova linha ao dataframe. O parâmetro ignore_index=True garante que os índices das linhas sejam redefinidos após a adição da nova linha.

Passo 4: Adicionar várias linhas ao dataframe

Se você precisar adicionar várias linhas ao dataframe de uma vez, pode criar um novo dataframe com as linhas desejadas e usar o método concat() do pandas para concatenar os dataframes. Aqui está um exemplo:

novas_linhas = pd.DataFrame([
['Maria', 30, 'Rio de Janeiro'],
['Pedro', 35, 'Belo Horizonte'],
], columns=df.columns)
df = pd.concat([df, novas_linhas], ignore_index=True)

Neste exemplo, criamos o dataframe novas_linhas com duas linhas adicionais que queremos adicionar ao dataframe original. Usamos o método concat() para concatenar os dataframes, e novamente usamos o parâmetro ignore_index=True para redefinir os índices das linhas.

Passo 5: Verificar o dataframe resultante

Após adicionar as linhas ao dataframe, é sempre uma boa prática verificar se as linhas foram adicionadas corretamente. Podemos fazer isso imprimindo o dataframe resultante. Aqui está um exemplo de como fazer isso:

print(df)

Este código imprimirá o dataframe completo, incluindo as linhas adicionadas.

Conclusão

Neste tutorial, aprendemos como adicionar linhas a um dataframe em Python usando a biblioteca pandas. Vimos que podemos adicionar uma única linha usando o método append(), e adicionar várias linhas usando o método concat(). Também aprendemos a verificar o resultado imprimindo o dataframe resultante. Agora você pode aplicar essas técnicas em seus próprios projetos de análise de dados em Python.