Pular para o conteúdo

Como usar facilmente a função read_csv do pandas

[

pandas: Como Ler e Escrever Arquivos

por Mirko Stojiljković

Instalando o pandas

O código neste tutorial é executado com CPython 3.7.4 e pandas 0.25.1. É recomendável garantir que você tenha as versões mais recentes do Python e do pandas em sua máquina. Você pode querer criar um novo ambiente virtual e instalar as dependências para este tutorial.

Primeiramente, você vai precisar da biblioteca pandas. Talvez você já tenha ela instalada. Caso contrário, você pode instalá-la com o pip:

Terminal window
$ pip install pandas

Uma vez que o processo de instalação for concluído, o pandas estará instalado e pronto para uso.

Caso você não tenha o pandas em seu ambiente virtual, você pode instalá-lo com o Conda:

Terminal window
$ conda install pandas

O Conda é poderoso, pois gerencia as dependências e suas versões. Para saber mais sobre como trabalhar com o Conda, você pode consultar a documentação oficial.

Preparando os Dados

Antes de começarmos a ler e escrever arquivos com o pandas, vamos preparar alguns dados para uso. Vamos criar um arquivo CSV simples contendo alguns dados:

import pandas as pd
data = {'Nome': ['João', 'Maria', 'Pedro', 'Laura'],
'Idade': [25, 30, 27, 22],
'Cidade': ['São Paulo', 'Rio de Janeiro', 'Belo Horizonte', 'Brasília']}
df = pd.DataFrame(data)
# Salvando o DataFrame em um arquivo CSV
df.to_csv('dados.csv', index=False)

Neste exemplo, criamos um dicionário data contendo informações sobre algumas pessoas. Em seguida, utilizamos o pandas para transformar esse dicionário em um DataFrame chamado df. Por fim, salvamos o DataFrame em um arquivo CSV chamado dados.csv.

Agora que temos o arquivo CSV, podemos começar a explorar as funções para ler e escrever arquivos com o pandas.

Utilizando as Funções read_csv() e to_csv()

O pandas fornece as funções read_csv() e to_csv() para ler e escrever arquivos CSV, respectivamente. Essas funções são muito convenientes e possuem muitos parâmetros opcionais para personalizar o comportamento de leitura e escrita dos dados.

Escrevendo um Arquivo CSV

Vamos começar aprendendo a escrever um arquivo CSV. Utilize o código a seguir:

import pandas as pd
data = {'Nome': ['Carlos', 'Mariana', 'André', 'Beatriz'],
'Idade': [30, 35, 28, 32],
'Cidade': ['Porto Alegre', 'Curitiba', 'Salvador', 'Fortaleza']}
df = pd.DataFrame(data)
# Salvando o DataFrame em um arquivo CSV
df.to_csv('dados_2.csv', index=False)

Neste exemplo, criamos um novo DataFrame chamado df com informações diferentes. Em seguida, utilizamos a função to_csv() para salvar esse DataFrame em um arquivo CSV chamado dados_2.csv. Definimos o parâmetro index=False para não incluir o índice do DataFrame no arquivo CSV.

Agora você pode verificar o conteúdo do arquivo dados_2.csv e ver que ele contém as informações do DataFrame df.

Lendo um Arquivo CSV

Agora que já aprendemos a escrever um arquivo CSV, vamos aprender a ler um arquivo CSV com o pandas. Utilize o seguinte código:

import pandas as pd
# Lendo o arquivo CSV
df = pd.read_csv('dados.csv')
# Exibindo o conteúdo do DataFrame
print(df)

Neste exemplo, utilizamos a função read_csv() para ler o arquivo CSV chamado dados.csv e armazenar os dados em um DataFrame chamado df. Em seguida, exibimos o conteúdo desse DataFrame utilizando a função print().

Ao executar este código, você verá os dados do arquivo CSV sendo exibidos no console.

Com essas duas funções, to_csv() e read_csv(), você pode facilmente escrever e ler arquivos CSV com o pandas.

Conclusão

O pandas é uma biblioteca poderosa e flexível do Python que permite trabalhar com dados rotulados e séries temporais. Além disso, ele fornece métodos estatísticos, permite a criação de gráficos e muito mais. Uma característica crucial do pandas é sua capacidade de escrever e ler arquivos Excel, CSV e outros tipos de arquivos. As funções read_csv() e to_csv() do pandas são extremamente úteis para trabalhar com arquivos de maneira eficiente.

Neste tutorial, você aprendeu como instalar o pandas, preparar dados, escrever e ler arquivos CSV. Além disso, você recebeu uma introdução ao uso das funções do pandas para trabalhar com outros tipos de arquivos, como arquivos Excel, JSON, HTML, SQL e Pickle. Também vimos como lidar com Big Data e realizar tarefas avançadas, como compressão e descompressão de arquivos, seleção de colunas, exclusão de linhas e manipulação de tipos de dados.

Agora que você tem esses conhecimentos básicos sobre o pandas, você pode explorar mais sobre essa biblioteca poderosa e aprimorar sua capacidade de trabalhar com datasets e análise de dados em Python.