Como usar facilmente a função read_csv do pandas
pandas: Como Ler e Escrever Arquivos
por Mirko Stojiljković
Instalando o pandas
O código neste tutorial é executado com CPython 3.7.4 e pandas 0.25.1. É recomendável garantir que você tenha as versões mais recentes do Python e do pandas em sua máquina. Você pode querer criar um novo ambiente virtual e instalar as dependências para este tutorial.
Primeiramente, você vai precisar da biblioteca pandas. Talvez você já tenha ela instalada. Caso contrário, você pode instalá-la com o pip:
Uma vez que o processo de instalação for concluído, o pandas estará instalado e pronto para uso.
Caso você não tenha o pandas em seu ambiente virtual, você pode instalá-lo com o Conda:
O Conda é poderoso, pois gerencia as dependências e suas versões. Para saber mais sobre como trabalhar com o Conda, você pode consultar a documentação oficial.
Preparando os Dados
Antes de começarmos a ler e escrever arquivos com o pandas, vamos preparar alguns dados para uso. Vamos criar um arquivo CSV simples contendo alguns dados:
Neste exemplo, criamos um dicionário data
contendo informações sobre algumas pessoas. Em seguida, utilizamos o pandas para transformar esse dicionário em um DataFrame chamado df
. Por fim, salvamos o DataFrame em um arquivo CSV chamado dados.csv
.
Agora que temos o arquivo CSV, podemos começar a explorar as funções para ler e escrever arquivos com o pandas.
Utilizando as Funções read_csv() e to_csv()
O pandas fornece as funções read_csv()
e to_csv()
para ler e escrever arquivos CSV, respectivamente. Essas funções são muito convenientes e possuem muitos parâmetros opcionais para personalizar o comportamento de leitura e escrita dos dados.
Escrevendo um Arquivo CSV
Vamos começar aprendendo a escrever um arquivo CSV. Utilize o código a seguir:
Neste exemplo, criamos um novo DataFrame chamado df
com informações diferentes. Em seguida, utilizamos a função to_csv()
para salvar esse DataFrame em um arquivo CSV chamado dados_2.csv
. Definimos o parâmetro index=False
para não incluir o índice do DataFrame no arquivo CSV.
Agora você pode verificar o conteúdo do arquivo dados_2.csv
e ver que ele contém as informações do DataFrame df
.
Lendo um Arquivo CSV
Agora que já aprendemos a escrever um arquivo CSV, vamos aprender a ler um arquivo CSV com o pandas. Utilize o seguinte código:
Neste exemplo, utilizamos a função read_csv()
para ler o arquivo CSV chamado dados.csv
e armazenar os dados em um DataFrame chamado df
. Em seguida, exibimos o conteúdo desse DataFrame utilizando a função print()
.
Ao executar este código, você verá os dados do arquivo CSV sendo exibidos no console.
Com essas duas funções, to_csv()
e read_csv()
, você pode facilmente escrever e ler arquivos CSV com o pandas.
Conclusão
O pandas é uma biblioteca poderosa e flexível do Python que permite trabalhar com dados rotulados e séries temporais. Além disso, ele fornece métodos estatísticos, permite a criação de gráficos e muito mais. Uma característica crucial do pandas é sua capacidade de escrever e ler arquivos Excel, CSV e outros tipos de arquivos. As funções read_csv()
e to_csv()
do pandas são extremamente úteis para trabalhar com arquivos de maneira eficiente.
Neste tutorial, você aprendeu como instalar o pandas, preparar dados, escrever e ler arquivos CSV. Além disso, você recebeu uma introdução ao uso das funções do pandas para trabalhar com outros tipos de arquivos, como arquivos Excel, JSON, HTML, SQL e Pickle. Também vimos como lidar com Big Data e realizar tarefas avançadas, como compressão e descompressão de arquivos, seleção de colunas, exclusão de linhas e manipulação de tipos de dados.
Agora que você tem esses conhecimentos básicos sobre o pandas, você pode explorar mais sobre essa biblioteca poderosa e aprimorar sua capacidade de trabalhar com datasets e análise de dados em Python.