0

Pandas - Visualização inicial dos Dados

#Python
Juliano Santos
Juliano Santos

Gostaria de compartilhar alguns comandos importantes utilizados no pandas, biblioteca do Python, principalmente para a visualização de entrada dos datasets que iremos trabalhar. Como o foco é sempre simplificar, seguem alguns comandos de entrada que sempre são de ajuda, principalmente quando estamos iniciando nos Dados!

Considerando que já importamos a nossa Biblioteca do Pandas ( " import pandas as pd " ) e assumindo que definimos o nome atribuído ao dataset como " df ", seguem alguns dos principais comandos para entendermos melhor nosso dataset e analisarmos os dados de entrada:


df.head() - Por padrão ele mostra as primeiras 5 entradas do dataset. Se precisarmos observar mais ou menos que cinco entradas, é só colocarmos o valor entre os parênteses;


df.tail() - Parecido com o " .head() ", porém, ele mostra as últimas entradas do dataset;


df.info() - Retorna informações sobre o dataset, incluindo valores nulos ou em branco;


df.describe() - Mostra os valores matemáticos ou estatísticos do dataframe, como a média, valores mínimo e máximo, por exemplo. Por meio destes valores poderemos ter uma idéia geral do equilíbrio do dataset em referência aos valores com outliers (valores que estão fora do comum, muito acima ou abaixo da média), que podem interferir em modelos posteriormente se não tratados.


df.shape - Mostra o total de linhas e colunas do dataset de maneira específica;


df.columns - Atributo que mostra a nomeação das colunas do dataset;


df.dtypes - Retorna informações sobre quais os tipos de dados das variáveis de cada coluna (ex: float, int, datetime, etc);


df.isnull().sum() - Este comando localiza todos os valores nulos dos seus dados e retorna a soma total de quantos valores nulos existem em cada coluna.


Resumindo, estes são apenas alguns dos comandos principais para visualização dos dados que iremos trabalhar.

Este artigo é direcionado principalmente para quem está iniciando na área de dados ou que tem curiosidade de saber mais e gostaria de dar os primeiros passos com o Pandas, em Python.

Qualquer sugestão, correção ou dica são muito bem vindos, podem colocar abaixo, para compartilharmos o aprendizado.

0
2

Comentários (0)

None

Brasil