Como usar o np.random.normal no Python?
Como Gerar Números Aleatórios Distribuídos Normalmente com NumPy
A distribuição normal é uma das distribuições de probabilidade mais úteis, pois modela muito bem muitos fenômenos naturais. Com o NumPy, é possível criar amostras de números aleatórios a partir da distribuição normal.
Como Usar o NumPy para Gerar Números Aleatórios Distribuídos Normalmente
O NumPy inclui um subpacote completo, numpy.random
, dedicado ao trabalho com números aleatórios. Por motivos históricos, este pacote inclui muitas funções. No entanto, normalmente você deve começar instanciando um gerador de números aleatórios padrão (RNG):
O RNG pode gerar uma variedade de distribuições, incluindo a distribuição normal. Para gerar uma amostra de números aleatórios distribuídos normalmente, você usa a função np.random.normal()
:
Neste exemplo, a média é 0 e o desvio padrão é 1. Estamos gerando uma amostra de 1000 números aleatórios distribuídos normalmente.
Plotando os Números Distribuídos Normalmente
Uma maneira comum de visualizar os números distribuídos normalmente é criar um histograma. Você pode fazer isso usando a biblioteca Matplotlib:
Este código irá gerar um histograma dos números gerados, com o eixo x representando os valores e o eixo y representando a frequência em que esses valores ocorrem.
Especificando a Média e o Desvio Padrão
Você pode especificar valores personalizados para a média e o desvio padrão ao gerar números aleatórios distribuídos normalmente. Por exemplo:
Neste exemplo, estamos gerando uma amostra de 1000 números aleatórios distribuídos normalmente com média 5 e desvio padrão 2.
Trabalhando com Números Aleatórios no NumPy
O NumPy oferece uma variedade de funções para trabalhar com números aleatórios. Por exemplo, você pode calcular a média, o desvio padrão e outros valores estatísticos da amostra gerada:
Você também pode manipular os números gerados utilizando operações matemáticas comuns:
Iterando em Direção à Normalidade com o Teorema do Limite Central
O Teorema do Limite Central é um conceito importante na estatística que descreve como a média de uma amostra se aproxima de uma distribuição normal à medida que o tamanho da amostra aumenta. Você pode experimentar isso gerando várias amostras e calculando suas médias:
Este código irá gerar um histograma das médias das amostras aleatórias. Você verá que a distribuição se aproxima de uma distribuição normal à medida que o número de amostras aumenta.
Conclusão
Gerar números aleatórios distribuídos normalmente é uma tarefa comum na análise estatística e em várias aplicações de aprendizado de máquina. O NumPy fornece uma maneira fácil e eficiente de fazer isso. Com várias funções, você pode especificar a média e o desvio padrão desejados, gerar amostras de diferentes tamanhos e realizar várias operações estatísticas.
Agora você tem as ferramentas necessárias para trabalhar com números aleatórios distribuídos normalmente usando o NumPy. Experimente e explore todas as possibilidades que este pacote oferece!