Como utilizar a amostragem com reposição no Python?
Amostragem com reposição em Python
A amostragem com reposição é uma técnica estatística utilizada para criar uma amostra aleatória a partir de um conjunto de dados, permitindo que os mesmos elementos possam ser escolhidos mais de uma vez. Esse método é muito comum em simulações estatísticas, como o método Monte Carlo, que utiliza amostras aleatórias para estimar resultados.
Neste tutorial, vamos aprender como realizar amostragem com reposição em Python, utilizando a função random.choices()
da biblioteca random
e a biblioteca numpy
.
Neste exemplo, temos uma lista nba_weights
contendo os pesos de um grupo de jogadores de basquete em quilogramas. O objetivo é calcular o intervalo de confiança de 95% da média do peso desses jogadores utilizando a amostragem com reposição.
Passo a passo:
- Importe as bibliotecas
random
enumpy
:
- Defina a lista
nba_weights
com os pesos dos jogadores:
- Realize a amostragem com reposição usando a função
random.choices()
. Definak=9
para obter uma amostra de tamanho 9:
- Calcule a média da amostra utilizando a função
np.mean()
da bibliotecanumpy
:
- Calcule o intervalo de confiança de 95% da média utilizando a função
np.percentile()
. Defina[2.5, 97.5]
para obter os valores correspondentes aos percentis 2.5 e 97.5:
- Imprima os resultados:
Ao executar o código, você obterá uma amostra aleatória dos pesos dos jogadores, a média dessa amostra e o intervalo de confiança de 95% da média. Esses resultados são úteis para estimar o peso médio dos jogadores de basquete com um nível de confiança de 95%.
Lembrando que essa é apenas uma aplicação simples da amostragem com reposição em Python. Você pode adaptar esse exemplo para realizar simulações mais complexas e obter estimativas de outros parâmetros estatísticos. Experimente modificar o tamanho da amostra e o número de repetições para ver como os resultados variam.