Pular para o conteúdo

Como utilizar a amostragem com reposição no Python?

[

Amostragem com reposição em Python

A amostragem com reposição é uma técnica estatística utilizada para criar uma amostra aleatória a partir de um conjunto de dados, permitindo que os mesmos elementos possam ser escolhidos mais de uma vez. Esse método é muito comum em simulações estatísticas, como o método Monte Carlo, que utiliza amostras aleatórias para estimar resultados.

Neste tutorial, vamos aprender como realizar amostragem com reposição em Python, utilizando a função random.choices() da biblioteca random e a biblioteca numpy.

import random
import numpy as np
nba_weights = [96.7, 101.1, 97.9, 98.1, 98.1, 100.3, 101.0, 98.0, 97.4]
# Realizando a amostragem com reposição
sample = random.choices(nba_weights, k=9)
# Calculando a média da amostra
mean = np.mean(sample)
# Calculando o intervalo de confiança de 95% da média
confidence_interval = np.percentile(sample, [2.5, 97.5])
# Imprimindo os resultados
print("Amostra:", sample)
print("Média:", mean)
print("Intervalo de Confiança (95%):", confidence_interval)

Neste exemplo, temos uma lista nba_weights contendo os pesos de um grupo de jogadores de basquete em quilogramas. O objetivo é calcular o intervalo de confiança de 95% da média do peso desses jogadores utilizando a amostragem com reposição.

Passo a passo:

  1. Importe as bibliotecas random e numpy:
import random
import numpy as np
  1. Defina a lista nba_weights com os pesos dos jogadores:
nba_weights = [96.7, 101.1, 97.9, 98.1, 98.1, 100.3, 101.0, 98.0, 97.4]
  1. Realize a amostragem com reposição usando a função random.choices(). Defina k=9 para obter uma amostra de tamanho 9:
sample = random.choices(nba_weights, k=9)
  1. Calcule a média da amostra utilizando a função np.mean() da biblioteca numpy:
mean = np.mean(sample)
  1. Calcule o intervalo de confiança de 95% da média utilizando a função np.percentile(). Defina [2.5, 97.5] para obter os valores correspondentes aos percentis 2.5 e 97.5:
confidence_interval = np.percentile(sample, [2.5, 97.5])
  1. Imprima os resultados:
print("Amostra:", sample)
print("Média:", mean)
print("Intervalo de Confiança (95%):", confidence_interval)

Ao executar o código, você obterá uma amostra aleatória dos pesos dos jogadores, a média dessa amostra e o intervalo de confiança de 95% da média. Esses resultados são úteis para estimar o peso médio dos jogadores de basquete com um nível de confiança de 95%.

Lembrando que essa é apenas uma aplicação simples da amostragem com reposição em Python. Você pode adaptar esse exemplo para realizar simulações mais complexas e obter estimativas de outros parâmetros estatísticos. Experimente modificar o tamanho da amostra e o número de repetições para ver como os resultados variam.