O Que São Desvio Padrão e Variância
Desvio padrão e variância são medidas de dispersão — indicam o quanto os valores de um conjunto de dados se afastam da média. Enquanto a média diz o valor central, a dispersão diz se os dados estão concentrados perto da média ou espalhados.
Imagine duas turmas com média 7 em uma prova. Na turma A, todos tiraram notas entre 6 e 8. Na turma B, as notas variaram de 2 a 10. A média é a mesma, mas a dispersão é completamente diferente. O desvio padrão e a variância capturam exatamente essa diferença.
Na prática, essas medidas são usadas em diversas áreas: controle de qualidade na indústria, análise de investimentos (volatilidade), pesquisas científicas, análise de dados de marketing, previsão de demanda e muito mais.
Variância: Fórmula e Cálculo
A variância mede a média dos quadrados dos desvios em relação à média. Existem duas fórmulas dependendo se você está trabalhando com uma população inteira ou com uma amostra.
Variância Populacional (σ²)
Usada quando você tem todos os dados da população:
σ² = Σ(xi - μ)² / N
Onde: xi = cada valor, μ = média, N = número total de valores
Variância Amostral (s²)
Usada quando você tem apenas uma amostra da população:
s² = Σ(xi - x̄)² / (n - 1)
Onde: xi = cada valor, x̄ = média amostral, n = tamanho da amostra
A diferença é o denominador: N para população, (n-1) para amostra. Dividir por (n-1) é chamado de correção de Bessel e corrige um viés que faria a variância amostral subestimar a variância real da população.
Exemplo Passo a Passo
Dados: notas de 6 alunos em uma prova: 5, 7, 8, 6, 9, 7
Passo 1: Calcular a média:
x̄ = (5 + 7 + 8 + 6 + 9 + 7) / 6 = 42 / 6 = 7
Use a Calculadora de Média Aritmética para esse passo.
Passo 2: Calcular os desvios de cada valor em relação à média e elevar ao quadrado:
| Valor (xi) | Desvio (xi - x̄) | Desvio² (xi - x̄)² |
|---|---|---|
| 5 | -2 | 4 |
| 7 | 0 | 0 |
| 8 | 1 | 1 |
| 6 | -1 | 1 |
| 9 | 2 | 4 |
| 7 | 0 | 0 |
Passo 3: Somar os desvios ao quadrado:
Σ(xi - x̄)² = 4 + 0 + 1 + 1 + 4 + 0 = 10
Passo 4: Calcular a variância. Se for amostra (mais comum):
s² = 10 / (6 - 1) = 10 / 5 = 2
Se for população:
σ² = 10 / 6 = 1,667
Use a Calculadora de Variância para calcular automaticamente.
Desvio Padrão: Fórmula e Cálculo
O desvio padrão é simplesmente a raiz quadrada da variância:
Desvio Padrão = √Variância
Para o exemplo anterior:
s = √2 = 1,414 (amostral)
σ = √1,667 = 1,291 (populacional)
O desvio padrão é mais usado na prática porque está na mesma unidade de medida dos dados originais. Se os dados são notas (de 0 a 10), o desvio padrão também é em notas. A variância, por ser o quadrado, fica em "notas ao quadrado", o que é difícil de interpretar.
Use a Calculadora de Desvio Padrão para obter o resultado automaticamente.
Quando Usar População vs. Amostra
Essa é uma dúvida frequente. A regra é simples:
- População: quando você tem todos os dados possíveis. Exemplo: as notas de todos os 30 alunos de uma turma
- Amostra: quando você tem um subconjunto dos dados e quer estimar o comportamento da população. Exemplo: pesquisa com 500 pessoas para estimar a opinião de milhões
Na maioria dos casos práticos, você está trabalhando com amostras. Na dúvida, use a fórmula amostral (com n-1) — ela é mais conservadora e evita subestimar a dispersão real.
Interpretando o Desvio Padrão
O valor do desvio padrão sozinho não diz se a dispersão é alta ou baixa — depende do contexto. Porém, existem regras práticas:
Regra Empírica (para distribuições normais)
- Cerca de 68% dos dados estão dentro de 1 desvio padrão da média (μ ± σ)
- Cerca de 95% dos dados estão dentro de 2 desvios padrão (μ ± 2σ)
- Cerca de 99,7% dos dados estão dentro de 3 desvios padrão (μ ± 3σ)
No exemplo: média = 7, desvio padrão ≈ 1,41. Então 68% dos alunos tiraram entre 5,59 e 8,41. E 95% tiraram entre 4,18 e 9,82.
Coeficiente de Variação
Para comparar a dispersão de conjuntos de dados com médias diferentes, use o coeficiente de variação:
CV = (Desvio Padrão / Média) x 100
No exemplo: CV = (1,414 / 7) x 100 = 20,2%. Geralmente, CV até 15% indica baixa dispersão, entre 15% e 30% moderada, e acima de 30% alta dispersão.
Aplicações Práticas
Controle de Qualidade
Na indústria, o desvio padrão mede a variabilidade do processo produtivo. Uma fábrica que produz parafusos com diâmetro médio de 10 mm e desvio padrão de 0,01 mm tem um processo muito mais preciso do que uma com desvio padrão de 0,5 mm. O método Seis Sigma, por exemplo, busca processos com no máximo 3,4 defeitos por milhão de oportunidades — um nível de variabilidade extremamente baixo.
Investimentos e Finanças
No mercado financeiro, o desvio padrão dos retornos de um ativo é a medida mais usada de risco (volatilidade). Uma ação com retorno médio de 12% ao ano e desvio padrão de 5% é mais previsível do que uma com o mesmo retorno médio mas desvio padrão de 25%.
Pesquisas e Ciências
Em pesquisas científicas, o desvio padrão é reportado junto com a média para indicar a precisão dos resultados. Um resultado de "120 ± 3" (média ± desvio padrão) é mais preciso do que "120 ± 30".
Comentários