Por que estudar desvio padrão
Ao escutar o áudio de corações diferentes percebe-se que, sabendo a posição da quantidade de batimentos cardíacos por minuto, podemos determinar a idade do dono do coração. Ter um posicionamento dentro do seu conjunto de dados é importante, mas algumas vezes não é o único dado a se analisar. Ao verificar se um paciente tem problemas cardíacos procura-se, além do número de batimentos por minuto, seu ritmo no electrocardiograma. No caso, estuda-se o ritmo do coração, se ele muda bastante de passo ou não, em outras palavras, o quanto dispersos estão os batimentos comparados com a média. Repare na diferença entre os seguintes áudios:
Ad
Você sabe dizer qual coração tem arritmia?
Vamos para outro exemplo, vamos estudar as seguintes séries:
X: 70, 70, 70, 70, 70
Y: 68,69, 70, 71, 72
Z: 0, 10, 70, 110, 160
A média aritmética para cada série é 70, apenas a série X tem moda, e a mediana das 3 é 70. Apesar disso, notoriamente, as três são bem diferentes.
Chama-se dispersão ou variabilidade a maior ou menor diversificação dos valores de uma variável em torno de um valor de tendência central tomado como ponto de comparação. No caso do exemplo, X tem dispersão nula, enquanto Y tem uma dispersão menor que Z.
Como calcular variância e desvio padrão
Como índices de variabilidade estável, são utilizados a variância e o desvio padrão.
A variância baseia-se nos desvios em torno da média aritmética, porém determinando a média aritmética dos quadrados dos desvios. Assim, é representada por s²:
\[ s^{2} = \frac{\sum{(x_i - \bar{x})^{2}}}{\sum{f_i}} \]
Sendo a variância calculada a partir dos quadrados dos desvios, ela é um número em unidade quadrada em relação à variável em questão, o que, sob o ponto de vista prático, é um inconveniente; imaginou-se uma nova medida que tem utilidade e interpretação prática, denominada desvio padrão, definida como a raiz quadrada da variância:
\[ s = \sqrt{s^{2}} \]
Propriedades
1º: O desvio padrão é sempre positivo ou nulo. O desvio padrão de uma constante é nulo.
2º: Somando-se (ou subtraindo-se) uma constante c de todos os valores de uma variável, o desvio padrão continuará o mesmo, uma propriedade chamada invariante por translação.
3º: Multiplicando-se (ou dividindo-se) todos os valores de uma variável por uma constante c, o desvio padrão fica multiplicado (ou dividido) por essa constante.
Desvio para dados não-agrupados
Toma-se como exemplo a seguinte série da variável x:
X: 40, 45, 48, 52, 54, 62, 70
O modo mais prático para calcular o desvio padrão seria criar uma tabela dos dados e seus quadrados:
x | Média | desvio | desvio quadrado |
---|---|---|---|
40 | 53 | -13 | 169 |
45 | 53 | -8 | 64 |
48 | 53 | -5 | 25 |
52 | 53 | -1 | 1 |
54 | 53 | +1 | 1 |
62 | 53 | +9 | 81 |
70 | 53 | +17 | 289 |
Ad
\[ \text{Somatório dos desvios ao quadrado: } = 630 \]
\[ \text{Número de elementos na amostra: } = 7 \]
\[ \text{variância } = \frac{630}{7} = 90 \]
\[ \text{desvio-padrão } = \sqrt{90} = 9,49 \]
Desvio para dados agrupados: sem intervalos de classe
Como para este caso temos a presença de frequências devemos levá-las em consideração, multiplicando o quadrado do desvio pela frequência, resultando na fórmula:
\[ s^{2} = \frac{\sum{f_i*(x_i - \bar{x})^{2}}}{\sum{f_i}} \]
Como exemplo:
x | Frequência | Média | desvio | desvio quadrado | Desvio quadrado* frequência |
---|---|---|---|---|---|
0 | 2 | 2,1 | -2,1 | 4.41 | 8.82 |
1 | 6 | 2,1 | -1,1 | 1.21 | 7.26 |
2 | 12 | 2,1 | -0,1 | 0.01 | 0.12 |
3 | 7 | 2,1 | +0,9 | 0.81 | 5.67 |
4 | 3 | 2,1 | +1,9 | 3.61 | 10.83 |
\[ \text{Somatório dos desvios ao quadrado: } = 32.7 \]
\[ \text{Número de elementos na amostra: } = 30 \]
\[ \text{variância } = \frac{32.7}{30} = 1,09 \]
\[ \text{desvio-padrão } = \sqrt{1,09} = 1,044 \]
Desvio para dados agrupados: com intervalos de classe
Para intervalos de classe considera-se o ponto médio como o valor daquela classe.
Como exemplo:
Classe | Ponto médio | Frequência | Média | desvio | desvio quadrado | Desvio quadrado* frequência |
---|---|---|---|---|---|---|
0 - 2 | 1 | 2 | 5 | -4 | 16 | 32 |
2 - 4 | 3 | 2 | 5 | -2 | 4 | 8 |
4 - 6 | 5 | 2 | 5 | 0 | 0 | 0 |
6 - 8 | 7 | 2 | 5 | +2 | 4 | 8 |
8 - 10 | 9 | 2 | 5 | +4 | 16 | 32 |
\[ \text{Somatório dos desvios ao quadrado: } = 80 \]
\[ \text{Número de elementos na amostra: } = 10 \]
\[ \text{variância } = \frac{80}{10} = 8 \]
\[ \text{desvio-padrão } = \sqrt{8} = 2,82 \]
Coeficiente de variação
O desvio padrão por si só não nos diz muita coisa. Assim, um desvio padrão de duas unidades pode ser considerado pequeno para uma série de valores cujo valor médio é 200; no entanto, se a média for igual a 20, o mesmo não pode ser dito.
Além disso, o fato de o desvio padrão ser expresso na mesma unidade dos dados limita o seu emprego quando deseja-se comparar duas ou mais séries de valores, relativamente à sua dispersão ou variabilidade.
Para contornar essas difilcudades e limitações se utiliza o coeficiente de variação (CV):
\[ \text{CV } = \frac{s}{\bar{x}} \]
Assim, para o último exemplo onde:
\[ \text{desvio-padrão } = 2,82 \]
\[ \text{média } = 5 \]
\[ \text{CV } = \frac{2,82}{5} = 0.564 = 56,4 \% \]
Exercícios
1) Calcule os desvios padrões dos seguintes conjuntos:
Ad
(a) 1,3,4,9;
(b) 20, 14, 15, 19, 21, 22, 20;
2) Calcule os desvios padrões dos seguintes conjuntos:
(a) 17.9, 22.5, 13.3, 16.8, 15.4, 14.2;
(b) -10, -6, 2, 3, 7, 9, 10;
3) Calcule os desvios padrões da seguinte distribuição:
X | Frequência |
---|---|
2 | 1 |
3 | 3 |
4 | 5 |
5 | 8 |
6 | 5 |
7 | 4 |
8 | 2 |
4) Calcule os desvios padrões da seguinte distribuição:
X | Frequência |
---|---|
1,5-1,6 | 4 |
1,6-1,7 | 8 |
1,7-1,8 | 12 |
1,8-1,9 | 15 |
1,9-2,0 | 12 |
2,0-2,1 | 8 |
2,1-2,2 | 4 |
5) Sabendo que um conjunto de dados apresenta para média aritmética e para desvio padrão, respectivamente, 18,3 e 1,47, calcule o coeficiente de variação.
6) Em um exame final de Matemática, o grau médio de um grupo de 150 alunos foi 7,8 e o desvio padrão, 0,80. Em Estatística, entretanto, o grau médio final foi 7,3 e o desvio padrão, 0,76. Em que disciplina foi maior a dispersão?
7) Medidas as estaturas de 1.017 indivíduos, obtivemos média = 162,2 cm e s = 8,01 cm. O peso médio desses mesmos indivíduos é 52 kg, com um desvio padrão de 2,3 kg. Esses indivíduos apresentam maior variabilidade em estatura ou em peso?
8) Um grupo de cem estudantes tem uma estatura média de 163,8 em, com um coeficiente de variação de 3,3%. Qual o desvio padrão desse grupo?
9) Uma distribuição apresenta as seguintes estatísticas: s = 1,5 e CV = 2,9%. Determine a média da distribuição.
Gabarito
1) a. 2,94; b. 2,81;
2) a. 3,01; b. 7,03;
3) 1,51;
4) 0,159;
5) 8,03%
6) Estatística
7) Estatura
8) 5,41
9) 51,7
— Comentários0
Seja o primeiro a comentar