Estatística

Aula

Medidas de dispersão: variância e desvio padrão

, Comment regular icon0 comments

Hoje falaremos de uma das medidas mais importantes: medidas de dispersão. Elas nos ajudaram a entender o quão perto cada dado se encontra da média!

Edit Article

Por que estudar desvio padrão

Ao escutar o áudio de corações diferentes percebe-se que, sabendo a posição da quantidade de batimentos cardíacos por minuto, podemos determinar a idade do dono do coração. Ter um posicionamento dentro do seu conjunto de dados é importante, mas algumas vezes não é o único dado a se analisar. Ao verificar se um paciente tem problemas cardíacos procura-se, além do número de batimentos por minuto, seu ritmo no electrocardiograma. No caso, estuda-se o ritmo do coração, se ele muda bastante de passo ou não, em outras palavras, o quanto dispersos estão os batimentos comparados com a média. Repare na diferença entre os seguintes áudios:

Ad

Você sabe dizer qual coração tem arritmia?

Vamos para outro exemplo, vamos estudar as seguintes séries:

X: 70, 70, 70, 70, 70

Y: 68,69, 70, 71, 72

Z: 0, 10, 70, 110, 160

A média aritmética para cada série é 70, apenas a série X tem moda, e a mediana das 3 é 70. Apesar disso, notoriamente, as três são bem diferentes.

Chama-se dispersão ou variabilidade a maior ou menor diversificação dos valores de uma variável em torno de um valor de tendência central tomado como ponto de comparação. No caso do exemplo, X tem dispersão nula, enquanto Y tem uma dispersão menor que Z.

Image content of the Website

Como calcular variância e desvio padrão

Como índices de variabilidade estável, são utilizados a variância e o desvio padrão.

A variância baseia-se nos desvios em torno da média aritmética, porém determinando a média aritmética dos quadrados dos desvios. Assim, é representada por s²:

\[ s^{2} = \frac{\sum{(x_i - \bar{x})^{2}}}{\sum{f_i}} \]

Sendo a variância calculada a partir dos quadrados dos desvios, ela é um número em unidade quadrada em relação à variável em questão, o que, sob o ponto de vista prático, é um inconveniente; imaginou-se uma nova medida que tem utilidade e interpretação prática, denominada desvio padrão, definida como a raiz quadrada da variância:

\[ s = \sqrt{s^{2}} \]

Propriedades

1º: O desvio padrão é sempre positivo ou nulo. O desvio padrão de uma constante é nulo.

2º: Somando-se (ou subtraindo-se) uma constante c de todos os valores de uma variável, o desvio padrão continuará o mesmo, uma propriedade chamada invariante por translação.

3º: Multiplicando-se (ou dividindo-se) todos os valores de uma variável por uma constante c, o desvio padrão fica multiplicado (ou dividido) por essa constante.

Desvio para dados não-agrupados

Toma-se como exemplo a seguinte série da variável x:

X: 40, 45, 48, 52, 54, 62, 70

O modo mais prático para calcular o desvio padrão seria criar uma tabela dos dados e seus quadrados:

xMédiadesviodesvio quadrado
4053-13169
4553-864
4853-525
5253-11
5453+11
6253+981
7053+17289

Ad

\[ \text{Somatório dos desvios ao quadrado: } = 630 \]

\[ \text{Número de elementos na amostra: } = 7 \]

\[ \text{variância } = \frac{630}{7} = 90 \]

\[ \text{desvio-padrão } = \sqrt{90} = 9,49 \]

Desvio para dados agrupados: sem intervalos de classe

Como para este caso temos a presença de frequências devemos levá-las em consideração, multiplicando o quadrado do desvio pela frequência, resultando na fórmula:

\[ s^{2} = \frac{\sum{f_i*(x_i - \bar{x})^{2}}}{\sum{f_i}} \]

Como exemplo:

xFrequênciaMédiadesviodesvio quadradoDesvio quadrado* frequência
022,1-2,14.418.82
162,1-1,11.217.26
2122,1-0,10.010.12
372,1+0,90.815.67
432,1+1,93.6110.83

\[ \text{Somatório dos desvios ao quadrado: } = 32.7 \]

\[ \text{Número de elementos na amostra: } = 30 \]

\[ \text{variância } = \frac{32.7}{30} = 1,09 \]

\[ \text{desvio-padrão } = \sqrt{1,09} = 1,044 \]

Desvio para dados agrupados: com intervalos de classe

Para intervalos de classe considera-se o ponto médio como o valor daquela classe.

Como exemplo:

ClassePonto médioFrequênciaMédiadesviodesvio quadradoDesvio quadrado* frequência
0 - 2125-41632
2 - 4325-248
4 - 6525000
6 - 8725+248
8 - 10925+41632

\[ \text{Somatório dos desvios ao quadrado: } = 80 \]

\[ \text{Número de elementos na amostra: } = 10 \]

\[ \text{variância } = \frac{80}{10} = 8 \]

\[ \text{desvio-padrão } = \sqrt{8} = 2,82 \]

Coeficiente de variação

O desvio padrão por si só não nos diz muita coisa. Assim, um desvio padrão de duas unidades pode ser considerado pequeno para uma série de valores cujo valor médio é 200; no entanto, se a média for igual a 20, o mesmo não pode ser dito.

Além disso, o fato de o desvio padrão ser expresso na mesma unidade dos dados limita o seu emprego quando deseja-se comparar duas ou mais séries de valores, relativamente à sua dispersão ou variabilidade.

Para contornar essas difilcudades e limitações se utiliza o coeficiente de variação (CV):

\[ \text{CV } = \frac{s}{\bar{x}} \]

Assim, para o último exemplo onde:

\[ \text{desvio-padrão } = 2,82 \]

\[ \text{média } = 5 \]

\[ \text{CV } = \frac{2,82}{5} = 0.564 = 56,4 \% \]

Exercícios

1) Calcule os desvios padrões dos seguintes conjuntos:

Ad

(a) 1,3,4,9;

(b) 20, 14, 15, 19, 21, 22, 20;

2) Calcule os desvios padrões dos seguintes conjuntos:

(a) 17.9, 22.5, 13.3, 16.8, 15.4, 14.2;

(b) -10, -6, 2, 3, 7, 9, 10;

3) Calcule os desvios padrões da seguinte distribuição:

XFrequência
21
33
45
58
65
74
82

4) Calcule os desvios padrões da seguinte distribuição:

XFrequência
1,5-1,64
1,6-1,78
1,7-1,812
1,8-1,915
1,9-2,012
2,0-2,18
2,1-2,24

5) Sabendo que um conjunto de dados apresenta para média aritmética e para desvio padrão, respectivamente, 18,3 e 1,47, calcule o coeficiente de variação.

6) Em um exame final de Matemática, o grau médio de um grupo de 150 alunos foi 7,8 e o desvio padrão, 0,80. Em Estatística, entretanto, o grau médio final foi 7,3 e o desvio padrão, 0,76. Em que disciplina foi maior a dispersão?

7) Medidas as estaturas de 1.017 indivíduos, obtivemos média = 162,2 cm e s = 8,01 cm. O peso médio desses mesmos indivíduos é 52 kg, com um desvio padrão de 2,3 kg. Esses indivíduos apresentam maior variabilidade em estatura ou em peso?

8) Um grupo de cem estudantes tem uma estatura média de 163,8 em, com um coeficiente de variação de 3,3%. Qual o desvio padrão desse grupo?

9) Uma distribuição apresenta as seguintes estatísticas: s = 1,5 e CV = 2,9%. Determine a média da distribuição.

Gabarito

1) a. 2,94; b. 2,81;

2) a. 3,01; b. 7,03;

3) 1,51;

4) 0,159;

5) 8,03%

6) Estatística

7) Estatura

8) 5,41

9) 51,7