Estatística

Aula

Medidas de associação ou relação: covariância

, editado , Comment regular icon0 comments

Vamos ver a primeira medida que coletamos quando estudamos a relação entre duas variáveis: a covariância

Edit Article

O que é Covariância

Covariância é uma medida de associação (relação) LINEAR entre duas variáveis aleatórias. Assim, variáveis independentes têm covariância zero.

A covariância é por vezes chamada de medida de dependência linear entre as duas variáveis aleatórias.

Cálculo da covariância para dados não agrupados

Imagina-se dois conjuntos de dados:

X: 2, 4, 6, 8, 10

Y: 10, 8, 6, 4, 2

Verifica-se de imediato que x e y têm uma correlação negativa: quanto mais temos X menos temos Y.

Ad

Nesse caso há a necessidade de os elementos estarem ligados a um evento ou tempo(para este caso, os que estão na mesma coluna estão ocorrendo simultaneamente). É necessário saber que x está ligado a y, porque justamente queremos saber se quando aumentarmos x, diminuirá, manterá ou aumentará y! Devido a essa característica, a única forma de calcular a covariância é com dados não agrupados, não usaremos mais distribuição de frequência ou classes.

A forma mais simples de entender covariância é vendo os desvios:

desvios de x: -4, -2, 0, 2, 4

desvios de y: 4, 2, 0, -2, -4

Percebe-se que quando um conjunto tem desvio negativo o outro tem desvio positivo e vice-versa, isso mostra a correlação negativa. Mas, no momento, queremos estudar covariância, de onde a correlação é estudada.

> Covariância é a média da seguinte conta: desvios do conjunto A multiplicados pelos desvios do conjunto B

Em fórmula matemática:

\[ cov(X, Y) = \frac{\sum{(x - \bar{x})(y - \bar{y})}}{n} \]

Para o caso do exemplo anterior:

XYdesvios de Xdesvios de YMultiplicação dos desvios
210-44-16
48-22-4
66000
842-2-4
1024-4-16

\[ cov(X, Y) = \frac{-40}{5} = -8 \]

A covariância nesse caso é negativa e vale -8. O número 8 não nos diz muito nesse caso, mas o fato de ser negativa sim, isso indica que quando uma variável aumenta a outra diminui.

A covariância faz muito sentido na prática quando paramos para pensar nas seguintes alternativas que temos:

- Quando os dois desvios são negativos, a multiplicação deles será positiva, assim a covariância tende a ficar positiva. Em outras palavras, quando as duas variáveis tendem a cair juntas, a covariância tende a estar positiva.

- Quando os dois desvios são positivos, a multiplicação deles será positiva, assim a covariância tende a ficar positiva. Em outras palavras, quando as duas variáveis tendem a subir juntas, a covariância tende a estar positiva.

- Quandos os dois desvios têm sinais trocados, a multiplicação será negativa, assim a covariância tende a ficar negativa. Em outras palavras, quando as duas variáveis não se comportam iguais, a covariância tende a estar negativa.

Outras fórmulas de calcular covariância

Também é possível calcular a covariância de outra forma:

\[ cov(X, Y) = \frac{\sum{(x - \bar{x})(y - \bar{y})}}{n} \]

\[ cov(X, Y) = E[(x - \bar{x})(y - \bar{y})] \]

\[ cov(X, Y) = E[x · y - \bar{x} · y - \bar{y} · x + \bar{x} · \bar{y}] \]

\[ cov(X, Y) = E[x · y] - E[\bar{x} · y] - E[\bar{y} · x] + E[\bar{x} · \bar{y}] \]

\[ cov(X, Y) = E[x · y] - \bar{x} · E[y] - \bar{y} · E[x] + \bar{x} · \bar{y} \]

\[ cov(X, Y) = E[x · y] - \bar{x} · \bar{y} - \bar{y} · \bar{x} + \bar{x} · \bar{y} \]

Ad

\[ cov(X, Y) = E[x · y] - \bar{x} · \bar{y} \]

\[ cov(X, Y) = \frac{\sum{x · y}}{n}- \bar{x} · \bar{y} \]

Em outras palavras: covariância também pode ser expressa pela média da multiplicação de cada elemento de X por Y menos suas médias multiplicadas.

Exemplos

1º exemplo

XYX*Y
21020
4832
6636
8432
10220

\[ cov(X, Y) = \frac{\sum{x · y}}{n}- \bar{x} · \bar{y} = \frac{140}{5} - 6 · 6 = 28 - 36 = -8 \]

2º exemplo

XYdesvios de Xdesvios de YMultiplicação dos desviosX*Y
25-20010
26-21-212
632-2-418
5914445
521-3-310

\[ cov(X, Y) = \frac{\sum{(x - \bar{x})(y - \bar{y})}}{n} = \frac{-5}{5} = -1 \]

Ou:

\[ cov(X, Y) = \frac{\sum{x · y}}{n}- \bar{x} · \bar{y} = \frac{95}{5} - 4 · 5 = 19 - 20 = -1 \]

Propriedades da covariância

1) A covariância de dois conjuntos iguais é a variância do conjunto:

\[ cov(X, X) = var(X) \]

2) A covariância de A e B é o mesmo que a covariância de B e A:

\[ cov(X, Y) = cov(Y, X) \]

3) Somar qualquer elementos às variáveis A e B não altera a covariância:

\[ cov(X + a, Y + b) = cov(Y, X) \]

4) Multiplicar qualquer elemento às variáveis A e B multiplica a covariância:

\[ cov(X · a, Y · b) = a · b · cov(Y, X) \]

Exercícios

1) Calcule a covariância dos seguintes conjuntos de dados:

XY
510
1020
1530
2550
3570

2) Calcule a covariância dos seguintes conjuntos de dados:

XY
2540
1530
3520
1040
1550

3) Calcule a covariância dos seguintes conjuntos de dados:

XY
92
83
53
63
42

4) Pedrinho viu um conjunto de dados e resolveu fazer algumas transformações. Primeiro diminuiu todos os dados pela média, para ter média zero. Resolvou logo depois somar 50 em todos os dados para média ser 50. Depois multiplicou todos os dados por 100. No começo a covariância do conjunto tinha valor 10, quanto vale agora?

Ad

5) Calcule a covariância dos seguintes conjuntos de dados:

BradescoCanon
9,7735,04
9,6234,93
9,4634,79
9,4135,07
9,4334,34
9,4534,25
9,3634,35

Gabarito

1) 232;

2) -60;

3) -0,04;

4) 1000;

5) 0,0256