O que é Covariância
Covariância é uma medida de associação (relação) LINEAR entre duas variáveis aleatórias. Assim, variáveis independentes têm covariância zero.
A covariância é por vezes chamada de medida de dependência linear entre as duas variáveis aleatórias.
Cálculo da covariância para dados não agrupados
Imagina-se dois conjuntos de dados:
X: 2, 4, 6, 8, 10
Y: 10, 8, 6, 4, 2
Verifica-se de imediato que x e y têm uma correlação negativa: quanto mais temos X menos temos Y.
Ad
Nesse caso há a necessidade de os elementos estarem ligados a um evento ou tempo(para este caso, os que estão na mesma coluna estão ocorrendo simultaneamente). É necessário saber que x está ligado a y, porque justamente queremos saber se quando aumentarmos x, diminuirá, manterá ou aumentará y! Devido a essa característica, a única forma de calcular a covariância é com dados não agrupados, não usaremos mais distribuição de frequência ou classes.
A forma mais simples de entender covariância é vendo os desvios:
desvios de x: -4, -2, 0, 2, 4
desvios de y: 4, 2, 0, -2, -4
Percebe-se que quando um conjunto tem desvio negativo o outro tem desvio positivo e vice-versa, isso mostra a correlação negativa. Mas, no momento, queremos estudar covariância, de onde a correlação é estudada.
> Covariância é a média da seguinte conta: desvios do conjunto A multiplicados pelos desvios do conjunto B
Em fórmula matemática:
\[ cov(X, Y) = \frac{\sum{(x - \bar{x})(y - \bar{y})}}{n} \]
Para o caso do exemplo anterior:
X | Y | desvios de X | desvios de Y | Multiplicação dos desvios |
---|---|---|---|---|
2 | 10 | -4 | 4 | -16 |
4 | 8 | -2 | 2 | -4 |
6 | 6 | 0 | 0 | 0 |
8 | 4 | 2 | -2 | -4 |
10 | 2 | 4 | -4 | -16 |
\[ cov(X, Y) = \frac{-40}{5} = -8 \]
A covariância nesse caso é negativa e vale -8. O número 8 não nos diz muito nesse caso, mas o fato de ser negativa sim, isso indica que quando uma variável aumenta a outra diminui.
A covariância faz muito sentido na prática quando paramos para pensar nas seguintes alternativas que temos:
- Quando os dois desvios são negativos, a multiplicação deles será positiva, assim a covariância tende a ficar positiva. Em outras palavras, quando as duas variáveis tendem a cair juntas, a covariância tende a estar positiva.
- Quando os dois desvios são positivos, a multiplicação deles será positiva, assim a covariância tende a ficar positiva. Em outras palavras, quando as duas variáveis tendem a subir juntas, a covariância tende a estar positiva.
- Quandos os dois desvios têm sinais trocados, a multiplicação será negativa, assim a covariância tende a ficar negativa. Em outras palavras, quando as duas variáveis não se comportam iguais, a covariância tende a estar negativa.
Outras fórmulas de calcular covariância
Também é possível calcular a covariância de outra forma:
\[ cov(X, Y) = \frac{\sum{(x - \bar{x})(y - \bar{y})}}{n} \]
\[ cov(X, Y) = E[(x - \bar{x})(y - \bar{y})] \]
\[ cov(X, Y) = E[x · y - \bar{x} · y - \bar{y} · x + \bar{x} · \bar{y}] \]
\[ cov(X, Y) = E[x · y] - E[\bar{x} · y] - E[\bar{y} · x] + E[\bar{x} · \bar{y}] \]
\[ cov(X, Y) = E[x · y] - \bar{x} · E[y] - \bar{y} · E[x] + \bar{x} · \bar{y} \]
\[ cov(X, Y) = E[x · y] - \bar{x} · \bar{y} - \bar{y} · \bar{x} + \bar{x} · \bar{y} \]
Ad
\[ cov(X, Y) = E[x · y] - \bar{x} · \bar{y} \]
\[ cov(X, Y) = \frac{\sum{x · y}}{n}- \bar{x} · \bar{y} \]
Em outras palavras: covariância também pode ser expressa pela média da multiplicação de cada elemento de X por Y menos suas médias multiplicadas.
Exemplos
1º exemplo
X | Y | X*Y |
---|---|---|
2 | 10 | 20 |
4 | 8 | 32 |
6 | 6 | 36 |
8 | 4 | 32 |
10 | 2 | 20 |
\[ cov(X, Y) = \frac{\sum{x · y}}{n}- \bar{x} · \bar{y} = \frac{140}{5} - 6 · 6 = 28 - 36 = -8 \]
2º exemplo
X | Y | desvios de X | desvios de Y | Multiplicação dos desvios | X*Y |
---|---|---|---|---|---|
2 | 5 | -2 | 0 | 0 | 10 |
2 | 6 | -2 | 1 | -2 | 12 |
6 | 3 | 2 | -2 | -4 | 18 |
5 | 9 | 1 | 4 | 4 | 45 |
5 | 2 | 1 | -3 | -3 | 10 |
\[ cov(X, Y) = \frac{\sum{(x - \bar{x})(y - \bar{y})}}{n} = \frac{-5}{5} = -1 \]
Ou:
\[ cov(X, Y) = \frac{\sum{x · y}}{n}- \bar{x} · \bar{y} = \frac{95}{5} - 4 · 5 = 19 - 20 = -1 \]
Propriedades da covariância
1) A covariância de dois conjuntos iguais é a variância do conjunto:
\[ cov(X, X) = var(X) \]
2) A covariância de A e B é o mesmo que a covariância de B e A:
\[ cov(X, Y) = cov(Y, X) \]
3) Somar qualquer elementos às variáveis A e B não altera a covariância:
\[ cov(X + a, Y + b) = cov(Y, X) \]
4) Multiplicar qualquer elemento às variáveis A e B multiplica a covariância:
\[ cov(X · a, Y · b) = a · b · cov(Y, X) \]
Exercícios
1) Calcule a covariância dos seguintes conjuntos de dados:
X | Y |
---|---|
5 | 10 |
10 | 20 |
15 | 30 |
25 | 50 |
35 | 70 |
2) Calcule a covariância dos seguintes conjuntos de dados:
X | Y |
---|---|
25 | 40 |
15 | 30 |
35 | 20 |
10 | 40 |
15 | 50 |
3) Calcule a covariância dos seguintes conjuntos de dados:
X | Y |
---|---|
9 | 2 |
8 | 3 |
5 | 3 |
6 | 3 |
4 | 2 |
4) Pedrinho viu um conjunto de dados e resolveu fazer algumas transformações. Primeiro diminuiu todos os dados pela média, para ter média zero. Resolvou logo depois somar 50 em todos os dados para média ser 50. Depois multiplicou todos os dados por 100. No começo a covariância do conjunto tinha valor 10, quanto vale agora?
Ad
5) Calcule a covariância dos seguintes conjuntos de dados:
Bradesco | Canon |
---|---|
9,77 | 35,04 |
9,62 | 34,93 |
9,46 | 34,79 |
9,41 | 35,07 |
9,43 | 34,34 |
9,45 | 34,25 |
9,36 | 34,35 |
Gabarito
1) 232;
2) -60;
3) -0,04;
4) 1000;
5) 0,0256
— Comentários0
Seja o primeiro a comentar