Statistik

Klassenzimmer

Análise Bidimensional: causa ou correlação?

, Aktualisiert , Comment regular icon0 comments

No módulo 1 nos concentramos em analisar apenas 1 variável, mas o que devemos fazer quando são duas variáveis? Podemos quantificar a relação entre elas?

Edit Article

Inhaltsverzeichnis

  1. > Introdução sobre bidimensionalidade
  2. > O que significa correlação
    1. Exemplos
  3. > O que significa Causalidade
  4. > Por que correlação não é causalidade

Introdução sobre bidimensionalidade

Até agora vimos como organizar e resumir informações pertinentes a uma única variável, também chamada de análise univariada, mas freqüentemente estamos interessados em analisar o comportamento conjunto de duas ou mais variáveis aleatórias.

A análise do comportamento de duas variáveis em conjunto(como uma se comporta caso aumentarmos ou diminuirmos a outra) é chamada de análise bivariada ou análise bidimensional.

Ad

O que poderíamos querer estudar?

- temperatura na cidade A x temperatura na cidade B

- Salário casados x Salário de solteiros

- Escolaridade x Salário

- Número de policiais na rua x Número de crimes

- etc...

Essa análise permite estabelecer relações entre variáveis, ou seja, determinar se as diferenças entre a distribuição de duas variáveis são estatisticamente significativas, com o objetivo de pesquisar causalidades ou correlações.

O que significa correlação

Em probabilidade e estatística, correlação, dependência ou associação é qualquer relação estatística (causal ou não causal) entre duas variáveis e correlação é qualquer relação dentro de uma ampla classe de relações estatísticas que envolva dependência entre duas variáveis.

A palavra correlação pode ser substituída por sinônimos como: relação, equiparação, nexo, correspondência, analogia e conexão.

Uma correlação positiva significa que os dois itens estudados aumentam ou diminuem juntos. Uma correlação negativa significa que quando um item aumenta, o outro diminui.

Exemplos

> Existe uma correlação positiva entre abrir o guarda chuva e começar a chover;

> Existe uma correlação negativa entre escolaridade e desemprego;

O que significa Causalidade

“Causalidade é a relação entre um evento A (a causa) e um segundo evento B (o efeito), provido que o segundo evento seja uma consequência do primeiro”

- Seu professor Leon

Em termos diretos, A é causa de B quando A é requisito necessário, mas não necessariamente um requisito suficiente, para ocorrência de B. Caracterizar uma relação causal, distinguindo-a de uma simples correlação, deve-se estabelecer não apenas a correlação significativa entre os eventos em questão mas também os mecanismos físicos de ação que levam A a determinar B, ou melhor, a ausência de A a inibir B.

O estudo causal passa a ser um estudo mais qualitativo, tentamos buscar de onde um evento B surgiu. Este estudo já é antigo e remete a Aristóteles, mas ganhou muita força no determinismo: é a teoria filosófica de que todo acontecimento (inclusive o mental) é explicado pela determinação, ou seja, por relações de causalidade.

Assim, estudos modernos procuram a causalidade entre diversos elementos: o que causa um caso de dengue?

- Temperatura atual

- Chuvas passadas

- Casos passados

- Tipo de vegetação

- etc...

Se pararmos para analisar, MUITAS coisas influenciam e CAUSAM os casos de dengue no RJ. Logo, nosso modelo só precisa incluir os maiores e mais comuns efeitos. Um processo reducionista dos dados.

Se omitirmos um grande número de efeitos pequenos e independentes, podemos tratá-los como "ruídos". Paramos de falar sobre as coisas como sendo completamente determinadas pelas causas cogitadas. Ao invés disso, falamos da causa como amplificadora das chances de seus efeitos. Você vai de intuições como “a maior temperatura causa casos de dengue” para intuições como “a maior temperatura aumenta a chance de ocorrer casos de dengue”.

Assim, resolve-se o bando de perguntas “e se” originadas das improváveis exceções que não tínhamos considerado. São todas situações incorporadas como ruído.

Ad

A verdade é que a causalidade dificilmente poderá ser determinada com certeza absoluta. Daí que em ciência já está subentendido que não existem verdades absolutas e que todas as teorias estão abertas a revisão face a novas evidências.

Por que correlação não é causalidade

> A correlação, isto é, a ligação entre dois eventos, não implica necessariamente uma relação de causalidade, ou seja, que um dos eventos tenha causado a ocorrência do outro. A correlação pode no entanto indicar possíveis causas ou áreas para um estudo mais aprofundado, ou por outras palavras, a correlação pode ser uma pista.

Só porque (A) acontece juntamente com (B) não significa que (A) causa (B). Determinar se existe de facto uma relação de causalidade requer investigação adicional pois podem acontecer cinco situações:

- causa realmente (B);

- (A): chuva; (B): abrir guarda chuva;

- pode ser a causa de (A);

- (A): abrir guarda chuva; (B): chuva;

- Um terceiro factor (C) pode ser causa tanto de (A) como de (B);

- (A): abrir guarda chuva; (B): venda de guarda chuva; (C): chuva;

- Pode ser uma combinação das três situações anteriores. Por exemplo, (A) causa (B) e ao mesmo tempo (B) causa também (A);

- (A): chuva; (B): trovão;

- A correlação pode ser apenas uma coincidência, ou seja, os dois eventos não têm qualquer relação para além do facto de ocorrerem ao mesmo tempo. (Se estivermos a falar de um estudo científico, utilizar uma amostra grande ajuda a reduzir a probabilidade de coincidência).

“As chances de ter Alzheimer aos 85 anos é de 10%. Um fumante vive em média 66 anos. Logo, fumar diminui suas chances de ter Alzheimer.”

- Don McMillan

Verdade? Claro que é verdade! Mas será que vale a pena morrer cedo para não ter Alzheimer?

Correlações absurdas [3]

Temos que tomar muito cuidado com correlações. Muitas vezes elas podem nos explicar algo, mas outras vezes podem ser apenas pura coincidências. No site a seguir há alguns exemplos de correlações absurdas encontradas na vida real: http://www.tylervigen.com/spurious-correlations

Ad

[1] https://papodehomem.com.br/se-correlacao-nao-implica-causalidade-entao-o-que-implica

[2] http://comcept.org/cepticismo/correlacao-nao-implica-necessariamente-causalidade/

[3] http://www.tylervigen.com/spurious-correlations

[4] https://academic.oup.com/ije/article/33/3/464/716652