Estatística

Aula

Análise Bidimensional: causa ou correlação?

, editado , Comment regular icon0 comments

No módulo 1 nos concentramos em analisar apenas 1 variável, mas o que devemos fazer quando são duas variáveis? Podemos quantificar a relação entre elas?

Edit Article

Introdução sobre bidimensionalidade

Até agora vimos como organizar e resumir informações pertinentes a uma única variável, também chamada de análise univariada, mas freqüentemente estamos interessados em analisar o comportamento conjunto de duas ou mais variáveis aleatórias.

A análise do comportamento de duas variáveis em conjunto(como uma se comporta caso aumentarmos ou diminuirmos a outra) é chamada de análise bivariada ou análise bidimensional.

Ad

O que poderíamos querer estudar?

- temperatura na cidade A x temperatura na cidade B

- Salário casados x Salário de solteiros

- Escolaridade x Salário

- Número de policiais na rua x Número de crimes

- etc...

Essa análise permite estabelecer relações entre variáveis, ou seja, determinar se as diferenças entre a distribuição de duas variáveis são estatisticamente significativas, com o objetivo de pesquisar causalidades ou correlações.

O que significa correlação

Em probabilidade e estatística, correlação, dependência ou associação é qualquer relação estatística (causal ou não causal) entre duas variáveis e correlação é qualquer relação dentro de uma ampla classe de relações estatísticas que envolva dependência entre duas variáveis.

A palavra correlação pode ser substituída por sinônimos como: relação, equiparação, nexo, correspondência, analogia e conexão.

Uma correlação positiva significa que os dois itens estudados aumentam ou diminuem juntos. Uma correlação negativa significa que quando um item aumenta, o outro diminui.

Exemplos

> Existe uma correlação positiva entre abrir o guarda chuva e começar a chover;

> Existe uma correlação negativa entre escolaridade e desemprego;

O que significa Causalidade

“Causalidade é a relação entre um evento A (a causa) e um segundo evento B (o efeito), provido que o segundo evento seja uma consequência do primeiro”

- Seu professor Leon

Em termos diretos, A é causa de B quando A é requisito necessário, mas não necessariamente um requisito suficiente, para ocorrência de B. Caracterizar uma relação causal, distinguindo-a de uma simples correlação, deve-se estabelecer não apenas a correlação significativa entre os eventos em questão mas também os mecanismos físicos de ação que levam A a determinar B, ou melhor, a ausência de A a inibir B.

O estudo causal passa a ser um estudo mais qualitativo, tentamos buscar de onde um evento B surgiu. Este estudo já é antigo e remete a Aristóteles, mas ganhou muita força no determinismo: é a teoria filosófica de que todo acontecimento (inclusive o mental) é explicado pela determinação, ou seja, por relações de causalidade.

Assim, estudos modernos procuram a causalidade entre diversos elementos: o que causa um caso de dengue?

- Temperatura atual

- Chuvas passadas

- Casos passados

- Tipo de vegetação

- etc...

Se pararmos para analisar, MUITAS coisas influenciam e CAUSAM os casos de dengue no RJ. Logo, nosso modelo só precisa incluir os maiores e mais comuns efeitos. Um processo reducionista dos dados.

Se omitirmos um grande número de efeitos pequenos e independentes, podemos tratá-los como "ruídos". Paramos de falar sobre as coisas como sendo completamente determinadas pelas causas cogitadas. Ao invés disso, falamos da causa como amplificadora das chances de seus efeitos. Você vai de intuições como “a maior temperatura causa casos de dengue” para intuições como “a maior temperatura aumenta a chance de ocorrer casos de dengue”.

Assim, resolve-se o bando de perguntas “e se” originadas das improváveis exceções que não tínhamos considerado. São todas situações incorporadas como ruído.

Ad

A verdade é que a causalidade dificilmente poderá ser determinada com certeza absoluta. Daí que em ciência já está subentendido que não existem verdades absolutas e que todas as teorias estão abertas a revisão face a novas evidências.

Por que correlação não é causalidade

> A correlação, isto é, a ligação entre dois eventos, não implica necessariamente uma relação de causalidade, ou seja, que um dos eventos tenha causado a ocorrência do outro. A correlação pode no entanto indicar possíveis causas ou áreas para um estudo mais aprofundado, ou por outras palavras, a correlação pode ser uma pista.

Só porque (A) acontece juntamente com (B) não significa que (A) causa (B). Determinar se existe de facto uma relação de causalidade requer investigação adicional pois podem acontecer cinco situações:

- causa realmente (B);

- (A): chuva; (B): abrir guarda chuva;

- pode ser a causa de (A);

- (A): abrir guarda chuva; (B): chuva;

- Um terceiro factor (C) pode ser causa tanto de (A) como de (B);

- (A): abrir guarda chuva; (B): venda de guarda chuva; (C): chuva;

- Pode ser uma combinação das três situações anteriores. Por exemplo, (A) causa (B) e ao mesmo tempo (B) causa também (A);

- (A): chuva; (B): trovão;

- A correlação pode ser apenas uma coincidência, ou seja, os dois eventos não têm qualquer relação para além do facto de ocorrerem ao mesmo tempo. (Se estivermos a falar de um estudo científico, utilizar uma amostra grande ajuda a reduzir a probabilidade de coincidência).

Todos vamos morrer
Todos vamos morrer

Exemplos geral

> “Quanto maiores são os pés de uma criança, maior a capacidade para resolver problemas de matemática. Portanto, ter pés grandes faz ter melhores notas a matemática”. Apesar de existir uma correlação, esta linha de pensamento comete uma falácia ao assumir de imediato que o tamanho dos pés é a causa primária, pois existem outros factores envolvidos que não são tidos em conta. O tamanho dos pés possui uma correlação positiva com muitas outras alterações no desenvolvimento. À medida que as crianças crescem, o mesmo acontece com os pés, assim como a sua capacidade de raciocínio, quantidade de conhecimentos adquiridos e muitas outras características. A idade é a verdadeira causa comum tanto do tamanho dos pés como da capacidade de resolver problemas de matemática.

> “Eu tive uma constipação, por isso comi canja de galinha, duas semanas depois a constipação desapareceu. Portanto, a canja de galinha cura a constipação”.

> “Eu entrei com o pé direito na sala de aula, nesse dia o teste de matemática correu mesmo bem. Portanto, entrar como o pé direito na sala de aula antes dos testes dá sorte”.

> “Um Viking observa um eclipse solar. Acreditando que o Sol está a ser devorado por um lobo gigante, começa a gritar para o afugentar. Momentos depois o Sol regressa à normalidade". Acaba por concluir portanto, que gritar durante um eclipse faz o lobo cuspir o Sol de volta.

Ad

Em todos estes exemplos assume-se, de uma forma muito simplista, que uma acção (A) é o agente causador uma vez que ocorreu antes do efeito (B). Tanto a constipação como o eclipse acabariam por desaparecer independentemente da acção tomada. Já o teste pode ter corrido bem porque o aluno estudou afincadamente a matéria, não estava nervoso ou o teste era relativamente fácil.

Exemplos real

> Vários estudos apontavam inicialmente que as mulheres em menopausa que recebiam terapia de substituição hormonal (TSH) tinham também um menor risco de doença coronária, o que levou à ideia de que a TSH conferia protecção contra a doença coronária. No entanto, estudos controlados e randomizados (mais rigorosos), feitos posteriormente, mostraram que a TSH causava na verdade um pequeno mas significativo aumento do risco de doença coronária. Uma reanálise dos estudos revelou que as mulheres que recebiam a TSH tinham também uma maior probabilidade de pertencer a uma classe socioeconómica superior, com melhor dieta e hábitos de exercício. A utilização da TSH e a baixa incidência de doença coronária não eram causa e efeito, mas o fruto de uma causa comum – os benefícios associados a um estatuto socioeconómico elevado. [4]

> Em 1998 um médico britânico, Andrew Wakefield, publicou um estudo onde revelava uma correlação entre o autismo e a vacina anti-sarampo, parotidite e rubéola (VASPR). Seguiu-se uma onda de pânico que levou muitos pais a deixarem de vacinar os seus filhos e, como resultado, começaram a surgir novamente focos de sarampo um pouco por todo o mundo. O facto de o autismo ser normalmente diagnosticado depois da criança ter tomado a vacina VASPR, levou muitos pais a ficarem convencidos da veracidade da causalidade. Vários outros investigadores tentaram também confirmar a ligação, mas nenhum teve sucesso. O estudo de Wakefield acabou por se revelar nada mais do que uma fraude, tendo sido retraído pela revista onde foi publicado. Wakefield tinha recebido dinheiro para provar a ligação entre o autismo e a VASPR e preparava ainda uma vacina concorrente que apenas conseguiria vender se a confiança na VASPR fosse abalada. Apesar desta descoberta, o estrago já tinha sido feito. Por causa de uma fraude e de paranóias irracionais, muitas vidas foram e continuam a ser colocadas em risco. Wakefield mudou-se para os EUA, onde é suportado por celebridades e visto como um mártir do movimento anti-vacinação.

Correlações óbvias, mas que devemos ter cuidado

Em um dos vídeos do comediante Don McMillan ele aponta para um fato óbvio:

“As chances de ter Alzheimer aos 85 anos é de 10%. Um fumante vive em média 66 anos. Logo, fumar diminui suas chances de ter Alzheimer.”

- Don McMillan

Verdade? Claro que é verdade! Mas será que vale a pena morrer cedo para não ter Alzheimer?

Correlações absurdas [3]

Temos que tomar muito cuidado com correlações. Muitas vezes elas podem nos explicar algo, mas outras vezes podem ser apenas pura coincidências. No site a seguir há alguns exemplos de correlações absurdas encontradas na vida real: http://www.tylervigen.com/spurious-correlations

Ad

[1] https://papodehomem.com.br/se-correlacao-nao-implica-causalidade-entao-o-que-implica

[2] http://comcept.org/cepticismo/correlacao-nao-implica-necessariamente-causalidade/

[3] http://www.tylervigen.com/spurious-correlations

[4] https://academic.oup.com/ije/article/33/3/464/716652