Medidas de Relação

O que é associação/correlação entre as variáveis?

Em um estudo muitas vezes o objetivo está em descobrir se existe alguma relação entre duas variáveis. Por exemplo, será que existe associação entre o peso e a hipertensão? Ou ainda, entre a penhora e o acordo?
Para termos uma resposta nos baseamos em alguns métodos estatísticos, que chamamos de medida de correlação ou teste de correlação, quando avaliamos a relação entre duas apenas variáveis quantitativas ou medida de associação ou teste de associação quando as variáveis são categóricas.
Lembrando que medida de relação não é sinônimo de causa. Para ficar mais claro, pode-se calcular a associação entre câncer de pulmão e tomar café e o resultado será uma alta relação, mas isto não significa que tomar café causa câncer ou vice-versa, apenas a medida diz que há associação, nada além disso. Neste caso a variável tomar café sim/não é uma variável confusão. Mas isto pode ser assunto para outro tópico.

Método de correlação

O método de correlação mais utilizado é o coeficiente de Pearson:

Sejam x1, x2, … , xn valores quantitativos de uma variável X.

Sejam y1, y2, … , yn valores quantitativos de uma variável Y.

O coeficiente de Pearson é dado por:

image

Ele quantifica a força de correlação linear entre duas variáveis, e portanto descreve quão bem uma linha reta se ajustaria através de nuvem de pontos. Podemos ver essa relação pelo gráfico de dispersão.

image

Métodos de associação

A tabela de contingência é a tabela que calcula observações por múltiplas variáveis categóricas. As linhas e colunas das tabelas correspondem a essas variáveis categóricas.

image

As tabelas de contingência também podem revelar associação entre as duas variáveis. Usa-se um teste qui-quadrado ou teste exato de Fisher para determinar se as contagens observadas diferem significativamente das contagens esperadas sob a hipótese nula de não associação.

1 Curtida