O que é associação/correlação entre as variáveis?
Em um estudo muitas vezes o objetivo está em descobrir se existe alguma relação entre duas variáveis. Por exemplo, será que existe associação entre o peso e a hipertensão? Ou ainda, entre a penhora e o acordo?
Para termos uma resposta nos baseamos em alguns métodos estatísticos, que chamamos de medida de correlação ou teste de correlação, quando avaliamos a relação entre duas apenas variáveis quantitativas ou medida de associação ou teste de associação quando as variáveis são categóricas.
Lembrando que medida de relação não é sinônimo de causa. Para ficar mais claro, pode-se calcular a associação entre câncer de pulmão e tomar café e o resultado será uma alta relação, mas isto não significa que tomar café causa câncer ou vice-versa, apenas a medida diz que há associação, nada além disso. Neste caso a variável tomar café sim/não é uma variável confusão. Mas isto pode ser assunto para outro tópico.
Método de correlação
O método de correlação mais utilizado é o coeficiente de Pearson:
Sejam x1, x2, … , xn valores quantitativos de uma variável X.
Sejam y1, y2, … , yn valores quantitativos de uma variável Y.
O coeficiente de Pearson é dado por:
Ele quantifica a força de correlação linear entre duas variáveis, e portanto descreve quão bem uma linha reta se ajustaria através de nuvem de pontos. Podemos ver essa relação pelo gráfico de dispersão.
Métodos de associação
A tabela de contingência é a tabela que calcula observações por múltiplas variáveis categóricas. As linhas e colunas das tabelas correspondem a essas variáveis categóricas.
As tabelas de contingência também podem revelar associação entre as duas variáveis. Usa-se um teste qui-quadrado ou teste exato de Fisher para determinar se as contagens observadas diferem significativamente das contagens esperadas sob a hipótese nula de não associação.