jueves, 21 de junio de 2012

XIII. ASOCIACIÓN ENTRE VARIABLES ORDINALES, MÉTODO DE CORRELACIÓN DE SPEARMAN

 ASOCIACIÓN ENTRE VARIABLES ORDINALES, MÉTODO DE CORRELACIÓN DE SPEARMAN

Una variable ordinal es definida simplemente como un conjunto de categorías mutuamente excluyentes que están ordenadas en términos de la característica de interés. Aunque son posibles varios refinamientos a la medición ordinal, tales como asignar rangos a distancias entre varias categorías así como a las propias categorías, tales complicaciones no se considerarán aquí. Ocasionalmente, será útil asignar nombres numéricos a las categorías de una variable ordinal tales como (1) alto, (2) medio, (3) bajo.
Las variables ordinales son importantes por una serie de razones. Primero, al menos en algunas situaciones ciertos conceptos sólo pueden ser medidos en el nivel ordinal (o, al menos, fácil y económicamente). Segundo, en algunas situaciones sólo importa el ordenamiento de las observaciones de una variable cuantitativa; valores numéricos específicos no tienen importancia.

En estadística, el coeficiente de correlación de Spearman, ρ (ro) es una medida de la correlación (la asociación o interdependencia) entre dos variables aleatorias continuas. Para calcular ρ, los datos son ordenados y reemplazados por su respectivo orden.

El estadístico ρ viene dado por la expresión:
 \rho = 1- {\frac {6 \sum D^2}{N(N^2 - 1)}}

donde D es la diferencia entre los correspondientes estadísticos de orden de x - yN es el número de parejas.
Se tiene que considerar la existencia de datos idénticos a la hora de ordenarlos, aunque si éstos son pocos, se puede ignorar tal circunstancia
Para muestras mayores de 20 observaciones, podemos utilizar la siguiente aproximación a la distribución t de Student





La interpretación de coeficiente de Spearman es igual que la del coeficiente de correlación de Pearson. Oscila entre -1 y +1, indicándonos asociaciones negativas o positivas respectivamente, 0 cero, significa no correlación pero no independencia. La tau de Kendall es un coeficiente de correlación por rangos, inversiones entre dos ordenaciones de una distribución normal bivariante.

No hay comentarios:

Publicar un comentario