19
Medidas de dispersión.
Estas tienen por objetivo dar una cuantificación de la heterogeneidad de los datos, es decir,
dar una medida de qué tan parecido o disímiles son los datos de una población entre si.
El
es una manera sencilla de hacerlo midiendo cuán repartidos están los datos y se
Rango
define por
. Para calcular el rango es necesario, por tanto, identificar los
R X X
œ
max
min
valores extremos de los datos. Su desventaja es que al considerar sólo los valores extremos y
no los datos restantes resulta una medida poco eficiente.
La
, , es otra forma de medir la variabilidad de los datos. Su construcción se
Varianza
5
2
realiza sobre la base de los desvíos respecto a la media aritmética y cuya definición es
. Se puede demostrar que
, la que resulta ser una forma
5
5
.
2
2
2
2
N
N
X
œ
œ
!
!
i=1
N
Ð Ñ
X
i
.
i=1
N
i
2
más práctica para su cálculo.La varianza es una medida que se complementa muy bien con la
media aritmética, en especial cuando se asocian a la distribución normal. Sin embargo la
varianza tiene el gran inconveniente que sus unidades de medida están al cuadrado, por lo que
no tiene interpretación en la realidad, por ejemplo sus unidades pueden ser "kg al cuadrado" o
"años al cuadrado". Este inconveniente se subsana con la
Desviación Estándar o Desviación
típica,
, que se define como la raíz cuadrada de la varianza, cuya expresión es
5
5
œ
Ë
!
i=1
N
i
2
X
N
2
.
Las propiedades más importantes de la varianza y la desviación típica se explican a
continuación.
y
, que establece que la varianza y la desviación
P :
" 3
3
]
\
]
\
] œ \ 5 Ê œ
œ
5 5
2
2
5 5
estándar no se altera al sumar una constante a los datos.
P :
k
2
2
2 2
] œ ‡\ Ê œ 5 ‡
œ 5‡
3
3
]
\ ]
\
5
5
y
, que especifica que al multiplicar los datos
5
5
por una constante, la varianza queda amplificada por la constante al cuadrado y la desviación
estándar sólo por la constante.
P :
0
3
2
\ œ 5 Ê œ œ
3
\ \
5
5
ß
es decir, que la variabilidad de una constante es cero.
Ejemplo 4.3
Se mostrarán, numéricamente, las propiedades de la media y la varianza utilizando los
datos de la siguiente tabla.