22
La Media aritmética se calcula utilizando la frecuencia f , ya que este número indica las
i
veces que se repite el valor X , como lo indica la siguiente expresión
i
.
.
œ
!
i
l
i i
œ"
f X
N
Varianza
Entre las medidas de dispersión, la
se obtiene igualmente que la media,
ponderando los desvíos de los datos por la frecuencia f . Su expresión es
i
y su fórmula práctica de cálculo es
La desviación
5
5
.
2
2
2
f X
N
œ
œ
!
i=1
l
i
i
2
f X
N
Ð Ñ
.
.
!
i=1
l
i i
2
típica es por definición la raíz positiva de la varianza y el
la razón porcentual entre la
GZ
desviación típica y la media.
Ejemplo 4.5
Con los datos del cuadro 4.3, se obtiene que la Moda es 0, que la Mediana es 1 y que
.
= (
lesiones/hoja.
!‡"#) "‡"!! #‡&# ÞÞÞÞÞ &‡'!ÑÎ%!! œ "ß )"
Observe que este promedio no es un valor entero, pero igual tiene interpretación y es una
forma útil para comparar situaciones. Hay que comprender que el promedio es un valor
referencial, de mucha utilidad, pero no necesariamente debe coincidir con algún valor
observado. Es posible leer que un futbolista M es más goleador que otro P, porque M tiene un
promedio de goles por partido de 1,6, mientras que el promedio de goles de P es de 1,2.
Para los mismos datos la varianza se calcula = (
, lo
5
#
#
#
#
! ‡"#) ÞÞÞÞ & ‡'!ÑÎ%!! Ð"ß )"Ñ
que da
, por lo tanto = 3,2939 = 1,8149 y
100,3%.
$ß #*$*
GZ œ
5
È
Descripción de variables continuas para datos agrupados.
Si la variable es
los datos se clasifican en clases que son intervalos,
continua
denominándose
.
tabla de frecuencias de intervalos
La frecuencia representa ahora el
y el resto
f
número de datos comprendido en el intervalo
i
de la tabla se confecciona en la misma forma que en la tabulación de variables discretas, pero
incluyendo, además, una columna con el valor marca de clase X . La tabla adquiere la
i
estructura que se muestra a continuación.
Intervalo
X f h (%) F H (%)
i
i
i
i
i
L X L X f
h
F H
L X L X f
h
F H
L X L X f
h
F H
................
... ... .....
.... ....
L X L
0
2
i-1
Ÿ
Ÿ
Ÿ
Ÿ
"
" "
"
"
"
"
#
# #
#
#
#
$
$ $
$
$
$
i
i
i
i
i
i
k -1
k
k k
k
X f
h
F H
................
... ... .....
.... .....
L X L X f
h
N 100,0
Ÿ Ÿ
Total
N 100,0
donde:
e : son los límites inferior y superior respectivamente del intervalo i-ésimo;
L L
i-1
i
X =
i
L + L
2
i-1 i
, recibe el nombre de valor clase del intervalo "i" , cuyo supuesto es que representa
al promedio de los datos incluidos en el intervalo, lo que no necesariamente ocurre así y
c = L - L
i
i
i-1
, recibe el nombre de
del intervalo "i", amplitud que puede ser distinta
amplitud
para cada intervalo. Por lo general, intervalos de igual amplitud facilita los cálculos.
Los gráficos utilizados en variables continuas son
y
Histogramas Polígonos de
frecuencias
La tabla corresponde a la distribución de la producción de 500 manzanos enanos