Tabla de Distribución de Frecuencias para Datos Agrupados

Por lo general una tabla de frecuencias con datos agrupados se realiza cuando la cantidad de datos es grande y/o la variable es continua.

Básicamente consiste en agrupar los datos en intervalos de una misma amplitud, denominados clases. A cada clase se le asignan valores de cada tipo de frecuencias.

Vamos directo al punto con un ejemplo:

Consultamos a 50 personas sobre cuál era su edad y obtuvimos los siguientes resultados:

38 – 15 – 10 – 12 – 62 – 46 – 25 – 56 – 27 – 24 – 23 – 21 – 20 – 25 – 38 – 27 – 48 – 35 – 50 – 65 – 59 – 58 – 47 – 42 – 37 – 35 – 32 – 40 – 28 – 14 – 12 – 24 – 66 – 73 – 72 – 70 – 68 – 65 – 54 – 48 – 34 – 33 – 21 – 19 – 61 – 59 – 47 – 46 – 30 – 30

Paso 1: Identificar el valor máximo y mínimo

 

38 – 15 – 10 – 12 – 62 – 46 – 25 – 56 – 27 – 24 – 23 – 21 – 20 – 25 – 38 – 27 – 48 – 35 – 50 – 65 – 59 – 58 – 47 – 42 – 37 – 35 – 32 – 40 – 28 – 14 – 12 – 24 – 66 – 73 – 72 – 70 – 68 – 65 – 54 – 48 – 34 – 33 – 21 – 19 – 61 – 59 – 47 – 46 – 30 – 30


 

Paso 2: Calcular el Rango

Obtener el rango de edades en que se encuentran los encuestados, sólo basta con determinar la diferencia que hay entre el más joven y el más adulto:

 


Paso 3: Calcular la cantidad de Intervalos

A los intervalos también se les conoce como clases. Simplemente son las «categorías» en las cuales vamos a encasillar a nuestros encuestados.

Hay varias fourmas de calcular cuántos intervalos debemos utilizar. Vamos a analizar un par:

 

 

Para ambas formas de calcular la cantidad de intervalos a utilizar, el valor de n corresponde a la cantidad de datos que tenemos para analizar. En este caso son 50 datos.

Con la primera forma tendríamos que redondear el resultado, ya que los intervalos corresponde a cantidades enteras (no puedes tener un intervalo y medio… o un intervalo y alguito… debes aproximar como NORMALMENTE lo harías).

 

La segunda forma se conoce como Regla de Sturges,  y el resultado obtenido lo debes aproximar por ARRIBA, es decir, al entero siguiente (por ejemplo si te da 5.1 lo debes aproximar a 6 y no a 5). Para nuestro ejemplo:

Por ambas formas obtuvimos que debemos utilizar 7 intervalos.

Paso 4: Calcular la Amplitud de los Intervalos

Ya sabemos el Rango de edad en la que se mueven nuestros encuestados…. y sabemos entre cuántos intervalos hay que REPARTIR las categorías… Así se calcula la amplitud:calcular la amplitud de los intervalos para datos agrupados


Paso 5: Construcción de los intervalos

El primer intervalo viene con límite inferior igual al valor mínimo de los datos, en este caso 10 años. Súmale el valor de la amplitud, es decir, 9 años, y obtendrás el límite superior de 19 años. E Y9so nos daría el primer intervalo:

Ojo! Fíjate bien, se utiliza corchete para el dato que SE INCLUYE… y se utiliza paréntesis para el dato que NO SE INCLUYE. Eso significa que los datos de 10 años se cuentan pero los de 19 NO.

El 19 se cuenta en el siguiente intervalo y allí vendría siendo el límite inferiorSúmale el valor de la amplitud, es decir, 9 años, y obtendrás el límite superior de 28 años. Eso nos daría el segundo intervalo:

 

 

El uso del corchete implica que  vamos a contar acá el 19 pero el paréntesis indica que NO vamos a incluir a los de 28 años. Ese se incluye en el siguiente.

Veamos los 7 intervalos construidos:

Si te fijas bien, el último intervalo debe finalizar en el valor máximo, es decir, 73 años. Lógicamente ese último intervalo debe concluir con corchetes para no dejar por fuera el dato de 73 años.

Paso 6: Cálculo de la Marca de Clase de cada intervalo

 La marca de clase simplemente es el punto medio que hay en cada intervalo.

Lo que debes hacer es sumar límite inferior y superior de cada intervalo y dividir el resultado entre 2. Así:


Paso 7: Determinar la Frecuencia Absoluta de cada intervalo

La frecuencia absoluta sólo consiste en CONTAR la cantidad de datos que caen en cada intervalo. Se representa con la f minúscula y un subíndice (número chiquito abajo) que indica el intervalo en el cual está ubicada la frecuencia absoluta (fi).

 

Veamos cuántos datos caen en el primer intervalo de [10 – 19)


Si te fijas bien, NO estamos contando los datos de 19 años… esos se cuentan en el siguiente intervalo. Para el primer intervalo tenemos 5 datos, esa será su frecuencia absoluta, su CONTEO.

Veamos cuántos datos caen en el tercer intervalo de [28 – 37)

 

Si te fijas bien, NO estamos contando los datos de 37 años… esos se cuentan en el siguiente intervalo. Para el tercer intervalo tenemos 8 datos, esa será su frecuencia absoluta, su CONTEO.

 

Estas son las frecuencias absolutas de los 7 intervalos:

De la tabla construida , podemos observar que La Frecuencia absoluta (fi) , La Frecuencia absoluta acumulada, (Fi) La Frecuencia Relativa (fr)  La frecuencia relativa se puede expresar en decimal o en porcentaje, y que la suma de todas las frecuencias relativas debe dar el 100%.