Informacion del Dia

Organizar datos en intervalos de clase

4. ORGANIZAR DATOS EN INTERVALOS DE CLASE.
Considere que tiene los siguientes datos, ordenados, obtenidos de una muestra al azar sobre la estatura en centímetros, de niños en una escuela:
107 111 111 112 112 113 113 113 114 114 115 115 116 116 116 117 117 117 117 118 118 118 118 119 119 119 119 120 120 120 120 121 121 121 121 121 122 122 122 122 123 123 123 123 124 124 124 124 125 125 125 126 126 126 127 127 128 128 129 129 130 130 133 135
Otra forma de organizar los datos.
Tabla 1
Estatura
(Y)
Numero de muestras (f)
Acumulado
(N)
107
1
1
111
2
3
112
2
5
113
3
8
114
2
10
115
2
12
116
3
15
117
4
19
118
4
23
119
4
27
120
4
31
121
5
36
122
4
40
123
4
44
124
4
48
125
3
51
126
3
54
127
2
56
128
2
58
129
2
60
130
2
62
133
1
63
135
1
64
  1. Rango: Es la diferencia entre el valor mayor de los datos y el menor.
Rango = 135 - 107 = 28
  1. Intervalo de clase (K), se puede proceder teniengo en cuenta algunas reglas.
Se establecen de 5 a 15 o 5 a 20 clases (esto depende de la cantidad de datos). Tenga en cuenta que entre menos clases se definan se pierde detalle o si se establecen muchas se puede hacer dificil extraer informacion util.
Por lo general siempre se definin clases de igual amplitud, los intervalos desiguales tienden a distorsionar las comparaciones. Se forman siempre clases que no se superpongan para eliminar toda posible ambigüedad en cuanto a que clase pertenece una observacion. Los intervalos de clase se eligen tambien de forma que las marcas de clase o puntos medios coincidan con datos realmente observados. Esto tiende a aminorar el llamado error de agrupamiento.
Otra forma de encontrar el intervalo de clase ( K ), es haciendo uso de fórmula de sturges.
K = 1 + 3.3 x log N N = Número de datos N=64
K = 1 + 3.3 (log 64) = 6.96
K = 7 (se redondea por defecto o por exceso)
  1. Ancho de clase ( C ). Este se define como : C = Rango/K.
El ancho de clase debe estar en un rango no menor de 5 y no mayor de 15 o 20.
C = 28/7 C= 5 (se ajusta)
Límites extremos inferior y superior de los intervalos
Nuevo rango = (número de intervalos) x (ancho de clase)
Nuevo rango = 7 x 5 = 35
Ahora se tiene: rango nuevo - rango original : 35 - 28 = 7 (diferencia)
Cuando los datos son enteros, a la diferencia se le resta 1
Diferencia -1 = 6 se resta 1, para justificar en el paso 3.
Este numero 6 se reparte entre el rango inferior (restando) y el superior (sumando), teniendo en cuenta si es par o impar, asi:
Rango inicial: superior = 135 inferior = 107
Diferencia -1 Rango inferior Rango superior
0 107 135
1 106 (resta 1) 135
2 106 (resta 1) 136 (suma 1)
3 105 (resta 2) 136 (suma 1)
4 105 (resta 2) 137 (suma 2)
5 104 (resta 3) 137 (suma 2)
6 104 (resta 3) 138 (suma 3)
y así sucesivamente.
  1. Marca de clase. Es el punto medio del intervalo de clase y se obtiene sumando los limites inferior y superior de la clase y dividiendo por 2.
  2. Limites reales de clase. Se obtienen sumando al limite superior de un intervalo de clase el limite inferior del intervalo de clase contiguo superior y dividiendo por 2.
Ejemplo. De acuerdo al ejemplo citado, encontremos cada uno de estos conceptos.
  1. Rango: 135 – 107 = 28
  2. Intervalo de clase: Si utilizamos (al azar) 5 intervalos de clase, el tamaño de cada uno será: 28/5 = 6 aproximadamente. Si utilizamos 15 intervalos de clase, el tamaño de cada uno será: 28/15 = 2 aproximadamente.
  3. Ancho de clase: Considerando tomar como intervalo de clase 6. entonces el ancho sera: 28/6 = 5 aproximadamente
Tomando 6 intervalos de clase y ancho 5, los datos estarán distribuidos:
Intervalos
Frecuencia
107 - 111
3
112 - 116
12
117 - 121
21
122 - 126
18
127 - 131
8
132 - 136
2
  1. Marca de clase: (107+111)/2 = 109. Si consideramos, por ejemplo, tomar como marca de clase 108, 113, 118, ... los datos se pueden agrupar:
Intervalos
Frecuencia
106 - 110
1
111 - 115
11
116 - 120
19
121 - 125
20
126 - 130
11
131 - 135
2
  1. Límite reales de clase: (105+106)/2 = 105.5 , (110+111)/2 = 110.5, y asi sucesivamente. Los limetes reales de clase estaran dados como:
Intervalo Frecuencia
105.5 – 110.5
110.5 - 115.5
..

Estos rangos no seran lo mas representativos, dado a que no coinciden exactamente con los datos observados.

No hay comentarios:

Publicar un comentario