Utilización del Diagrama de Caja y Bigotes para Comprender los Datos
En esta sección, utilizarás el diagrama de caja y bigotes para interpretar y comprender los datos.
¿Alguna vez has pensado en cómo pueden cambiar las ventas? Observa este dilema sobre la venta de televisores.
Los valores de datos en la tabla de abajo muestran el número de televisores vendidos en una tienda por departamentos cada mes por nueve meses. Crea un diagrama de caja y bigotes para demostrar los datos.
| Abril | Mayo | Junio | Julio | Agosto | Septiembre | Octubre | Noviembre | Diciembre |
|---|---|---|---|---|---|---|---|---|
| 110 | 98 | 91 | 102 | 89 | 95 | 108 | 118 | 152 |
¿Sabes cómo crear esta demostración de datos? Presta atención y esta Sección te enseñará todo lo que necesitas saber.
Orientación
Algunas veces, es útil obtener una idea general de cómo se agrupan los datos.
Los diagramas de caja y bigotes muestran la distribución de los elementos de los datos a lo largo de una línea numérica.
Los datos se dividen en cuatro partes iguales, separadas por puntos llamados cuartiles.
También puedes ver el punto de datos más pequeño, el extremo mínimo y el punto de datos más grande, el extremo máximo.
Un diagrama de caja y bigotes se crea por la determinación de cinco puntos.
Primero, ubicaremos los datos en orden de menor a mayor. Luego, crearemos una línea numérica que demuestre el rango de los datos utilizando intervalos iguales. Utilizaremos la mediana como nuestro punto medio en el diagrama de caja y bigotes y para separar en la mitad los datos. Luego, se calcula la mediana de cada mitad, el cuartil. Esto separara los datos en cuartos , Finalmente, utilizamos los datos más altos y los datos más bajos como nuestras puntas o extremos . Las cajas se dibujan entre los cuartiles y los bigotes en los extremos.
Para construir un diagrama de caja y bigotes, debes calcular numerosas medidas estadísticas. Sin embargo, un diagrama de caja y bigotes que ya se ha construido puede aportar rápidamente las medidas estadísticas al mirar a los cinco puntos.
Los primeros y últimos puntos te dan los e extremos de los datos. El punto medio o tercero te da la mediana . Y el segundo y cuarto punto, entre la mediana y los extremos, te da los cuartiles .
El rango intercuartil es el rango entre el primer cuartil y el tercero. Esto te muestra donde está la mitad media de los datos. Se puede calcular al restar el primer cuartil del tercer cuartil. Finalmente, los valores atípicos , elementos de datos que están muy lejos de la tendencia general , se pueden ubicar en extremos que causan que los bigotes sean excepcionalmente largos. Los datos no siempre presentan valores atípicos. Si hay un punto que está excepcionalmente lejos de los otros puntos, entonces el valor atípico no existe.
Utiliza el diagrama de caja y bigotes dado para identificar a) los extremos, b) la mediana, c) los cuartiles, d) el rango intercuartil y e) los valores atípicos (si existen).
a) Los extremos en este conjunto de datos son aproximadamente 35 y 129.
b) La mediana es de aproximadamente 95.
c) El primer cuartil es de aproximadamente 82 y el tercero de aproximadamente 104.
d) Entonces, el rango intercuartil es de 104 - 82 o 22.
e) Finalmente, el mínimo extremo, 35, aparece como un valor atípico ya que el bigote izquierdo es muy largo comparado a los demás.
Como sabes, los valores atípicos son puntos que son inusualmente grandes o pequeños comparados con el resto de los datos. Cuando discutimos las medidas de tendencia central como la media, la mediana, la moda, también debemos recordar que en el mundo cotidiano y no hay más excepciones. Algunas veces cuando consideramos los datos, quizás tenemos que elegir eliminar los valores atípicos para concluir, basados en los datos, de mejor manera. Observa cómo eliminar un valor atípico puede afectar la interpretación de los datos.
Shanda corre en el equipo de atletismo de su colegio. Recientemente corrieron una carrera de 100 metros en una competencia de atletismo y registraron tiempos oficiales. Estos son los resultados en segundos: 11.7, 10.8, 11.1, 10.9, 11.7, 11.6, 12.0, 19.6, 12.2, 11.6, 11.5, 11.6, 11.0, 12.0, 11.6, 11.5, 11.7, 11.3, 12.3, 10.1.
El tiempo de Shanda fue 11,1 y ella quiere saber cómo compararlo con el resto del equipo. Ella utilizará un diagrama de caja y bigotes para ayudarse a resolver esto. Estos son los pasos del proceso.
Paso 1: Ella ubica los datos en orden.
10.1, 10.8, 10.9, 11.0, 11.1, 11.3, 11.5, 11.5, 11.6, 11.6, 11.6, 11.6, 11.7, 11.7, 11.7, 12.0, 12.0, 12.2, 12.3, 19.6
Paso 2: Dibuja un número que incluye los extremos.
Paso 3: Encuentra la mediana, 11,6, y pone un punto en la línea numérica.
Paso 4: Ella encuentra el primer y tercer cuartil, 11,2 y 11,85.
Paso 5: Ella dibuja cajas entre los cuartiles y la mediana.
Paso 6: Ella ubica los extremos, 10,1 y 19,6, en números con puntos.
Paso 7: Dibuja los bigotes desde los cuartiles a los extremos.
Cuando Shanda analiza el diagrama de caja y bigotes, se da cuenta que su tiempo, 11,1 segundos, es apenas más bajo que el primer cuartil. Sabe que su amiga, Teresa, es muy rápida. A ella ya le han ofrecido becas de atletismo de grandes universidades. Shanda cree, muy realista, que nunca podrá alcanzar a Teresa. Otra compañera del equipo, Lisa, se cayó durante la carrera, pero se levantó y continuó hasta la línea final. Shanda cree que ni las marcas de Teresa ni las de Lisa son útiles para medir su velocidad. Ella decide mirar los mismos datos pero eliminar esos valores atípicos.
Aquí están los nuevos datos.
10.8, 10.9, 11.0, 11.1, 11.3, 11.5, 11.5, 11.6, 11.6, 11.6, 11.6, 11.7, 11.7, 11.7, 12.0, 12.0, 12.2, 12.3
Ella calcula otra vez sus medidas estadísticas y crea un nuevo diagrama de caja y bigotes.
Extremos: 10,8 y 12,3.
Mediana: 11,6
Primer y tercer cuartil: 11,3 y 11,7.
Cuando se eliminar los dos valores atípicos, Shanda puede ver que la mayoría de los datos se agrupan muy cercanamente. Su tiempo, 11,1, aún está en el primer cuartil. Sin embargo, su competición está apretada porque el resto del equipo no está muy atrás. Está orgullosa de su tiempo y motivada para seguir adelante con el equipo.
Responde cada pregunta sobre el diagrama de caja y bigotes.
Ejemplo A
¿Cómo se llama a un valor cuando se encuentra muy lejos de la mediana?
Solución: Un valor atípico.
Ejemplo B
¿Cambiará la media o la mediana si se elimina un valor atípico?
Solución: Ambos cambiarían. El valor de la media será diferentes, y la media se verá afectada porque el valor atípico no será calculado como parte del promedio.
Ejemplo C
¿Un diagrama de caja y bigotes siempre tiene cuartiles?
Solución: Sí. Se organiza alrededor de los cuartiles y la mediana.
Ahora, miremos otra vez el dilema que estaba al principio de esta Sección.
Paso 1: para determinar la mediana del conjunto de datos, dispone los datos en orden de menor a mayor. Identifica los valores de datos en el medio del conjunto de datos. Para este conjunto de datos, la mediana es 102.
89, 91, 95, 98, 102, 108, 110, 118, 152
Paso 2: Identifica la mediana para el cuartil inferior. Otra vez, ya que dos valores de datos comparten la posición media, encuentra la media. La mediana para el cuartil inferior es 93.
Paso 3: Identifica la mediana para el cuartil superior. Recuerda encontrar la media de los dos valores de datos que comparten la posición media. La mediana del cuartil superior es 114.
Paso 4: Dibuja un línea numérica. El primer valor en la línea numérica debe estar cerca del número más pequeño en el conjunto de datos. En este caso, el número más pequeño es 89. Por lo tanto, la línea numérica comenzará en 80. El último valor en la línea numérica debe estar cerca del número más grande en el conjunto de datos. El número más grande en el conjunto de datos es 152. Por lo tanto, la línea numérica terminará en 160. En este caso, etiqueta la línea numérica con decenas.
El valor más pequeño, 89, se marca con una "I" al final del bigote en el cuartil inferior. El valor más pequeño, 151, se marca con una "I" al final del bigote en el cuartil superior.
La mediana del primer, segundo y tercer cuartil se marca con una "+".
Vocabulario
- Diagrama de Caja y Bigotes
- Demostración visual de los datos en una línea numérica.
- Cuartiles
- Cuando los datos se dividen en cuatro secciones iguales.
- Mediana:
- El valor medio en un conjunto de datos.
- Extremos
- Los primeros y últimos puntos en un conjunto de datos.
- Rango Intercuartil
- El rango entre el primer y el tercer cuartil.
- Valor Atípico
- Valores de datos que están muy lejos de la tendencia general de los datos.
Práctica Guiada
Aquí hay un ejercicio para que trates tú mismo.
La municipalidad realizó su carrera anual de 5 kilómetros. Estos son los tiempos de los finalistas: 12 minutes, 12 minutos, 14 minutos, 15 minutos, 16 minutos, 17 minutos, 18 minutos, 19 minutos, 21 minutos, 23 minutos y 26 minutos.
Crea un diagrama de caja y bigotes para mostrar los datos.
Solución
Primero, analicemos los datos.
17 es el tiempo mediano.
12 - 16 es el cuartil inferior, siendo 14 la mediana de ese cuartil.
18 - 26 es el cuartil superior, siendo 21 la mediana de ese cuartil.
Aquí está nuestro diagrama de caja y bigotes.
Revisión en Video
Haz clic en la imagen de arriba para ver más contenido. (requiere conexión a internet)
*este video solo está disponible en inglés.Práctica
Instrucciones: Define los siguientes términos.
- diagrama de caja y bigotes
- cuartiles
- Mediana:
- Extremos
- Rango Intercuartil
- Valor Atípico
Instrucciones: Utiliza el diagrama de caja y bigotes para responder las siguientes preguntas.
- ¿Cuál es el valor de la mediana?
- Identifica los cuartiles
- Identifica el rango intercuartil
- Identifica cualquier extremo
- Identifica cualquier valor atípico.
Instrucciones: Utiliza los datos para responder cada pregunta.
26, 27, 29, 30, 32, 35, 41, 42, 44
- ¿Cuál es el valor de la mediana?
- Identifica la mediana para el cuartil inferior.
- Identifica la mediana para el cuartil superior.
- Identifica el extremo inferior.
- Identifica el extremo superior.