Análisis de Datos
CK-12 and Intel Education

Utilización del Diagrama de Caja y Bigotes para Comprender los Datos

En esta sección, utilizarás el diagrama de caja y bigotes para interpretar y comprender los datos.

¿Alguna vez has pensado en cómo pueden cambiar las ventas? Observa este dilema sobre la venta de televisores.

Los valores de datos en la tabla de abajo muestran el número de televisores vendidos en una tienda por departamentos cada mes por nueve meses. Crea un diagrama de caja y bigotes para demostrar los datos.

Abril Mayo Junio Julio Agosto Septiembre Octubre Noviembre Diciembre
110 98 91 102 89 95 108 118 152

¿Sabes cómo crear esta demostración de datos? Presta atención y esta Sección te enseñará todo lo que necesitas saber.

Orientación

Algunas veces, es útil obtener una idea general de cómo se agrupan los datos.

Los diagramas de caja y bigotes muestran la distribución de los elementos de los datos a lo largo de una línea numérica.

Los datos se dividen en cuatro partes iguales, separadas por puntos llamados cuartiles.

También puedes ver el punto de datos más pequeño, el extremo mínimo y el punto de datos más grande, el extremo máximo.

Un diagrama de caja y bigotes se crea por la determinación de cinco puntos.

Primero, ubicaremos los datos en orden de menor a mayor. Luego, crearemos una línea numérica que demuestre el rango de los datos utilizando intervalos iguales. Utilizaremos la mediana como nuestro punto medio en el diagrama de caja y bigotes y para separar en la mitad los datos. Luego, se calcula la mediana de cada mitad, el cuartil. Esto separara los datos en cuartos , Finalmente, utilizamos los datos más altos y los datos más bajos como nuestras puntas o extremos . Las cajas se dibujan entre los cuartiles y los bigotes en los extremos.

Para construir un diagrama de caja y bigotes, debes calcular numerosas medidas estadísticas. Sin embargo, un diagrama de caja y bigotes que ya se ha construido puede aportar rápidamente las medidas estadísticas al mirar a los cinco puntos.

Los primeros y últimos puntos te dan los e extremos de los datos. El punto medio o tercero te da la mediana . Y el segundo y cuarto punto, entre la mediana y los extremos, te da los cuartiles .

El rango intercuartil es el rango entre el primer cuartil y el tercero. Esto te muestra donde está la mitad media de los datos. Se puede calcular al restar el primer cuartil del tercer cuartil. Finalmente, los valores atípicos , elementos de datos que están muy lejos de la tendencia general , se pueden ubicar en extremos que causan que los bigotes sean excepcionalmente largos. Los datos no siempre presentan valores atípicos. Si hay un punto que está excepcionalmente lejos de los otros puntos, entonces el valor atípico no existe.

Utiliza el diagrama de caja y bigotes dado para identificar a) los extremos, b) la mediana, c) los cuartiles, d) el rango intercuartil y e) los valores atípicos (si existen).

a) Los extremos en este conjunto de datos son aproximadamente 35 y 129.

b) La mediana es de aproximadamente 95.

c) El primer cuartil es de aproximadamente 82 y el tercero de aproximadamente 104.

d) Entonces, el rango intercuartil es de 104 - 82 o 22.

e) Finalmente, el mínimo extremo, 35, aparece como un valor atípico ya que el bigote izquierdo es muy largo comparado a los demás.

Como sabes, los valores atípicos son puntos que son inusualmente grandes o pequeños comparados con el resto de los datos. Cuando discutimos las medidas de tendencia central como la media, la mediana, la moda, también debemos recordar que en el mundo cotidiano y no hay más excepciones. Algunas veces cuando consideramos los datos, quizás tenemos que elegir eliminar los valores atípicos para concluir, basados en los datos, de mejor manera. Observa cómo eliminar un valor atípico puede afectar la interpretación de los datos.

Shanda corre en el equipo de atletismo de su colegio. Recientemente corrieron una carrera de 100 metros en una competencia de atletismo y registraron tiempos oficiales. Estos son los resultados en segundos: 11.7, 10.8, 11.1, 10.9, 11.7, 11.6, 12.0, 19.6, 12.2, 11.6, 11.5, 11.6, 11.0, 12.0, 11.6, 11.5, 11.7, 11.3, 12.3, 10.1.

El tiempo de Shanda fue 11,1 y ella quiere saber cómo compararlo con el resto del equipo. Ella utilizará un diagrama de caja y bigotes para ayudarse a resolver esto. Estos son los pasos del proceso.

Paso 1: Ella ubica los datos en orden.

10.1, 10.8, 10.9, 11.0, 11.1, 11.3, 11.5, 11.5, 11.6, 11.6, 11.6, 11.6, 11.7, 11.7, 11.7, 12.0, 12.0, 12.2, 12.3, 19.6

Paso 2: Dibuja un número que incluye los extremos.

Paso 3: Encuentra la mediana, 11,6, y pone un punto en la línea numérica.

Paso 4: Ella encuentra el primer y tercer cuartil, 11,2 y 11,85.

Paso 5: Ella dibuja cajas entre los cuartiles y la mediana.

Paso 6: Ella ubica los extremos, 10,1 y 19,6, en números con puntos.

Paso 7: Dibuja los bigotes desde los cuartiles a los extremos.

Cuando Shanda analiza el diagrama de caja y bigotes, se da cuenta que su tiempo, 11,1 segundos, es apenas más bajo que el primer cuartil. Sabe que su amiga, Teresa, es muy rápida. A ella ya le han ofrecido becas de atletismo de grandes universidades. Shanda cree, muy realista, que nunca podrá alcanzar a Teresa. Otra compañera del equipo, Lisa, se cayó durante la carrera, pero se levantó y continuó hasta la línea final. Shanda cree que ni las marcas de Teresa ni las de Lisa son útiles para medir su velocidad. Ella decide mirar los mismos datos pero eliminar esos valores atípicos.

Aquí están los nuevos datos.

10.8, 10.9, 11.0, 11.1, 11.3, 11.5, 11.5, 11.6, 11.6, 11.6, 11.6, 11.7, 11.7, 11.7, 12.0, 12.0, 12.2, 12.3

Ella calcula otra vez sus medidas estadísticas y crea un nuevo diagrama de caja y bigotes.

Extremos: 10,8 y 12,3.

Mediana: 11,6

Primer y tercer cuartil: 11,3 y 11,7.

Cuando se eliminar los dos valores atípicos, Shanda puede ver que la mayoría de los datos se agrupan muy cercanamente. Su tiempo, 11,1, aún está en el primer cuartil. Sin embargo, su competición está apretada porque el resto del equipo no está muy atrás. Está orgullosa de su tiempo y motivada para seguir adelante con el equipo.

Responde cada pregunta sobre el diagrama de caja y bigotes.

Ejemplo A

¿Cómo se llama a un valor cuando se encuentra muy lejos de la mediana?

Solución: Un valor atípico.

Ejemplo B

¿Cambiará la media o la mediana si se elimina un valor atípico?

Solución: Ambos cambiarían. El valor de la media será diferentes, y la media se verá afectada porque el valor atípico no será calculado como parte del promedio.

Ejemplo C

¿Un diagrama de caja y bigotes siempre tiene cuartiles?

Solución: Sí. Se organiza alrededor de los cuartiles y la mediana.

Ahora, miremos otra vez el dilema que estaba al principio de esta Sección.

Paso 1: para determinar la mediana del conjunto de datos, dispone los datos en orden de menor a mayor. Identifica los valores de datos en el medio del conjunto de datos. Para este conjunto de datos, la mediana es 102.

89, 91, 95, 98, 102, 108, 110, 118, 152

Paso 2: Identifica la mediana para el cuartil inferior. Otra vez, ya que dos valores de datos comparten la posición media, encuentra la media. La mediana para el cuartil inferior es 93.

& \underline{89, \ 91, \ 95, \ 98}, \ 102, \ 108, \ 110, \ 118, \ 152\\\& \qquad \qquad \qquad \quad \ 91 + 95 = 186\\\& \qquad \qquad \qquad \quad \ 186 \div 2 = 93

Paso 3: Identifica la mediana para el cuartil superior. Recuerda encontrar la media de los dos valores de datos que comparten la posición media. La mediana del cuartil superior es 114.

& 89, \ 91, \ 95, \ 98, \ 102, \ \underline{108, \ 110, \ 118, \ 152}\\\& \qquad \qquad \qquad \quad \ 110 + 118 = 228\\\& \qquad \qquad \qquad \quad \quad \ 228 \div 2 = 114

Paso 4: Dibuja un línea numérica. El primer valor en la línea numérica debe estar cerca del número más pequeño en el conjunto de datos. En este caso, el número más pequeño es 89. Por lo tanto, la línea numérica comenzará en 80. El último valor en la línea numérica debe estar cerca del número más grande en el conjunto de datos. El número más grande en el conjunto de datos es 152. Por lo tanto, la línea numérica terminará en 160. En este caso, etiqueta la línea numérica con decenas.

El valor más pequeño, 89, se marca con una "I" al final del bigote en el cuartil inferior. El valor más pequeño, 151, se marca con una "I" al final del bigote en el cuartil superior.

La mediana del primer, segundo y tercer cuartil se marca con una "+".

Vocabulario

Diagrama de Caja y Bigotes
Demostración visual de los datos en una línea numérica.
Cuartiles
Cuando los datos se dividen en cuatro secciones iguales.
Mediana:
El valor medio en un conjunto de datos.
Extremos
Los primeros y últimos puntos en un conjunto de datos.
Rango Intercuartil
El rango entre el primer y el tercer cuartil.
Valor Atípico
Valores de datos que están muy lejos de la tendencia general de los datos.

Práctica Guiada

Aquí hay un ejercicio para que trates tú mismo.

La municipalidad realizó su carrera anual de 5 kilómetros. Estos son los tiempos de los finalistas: 12 minutes, 12 minutos, 14 minutos, 15 minutos, 16 minutos, 17 minutos, 18 minutos, 19 minutos, 21 minutos, 23 minutos y 26 minutos.

Crea un diagrama de caja y bigotes para mostrar los datos.

Solución

Primero, analicemos los datos.

17 es el tiempo mediano.

12 - 16 es el cuartil inferior, siendo 14 la mediana de ese cuartil.

18 - 26 es el cuartil superior, siendo 21 la mediana de ese cuartil.

Aquí está nuestro diagrama de caja y bigotes.

Revisión en Video

Haz clic en la imagen de arriba para ver más contenido. (requiere conexión a internet)

Reading Box-and-Whisker Plots

*este video solo está disponible en inglés.

Práctica

Instrucciones: Define los siguientes términos.

  1. diagrama de caja y bigotes
  2. cuartiles
  3. Mediana:
  4. Extremos
  5. Rango Intercuartil
  6. Valor Atípico

Instrucciones: Utiliza el diagrama de caja y bigotes para responder las siguientes preguntas.

  1. ¿Cuál es el valor de la mediana?
  2. Identifica los cuartiles
  3. Identifica el rango intercuartil
  4. Identifica cualquier extremo
  5. Identifica cualquier valor atípico.

Instrucciones: Utiliza los datos para responder cada pregunta.

26, 27, 29, 30, 32, 35, 41, 42, 44

  1. ¿Cuál es el valor de la mediana?
  2. Identifica la mediana para el cuartil inferior.
  3. Identifica la mediana para el cuartil superior.
  4. Identifica el extremo inferior.
  5. Identifica el extremo superior.

Licencia

Licencia epub de ck12

Para acceder a una versión personalizada de este libro, así como otros contenidos interactivos, visite www.ck12.org

 

Fundación CK- 12  es una organización sin fines de lucro con la misión de reducir el costo de los materiales de libros de texto para el mercado K- 12, tanto en los EE.UU. así como en todo el mundo. Mediante el uso de contenido libre y un modelo colaborativo basado en la web denominado FlexBook®. CK-12 tiene la intención de ser pioneros en la generación y distribución de contenidos educativos de alta calidad que van a servir como texto base y además proporcionar un entorno para el aprendizaje adaptativo, impulsado a través  de FlexBook Platform®.

Copyright © 2012 CK-12 Foundation, www.ck12.org

Los nombres "CK-12" y "CK12", los logotipos asociados y los términos"FlexBook®" and "FlexBook Platform®" (en adelante "Marcas CK- 12") son marcas comerciales y marcas de servicio de la Fundación    CK- 12 y están protegidos por leyes federales, estatales e internacionales.

Cualquier forma de reproducción de este libro en cualquier formato o medio, en todo o secciones, debe incluir el enlace de atribución de referencia http://www.ck12.org/saythanks (colocado en un lugar visible), además de los siguientes términos.

Con excepción de lo señalado, todo el contenido CK- 12 (incluyendo material de Curriculum CK- 12) se ha puesto a disposición de los usuarios de acuerdo con la licencia Creative Commons Attribution-Non-Commercial 3.0 Unported (CC BY-NC 3.0) License (http://creativecommons.org/licenses/by-nc/3.0/), en su versión modificada y actualizada ("CC License"), que se incorpora al presente por medio de ésta referencia.

Las condiciones completas en su versión en Ingles se pueden encontrar en http://www.ck12.org/terms.

by-nc-na

×