Probabilidad y Estadísticas
CK-12 and Intel Education

Diagramas de Árbol e Histogramas

Aquí aprenderás varas maneras para mostrar gráficamente un conjunto de datos, incluidos diagramas de árbol e histogramas. Además, aprenderás cómo interpretar tales muestras.

Digamos que quieres matar algo de tiempo mientras esperas tu vuelo de conexión en el aeropuerto. Comienzas a contar el número de personas que pasan frente a ti en un minuto. Haces esto por 15 minutos consecutivos. ¿Cómo podrías exponer gráficamente tu información? Una vez que completes esta sección, podrás hacer diagramas de árbol y también histogramas para presentar una información como ésta.

Mira esto

Haz clic en la imagen de arriba para ver más contenido (requiere conexión a internet)

CK-12 Foundation: Stem-and-Leaf Plots and Histograms

*Este video solo está disponible en inglés

Orientación

Imagina preguntarle a una clase de 20 estudiantes de álgebra cuántos hermanos y hermanas tienen. Probablemente obtendrías un rango de respuestas desde cero en adelante. Algunos estudiantes no tendrán hermanos, pero la mayoría tendrá por lo menos uno. Los resultados podrían verse así:

1, 4, 2, 1, 0, 2, 1, 0, 1, 2, 1, 0, 0, 2, 2, 3, 1, 1, 3, 6

Podemos organizar esta información de muchas maneras. La primera sería crear una lista ordenada, luego re-ordenar todos los números, comenzando por el menor:

0, 0, 0, 0, 1, 1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 2, 3, 3, 4, 6

Otra manera para ordenar los resultados es una tabla:

Número de hermanos Número de estudiantes que los tienen
0 4
1 7
2 5
3 2
4 1
5 0
6 1

También podríamos hacer una representación visual de la información haciendo categorías para el número de hermanos en el eje x- y apilando representaciones de cada estudiante sobre el marcador de categoría. Podríamos usar cruces, dibujos de palos o incluso fotografías de los estudiantes para mostrar cuántos estudiantes hay en cada categoría.

Crear e interpretar diagramas de árbol

Otra manera útil de exponer la información es con un diagrama de árbol . Estos diagramas son especialmente útiles ya que entregan representaciones visuales de cómo está agrupada la información, pero preserva toda la información numérica. Un diagrama de árbol consiste de un “tallo” vertical que contiene el primer dígito de cada número, con el resto de cada número escrito hacia la derecha del tallo como una “hoja”. En el diagrama de árbol que se encuentra a continuación, el primer número representado es el 21. Es el único número con un tallo de 2, por lo tanto esto lo hace el único número entre el grupo de los veintes. Los otros dos números tienen un tallo común de 3. Éstos son 33 y 36. Los próximos números son 40, 46 y 47.

Los diagramas de árbol tienen muchas ventajas en comparación con solo hacer una lista con la información en una línea.

  • Muestran cómo está distribuida la información y si ésta es simétrica alrededor del centro.
  • Se pueden usar al mismo tiempo que se está recolectando la información.
  • Facilitan el proceso para determinar la mediana y la moda.

Los diagramas de árbol no son ideales para todas las situaciones; en particular no son prácticos cuando la información está muy ajustadamente. Por ejemplo, con la información anterior sobre los hermanos de los estudiantes, todos los puntos de datos ocuparían el mismo tallo (cero). En ese caso, no se podría obtener información adicional con un diagrama de árbol.

Ejemplo A

Mientras va en un largo viaje en tren, Rowena recolectó las edades de todos los pasajeros que viajaban en su vagón. Las edades de los pasajeros se encuentran más abajo. Organiza la información en un diagrama de árbol y usa el diagrama para encontrar la mediana y la moda de las edades.

35, 42, 38, 57, 2, 24, 27, 36, 45, 60, 38, 40, 40, 44, 1, 44, 48, 84, 38, 20, 4, 2, 48, 58, 3, 20, 6, 40, 22, 26, 17, 18, 40, 51, 62, 31, 27, 48, 35, 27, 37, 58, 21

Solución

El primer paso es determinar un tallo . prudente. Debido a que todos los valores se encuentran entre 1 y 84, el diagrama debería representar la columna de las décenas y partir desde el 0 al 8 para que los números representados puedan oscilar entre 00 (lo que representaríamos poniendo una hoja de 0 al lado del 0 en el tallo) y 89 (una hoja de 9 al lado del 8 en el tallo). Luego repasamos la información y completamos el diagrama:

Inmediatamente puedes ver que el intervalo con la mayor cantidad de pasajeros es el grupo 40-49. Para determinar correctamente la mediana y la moda, es útil construir un segundo, diagrama de árbol ordenado , colocando las hojas en cada rama en orden ascendiente

La moda es ahora evidente, hay 4 ceros consecutivos en la cuarta rama, por lo tanto la moda es 40. La mediana es el valor en el medio; ya que hay 43 datos, la mediana es el valor 22^{nd} . (Usando nuestra formula anterior, \frac{43+1}{2} = 22 .) Entonces la mediana es 37.

Hacer e interpretar histogramas

Mira de nuevo el ejemplo de los estudiantes de álgebra y sus hermanos. La información se recolectó en la siguiente lista.

1, 4, 2, 1, 0, 2, 1, 0, 1, 2, 1, 0, 0, 2, 2, 3, 1, 1, 3, 6

Pudimos organizar la información en una tabla. Acá está la tabla nuevamente, pero esta vez usaremos la palabra frecuencia como título para indicar el número de veces que cada valor aparece en la lista.

Número de hermanos Frecuencia
0 4
1 7
2 5
3 2
4 1
5 0
6 1

Ahora podemos usar esta tabla como una lista con coordenadas (x, y) para trazar un diagrama lineal como éste:

Si bien este diagrama ciertamente muestra la información, de alguna manera es desorientador. Por ejemplo, la línea continua que conecta el número de estudiantes con uno o dos hermanos hace parecer que sabemos algo sobre cuántos estudiantes tienen 1,5 hermanos (lo que, por supuesto, es imposible). En este caso, donde los datos son todos números enteros, es incorrecto sugerir que la función es continua entre los puntos.

Cuando la información que estamos representando no puede estar en categorías definidas (como los números enteros 1, 2, 3, 4, 5 & 6) es más apropiado usar un histograma para presentar la información. Un histograma para esta información se muestra a continuación.

Cada número en el eje x- iene una columna asociada, cuya altura muestran cuántos estudiantes tienen ése número de hermanos. Por ejemplo, la columna en el punto x = 2 tiene una altura de 5, lo que indica que hay 5 estudiantes que tienen 2 hermanos..

Las categorías en el eje x- se llaman intervalos . Los histogramas se diferencian de los gráficos de barra en que los histogramas no tienen necesariamente amplitudes fijas para los intervalos. Además son útiles para presentar información continua (información que varía continuamente en vez de variar en cantidades enteras). Para ilustrar esto, mostraremos a continuación algunos ejemplos.

Ejemplo B

La lluvia mensual en Beaver Creek Oregon (en milímetros) se midió por un período de cinco años y la información se muestra a continuación. Presenta la información mediante un histograma.

41.1, 254.7, 91.6, 60.9, 75.6, 36.0, 16.5, 10.6, 62.2, 89.4, 124.9, 176.7, 121.6, 135.6, 141.6, 77.0, 82.8, 28.9, 6.7, 22.1, 29.9, 110.0, 179.3, 97.6, 176.8, 143.5, 129.8, 94.9, 77.0, 60.8, 60.0, 32.5, 61.7, 117.2, 194.5, 208.6, 176.8, 143.5, 129.8, 94.9, 77.0, 60.8, 20.0, 32.5, 61.7, 117.2, 194.5, 208.6, 133.1, 105.2, 92.0, 60.7, 52.8, 37.8, 14.8, 23.1, 41.3, 75.7, 134.6, 148.8

Solución

Fíjate en la similitud entre histogramas y diagramas de árbol. Un diagrama de árbol se parece a un histograma volteado de lado. Podemos comenzar haciendo un diagrama de árbol con nuestra información.

Para nuestra información anterior, nuestro tallo serían los décimos y comenzarían desde el 1 al 25. En vez de redondear los decimales en los datos, los truncamos lo que simplemente significa que les quitamos el decimal. Por ejemplo, 165,7 tendría un tallo de 16 y una hoja de 5 y dejaríamos fuera los siete decimales.

Al delinear los números en el diagrama de árbol, podemos ver cómo sería un histograma con una amplitud de intervalo de 10. Puedes ver que con tantos intervalos, el histograma se ve aleatorio y sin ningún patrón claro visible. En una situación como ésta debemos reducir el número de intervalos. Aumentaremos la amplitud del intervalo a 25 y organizaremos la información en una tabla:

Lluvia (mm) Frecuencia
0 \le x < 25 7
25 \le x < 50 8
50 \le x < 75 9
75 \le x < 100 12
100 \le x < 125 6
125 \le x < 150 9
150 \le x < 175 0
175 \le x < 200 6
200 \le x < 225 2
225 \le x < 250 0
250 \le x < 275 1

El histograma asociado a esta amplitud del intervalo se muestra a continuación.

El patrón en la distribución es mucho más evidente con menos intervalos. Ahora veamos cómo sería un histograma con menos intervalos. Podemos combinar intervalos en parejas para tener 6 intervalos con una amplitud de 50. Nuestra nueva tabla y su histograma quedarían así.

Lluvia (mm) Frecuencia
0 \le x < 50 15
50 \le x < 100 21
100 \le x < 150 15
150 \le x < 200 6
200 \le x < 250 2
250 \le x < 300 1

El patrón es mucho más claro ahora. La lluvia mensual normal es alrededor de 75 mm, pero a veces se presenta un mes muy lluvioso y ésta podría ser mayor (incluso mucho mayor).

Puedes ver que, aunque parezca que va contra toda lógica, a veces puedes obtener más información al reducir el número de intervalos en un histograma. Es como hacer zoom en una imagen; no puedes ver la mayoría de los detalles, pero la forma general de lo que estás mirando se podría hacer más clara.

Hacer histogramas usando una calculadora gráfica

Mira de nuevo la información del ejemplo 1. Hemos visto cómo manipular información en bruto para producir un diagrama de árbol y un histograma. Ahora saquemos del proceso parte del tedioso trabajo de clasificación mediante el uso de una calculadora gráfica para clasificar automáticamente nuestros datos en intervalos.

Ejemplo C

Los siguientes datos desordenados representan las edades de los pasajeros de un vagón de tren.

35, 42, 38, 57, 2, 24, 27, 36, 45, 60, 38, 40, 40, 44, 1, 44, 48, 84, 38, 20, 4, 2, 48, 58, 3, 20, 6, 40, 22, 26, 17, 18, 40, 51, 62, 31, 27, 48, 35, 27, 37, 58, 21.

Usa una calculadora gráfica para presentar la información en forma de histograma con amplitudes de intervalos de 10, 5 y 20.

Solución

Introduce la información en tu calculadora:

Presiona [START] y escoge la opción [EDIT] .

Introduce los 43 datos en la tabla en la columna L_1 .

Selecciona el tipo de diagrama:

Accede a la opción [STATPLOT] al presionar [2nd] , [Y=] .

Selecciona 1:Plot1 y presiona [ENTER] . Esto hará aparecer las opciones de diagrama en la pantalla. Selecciona el histograma y presiona [ENTER] . Asegúrate que Xlist es la lista que contiene tu información.

Seleccionar las amplitudes de intervalo y el diagrama:

Presiona [WINDOW] y asegúrate que Xmin y Xmax permiten que se muestren todos los datos. El valor Xscl determina la amplitud de intervalo.

Presiona [GRAPH] para mostrar el histograma.

Puedes cambiar las amplitudes de intervalo y ver cómo el histograma cambia, al variar Xscl . Más abajo se encuentran histogramas con amplitudes de intervalos de 10, 5 y 20. (En este ejemplo Xmin = 0 y Xmax = 100 funcionará con cualquier amplitud de intervalo que escojamos, pero fíjate que, para presentar correctamente el histograma, necesitamos usar un valor de Ymax diferente para cada uno.)

Mira este video si necesitas ayuda con los ejemplos anteriores.

Haz clic en la imagen de arriba para ver más contenido (requiere conexión a internet)

CK-12 Foundation: Stem and Leaf Plots and Histograms

*Este video solo está disponible en inglés

Vocabulario

  • Un diagrama de árbol consiste de un “tallo” vertical que contiene el primer dígito de cada número y el resto de cada número escrito hacia la derecha del tallo como una “hoja”
  • Una tabla de frecuencia es una con la cual se registra la frecuencia de cada valor en el conjunto de información.
  • Cuando la información que estamos representando puede organizarse en categorías bien definidas (tales como los enteros 1, 2, 3, 4, 5 & 6) es más adecuado usar un histograma para presentar tal información. Un histograma es un gráfico de una tabla de frecuencia, donde la frecuencia de cada valor está representada por la altura de una barra.

Práctica guiada

Rowena hizo una encuesta de las edades de pasajeros en un vagón de tren y ordenó los resultados en una tabla de frecuencia. Presenta los resultados en un histograma.

Rango de edad Frecuencia
0 – 9 6
10 – 19 2
20 – 29 9
30 – 39 8
40 – 49 11
50 – 59 4
60 – 69 2
70 – 79 0
80 – 89 1

Solución

Ya que la información ya está ordenada en rangos, usaremos éstos como nuestros intervalos para el histograma. Aunque el tope del primer rango es 9, el intervalo en nuestro histograma lo extenderemos hasta 10. Esto es debido a que, como cambiamos a información continua, tenemos un rango de números que va justo en el final más bajo del siguiente intervalo, incluso si no incluye ése número. El rango de valores para el primero intervalo sería, por lo tanto 0 \le x < 10 , y todos los otros intervalos tendrían rangos descritos de forma similar.

Práctica

  1. 1. Crea un diagrama de árbol para la siguiente información. Usa el primer dígito ( centenas ) como el tallo y el segundo ( décenas ) como la hoja. Trunca cualquier unidad y decimal . Ordena el diagrama para encontrar la mediana y la moda. Información: 607.4, 886.0, 822.2, 755.7, 900.6, 770.9, 780.8, 760.1, 936.9, 962.9, 859.9, 848.3, 898.7, 670.9, 946.7, 817.8, 868.1, 887.1, 881.3, 744.6, 984.9, 941.5, 851.8, 905.4, 810.6, 765.3, 881.9, 851.6, 815.7, 989.7, 723.4, 869.3, 951.0, 794.7, 807.6, 841.3, 741.5, 822.2, 966.2, 950.1.
  2. Haz una tabla de frecuencia para la información en la pregunta 1. Usa una amplitud de intervalo de 50.
  3. Diagrama la información de la pregunta 1 como un histograma con una amplitud de intervalo de
    1. 50
    2. 100

Para las preguntas del 4 al 6, usa el siguiente diagrama de árbol que cual muestra la información recolectada sobre la velocidad de 40 autos en una zona con límite de velocidad de 35 millas por hora en Culver City, California.

  1. Encuentra la media, la mediana y la moda de la velocidad.
  2. Completa la tabla de frecuencia, comenzando con 25 millas y con una amplitud del intervalo de 5 millas.
  3. Usa la tabla para construir un histograma con los intervalos de tu tabla de frecuencia.
Para las preguntas del 7 al 11, el histograma de abajo muestra los resultados de una encuesta a mayor escala del problema anterior sobre el número de hermanos. Úsala para encontrar:

  1. La mediana de la información.
  2. La media de la información.
  3. La moda de la información.
  4. El número de personas que tienen un número par de hermanos.
  5. El porcentaje de personas encuestadas que tienen 4 o más hermanos.

Licencia

Licencia epub de ck12

Para acceder a una versión personalizada de este libro, así como otros contenidos interactivos, visite www.ck12.org

 

Fundación CK- 12  es una organización sin fines de lucro con la misión de reducir el costo de los materiales de libros de texto para el mercado K- 12, tanto en los EE.UU. así como en todo el mundo. Mediante el uso de contenido libre y un modelo colaborativo basado en la web denominado FlexBook®. CK-12 tiene la intención de ser pioneros en la generación y distribución de contenidos educativos de alta calidad que van a servir como texto base y además proporcionar un entorno para el aprendizaje adaptativo, impulsado a través  de FlexBook Platform®.

Copyright © 2012 CK-12 Foundation, www.ck12.org

Los nombres "CK-12" y "CK12", los logotipos asociados y los términos"FlexBook®" and "FlexBook Platform®" (en adelante "Marcas CK- 12") son marcas comerciales y marcas de servicio de la Fundación    CK- 12 y están protegidos por leyes federales, estatales e internacionales.

Cualquier forma de reproducción de este libro en cualquier formato o medio, en todo o secciones, debe incluir el enlace de atribución de referencia http://www.ck12.org/saythanks (colocado en un lugar visible), además de los siguientes términos.

Con excepción de lo señalado, todo el contenido CK- 12 (incluyendo material de Curriculum CK- 12) se ha puesto a disposición de los usuarios de acuerdo con la licencia Creative Commons Attribution-Non-Commercial 3.0 Unported (CC BY-NC 3.0) License (http://creativecommons.org/licenses/by-nc/3.0/), en su versión modificada y actualizada ("CC License"), que se incorpora al presente por medio de ésta referencia.

Las condiciones completas en su versión en Ingles se pueden encontrar en http://www.ck12.org/terms.

by-nc-na

×