Análisis de Datos
CK-12 and Intel Education

Utilización de las Muestras de Datos

En esta sección, crearás muestras de datos para analizar y obtener conclusiones sobre los diferentes conjuntos de datos.

¿Alguna vez has tenido problemas probándote ropa? Bien, entonces observa este dilema.

"¡No lo puedo creer!" Exclamó Jacob probándose su nueva camiseta del equipo de mangas largas del equipo de atletismo.

"¿Cuál es el problema?" Preguntó su amigo Matías.

"Esta camiseta no me queda buena y eso siempre me sucede. Voy a descubrir por qué", dijo Jacob sacándose la camiseta que tenía las mangas muy cortas otra vez.

Después de que acabó la ira de Jacob, él comenzó a pensar en esta pregunta. ¿Era el único con este problema? Jacob decidió descubrirlo al medir la altura de sus compañeros y la longitud de sus brazos. Utilizó las pulgadas y creó una tabla como esta:

& \text{Height (in)} \qquad \qquad \ 52 \qquad 53 \qquad 56 \qquad 58 \qquad 59 \qquad 62 \qquad 64 \qquad 65 \qquad \ 66 \qquad \ 67 \qquad 68 \qquad 69 \qquad 70\\\& \text{Arm Length (in)} \qquad 22 \qquad 23 \qquad 24 \qquad 23 \qquad 24 \qquad 27 \qquad 25 \qquad 25 \qquad 25.5 \qquad 26 \qquad 27 \qquad 27 \qquad 28

Ahora que Jacob tiene listos sus datos, necesita crear una muestra. ¿Cuál debe crear? Piensa en esta pregunta mientras realizas esta Sección y al final ayudarás a Jacob a crear la muestra apropiada para sus datos.

Orientación

Los datos pueden existir en muchas formas. Un objetivo frecuente en la recolección de datos es la obtención de conclusiones basados en los datos. La mejor conclusión corresponde con la tendencia que muestran los datos. Dependiendo de los datos que tienes, ciertos tipos de muestras son más apropiadas o más efectivas que otras. Debemos hacer buenas elecciones de muestras de datos con una forma lógica. Por supuesto, en un mundo tan lleno de datos, deben coleccionarse y organizarse cuidadosamente para ayudar en una toma de decisiones apropiada.

Algunas veces, dos personas miran el mismo gráfico y obtienen conclusiones completamente diferentes. Los gráficos pueden mostrarnos muchas cosas, pero las conclusiones que obtenemos según los gráficos dependen, algunas veces, de las opiniones. La idea de un gráfico es, en parte, para realizar inferencias. Esas inferencias deben basarse en los datos.

Observa esta situación.

Algunos científicos de la EPA estaban estudiando la cantidad de oxígeno disuelto en un lago por varias semanas. Este gráfico se creó con los datos que encontraron.

Estudiaron el gráfico y obtuvieron las siguientes conclusiones.

  1. La cantidad de oxígeno disuelto fluyó en las últimas 5 semanas.
  2. La cantidad promedio de oxígeno disuelto ha sido caso 110 partes por millón en las últimas 5 semanas.
  3. El oxígeno disuelto en la Semana 6 será de alrededor de 60 partes por millón.

¿Estás de acuerdo con sus conclusiones?

Las primeras dos conclusiones se muestran claramente en los datos. Sin embargo, la predicción alrededor de la semana 6, la conclusión número 3, no se muestra de manera convincente. El nivel de oxígeno disuelto sí parece fluir y se ha vuelto ligeramente más grande con el tiempo y luego más bajo, pero no es evidencia suficiente para estar seguros que en la semana 6 el oxígeno disuelto se hará más bajo.

Aquí hay otra.

El jefe de una oficina hizo una encuesta de las preferencias de la gente en el almuerzo porque él quiso llevar a los miembros de la oficina a un almuerzo para las fiestas. Sus datos se muestran a continuación.

Él obtiene las siguientes conclusiones:

  1. A mucha gente le gusta la comida china.
  2. A nadie le gusta la comida italiana.
  3. Si ordeno sándwiches, entonces el 80% del equipo estará infeliz.
  4. Si ordena algunas pizzas y algo de comida china, la mayoría lo preferirá.

¿Estás de acuerdo con sus conclusiones?

De acuerdo con el gráfico, se respalda la conclusión 1 porque el número más grande de gente seleccionó la comida china.

El gráfico no respalda la conclusión 2. Quizás la comida italiana no era una opción en la encuesta. Además, solo porque tú tienes una preferencia no significa que no te gustan las otras opciones.

Por la misma razón, tampoco no se respalda la conclusión 3. Solo porque prefieres la comida china no significa que no te gustan los sándwiches.

La conclusión 3 se respalda porque el 25% prefiere sándwiches y el 35% prefiere la comida china, por lo que el 60%, la mayoría, tendrá su preferencia.

Hay muchas formas de demostrar los datos, por lo tanto ¿cómo sabrás cuál es la mejor manera de mostrar los datos dados? Algunas opciones son simples preferencias, pero la mayoría de los tipos de datos tienen tipos de muestras que se adaptan mejor.

Tipos de Datos

Dos grandes tipos de datos son datos categóricos y datos numéricos. Los datos categóricos se refieren a los datos en que se le asigna un nombre a la variable independiente, no un número. Por ejemplo, puedes tomar los datos basados en los meses mayo, junio, julio y agosto o puedes contar a las personas según masculino y femenino. Algunas veces, las categorías pueden ser números que se utilizan para nombrar las categorías. Por ejemplo, los jugadores de un equipo tienen números en sus camisetas. Esos números solo se usan para clarificar quién es quién. Tendría sentido utilizar operaciones matemáticas con los números. Generalmente, los datos categóricos son contados de manera simple.

El segundo tipo de datos es el numérico. Los datos numéricos miden algunas características de la variable. Ejemplos de datos que se miden de manera numérica son el tiempo, la altura, el peso, la longitud, el volumen, la densidad, la fuerza, etc. Cualquier cosa que se pueda medir con un sistema numérico es un dato numérico.

Tipos de Muestras

Podemos utilizar diferentes muestras de datos dependiendo de estos mismos. Podemos utilizar gráficos lineales, diagramas de dispersión, gráficos circulares, gráficos de barras, diagramas de tallos y hojas, diagramas de caja y bigotes e histogramas.

Hay muchos más tipos de muestras de datos, pero quedémonos con esos por ahora. A pesar de que hay algunas reglas exactas sobre las muestras de datos, cada tipo de muestra tiene ciertos ejemplos para que sean ideales. Además, hay ejemplos donde ciertas muestras son inapropiadas. Más aún, la mejor muestra de datos depende de qué información esperas obtener de ella.

Los gráficos lineales se usan, generalmente, para mostrar cambios a través del tiempo.

Los diagramas de dispersión se usan para mostrar una tendencia o relación (correlación) entre las variables.

Los gráficos circulares son mejores para mostrar datos que representan un entero o cien por ciento de algo.

Los gráficos de barras son excelentes para los datos categóricos.

El diagrama de tallos y hojas es útil para representar rangos y se puede utilizar para ilustrar rangos de dos variables.

El diagrama de caja y bigotes se utiliza para mostrar la extensión de los datos y dónde se encuentran la mayoría de los datos.

Escribe cada ejemplo de muestra de datos y el mejor uso para cada uno.

Responde cada pregunta sobre las diferentes muestras de datos.

Ejemplo A

¿Qué muestra de datos es mejor para los datos categóricos?

Solución: Gráfico de barras

Ejemplo B

¿Qué muestra de datos es mejor para mostrar cómo cambian los datos con el tiempo?

Solución: Gráfico lineal.

Ejemplo C

Si tuviera datos que se obtuvieron en 1910, 1920, 1940 y 1950 ¿qué muestra sería mejor?

Solución: Diagrama de Dispersión

Ahora, miremos otra vez el dilema que estaba al principio de esta Sección.

Al utilizar un diagrama de dispersión, Jacob puede comparar dos variables, que son datos numéricos, de una vez para ver si hay una relación. Estos son los resultados.

Las medidas de Jacob eran (62, 27). Pareciera que sus medidas son ligeramente diferentes que las de un estudiante normal. Por esta razón, tus camisetas no parecen ser apropiadas.

Vocabulario

Datos numéricos
Cualquier dato que se mide en números.
Datos categóricos
Datos a los que se les asigna un nombre y no un número

Práctica Guiada

Aquí hay un ejercicio para que trates tú mismo.

Se hizo un conteo de animales en un refugio local para que los niños que lo visitan lo puedan ver. Estos son los resultados.

Cuando los niños miraron los gráficos de barras, ellos gritaron:

Bobby: "¡A nadie le gustan los perros!"

Lisa: "¡No sabía que los hámster y las ratas eran lo mismo!"

Miguel: "¡Todos deben haberse llevados todas las tortugas!"

Mona: "¡Ellos deben tener más comida para perros y gatos!"

¿Cómo podría responder un profesor? ¿Estaban bien las conclusiones de los niños?

Solución

El profesor respondió pacientemente a sus comentarios:

"Bobby, solo porque tienen muchos perros no significa que a las personas no les gustan. Ya que los que los perros son las mascotas más comunes, tiene sentido que hayan más perros en el refugio".

"Lisa, parece que los hámsteres y las ratas se contaron en la misma categoría, quizás porque se mantienen en la misma jaula o les dan comida similar. Además, este gráfico de barras no demuestran que sean lo mismo."

"Miguel, ya que las tortugas son mascotas menos comunes, el refugio probablemente tiene menos tortugas. No significa que tienen muchas que ya se llevaron.

"Sí, Mona. Tiene sentido que tener tantos perros y gatos comparado con otros animales requiere de más comida para ellos que para otros animales. Además, son animales más grandes que los otros, generalmente, por lo que comen más. ¿No es cierto?"

Una vez más, se utilizó una muestra de datos para hacer conexiones. Los niños utilizaron el gráfico del refugio animal para obtener conclusiones.

Revisión en Video

Haz clic en la imagen de arriba para ver más contenido. (requiere conexión a internet)

Reading Bar Graphs

*este video solo está disponible en inglés.

Práctica

Instrucciones: Responde cada pregunta sobre las muestras de datos.

  1. ¿Qué se considera dato numérico?
  2. ¿Qué se considera dato categórico?
  3. Si estuvieras buscando una relación entre dos valores, ¿utilizarías un diagrama de dispersión o un gráfico lineal?
  4. Si hubiera una relación entre los datos ¿tendrías una correlación positiva o negativa?
  5. Las palabras correlación positiva y correlación negativa ¿con qué tipo de muestras de datos se asocian?
  6. Si tienes un valor atípico, entonces ¿tendrías un diagrama de dispersión o un diagrama de caja y bigotes?
  7. ¿Qué es un cuartil?
  8. ¿Con qué tipo de muestra de datos se asocia un cuartil?
  9. Si estuvieras mirando una tendencia a través del tiempo, ¿utilizarías un gráfico lineal o un diagrama de dispersión?
  10. Si estuvieras comparando dos tendencias y sus resultados ¿Qué muestra de datos tiene más sentido?
  11. ¿Qué es la media?
  12. ¿Qué es la mediana?
  13. ¿Qué es la moda? ?

Instrucciones: Responde cada pregunta.

¿Las conclusiones son apropiadas para el gráfico? Explica tu razonamiento.

  1. Conclusión 1: las ratas son las criaturas más temerosas. Conclusión 2: las ratas son las criaturas más peligrosas. Conclusión 3: nadie le teme a los murciélagos.
  2. Conclusión 1: Los precios han aumentado todos los años desde hace 10 años. Conclusión 2: los precios de la gasolina aumentaron más rápido después del año 2000. Conclusión 3: Los precios serán mucho más altos en 2008.

Licencia

Licencia epub de ck12

Para acceder a una versión personalizada de este libro, así como otros contenidos interactivos, visite www.ck12.org

 

Fundación CK- 12  es una organización sin fines de lucro con la misión de reducir el costo de los materiales de libros de texto para el mercado K- 12, tanto en los EE.UU. así como en todo el mundo. Mediante el uso de contenido libre y un modelo colaborativo basado en la web denominado FlexBook®. CK-12 tiene la intención de ser pioneros en la generación y distribución de contenidos educativos de alta calidad que van a servir como texto base y además proporcionar un entorno para el aprendizaje adaptativo, impulsado a través  de FlexBook Platform®.

Copyright © 2012 CK-12 Foundation, www.ck12.org

Los nombres "CK-12" y "CK12", los logotipos asociados y los términos"FlexBook®" and "FlexBook Platform®" (en adelante "Marcas CK- 12") son marcas comerciales y marcas de servicio de la Fundación    CK- 12 y están protegidos por leyes federales, estatales e internacionales.

Cualquier forma de reproducción de este libro en cualquier formato o medio, en todo o secciones, debe incluir el enlace de atribución de referencia http://www.ck12.org/saythanks (colocado en un lugar visible), además de los siguientes términos.

Con excepción de lo señalado, todo el contenido CK- 12 (incluyendo material de Curriculum CK- 12) se ha puesto a disposición de los usuarios de acuerdo con la licencia Creative Commons Attribution-Non-Commercial 3.0 Unported (CC BY-NC 3.0) License (http://creativecommons.org/licenses/by-nc/3.0/), en su versión modificada y actualizada ("CC License"), que se incorpora al presente por medio de ésta referencia.

Las condiciones completas en su versión en Ingles se pueden encontrar en http://www.ck12.org/terms.

by-nc-na

×