Análisis de Datos
CK-12 and Intel Education

Utilización del Diagrama de Dispersión para Interpretar los Datos

En esta sección, aprenderás a utilizar un diagrama de dispersión para interpretar los datos.

¿Alguna vez has tenido un entrenador? Bueno, ser un entrenador de atletismo es un trabajo duro. Observa este dilema.

El Sr. Watson está tratando de evaluar a su equipo y sus fortalezas. Él ha determinado que hay una correlación entre la velocidad y la altura de los estudiantes. Él está tan seguro de eso que juntó datos para apoyar su argumento. Cuando miraba a los estudiantes que corren los 800 metros, el recopiló las siguientes alturas y tiempos.

5^\prime 3^{\prime \prime} &= 2.26.11\\\5^\prime 2^{\prime \prime} &= 3.01.11\\\5^\prime 4^{\prime \prime} &= 2.23.20\\\5^\prime 5^{\prime \prime} &= 2.20.01\\\5^\prime 6^{\prime \prime} &= 2.18.23\\\5^\prime 6^{\prime \prime} &= 2.18.25

El Sr. Watson tomó sus datos y creó el siguiente diagrama de dispersión.

El Sr. Watson está seguro de que hay una correlación positiva entre la velocidad y la altura.

¿Puede probarlo con este diagrama de dispersión? Presta atención y aprenderás cómo utilizar un diagrama de dispersión para interpretar los datos.

Orientación

En el mundo real, muchas cosas se relacionan entre sí. Por ejemplo, entre más fumas, menor es tu esperanza de vida. O entre más años estés en el colegio tus ingresos serán mayores en el futuro. Muchos campos tratan de encontrar la relación entre dos variables.

Una herramienta que nos ayuda a lograr esto son los diagramas de dispersión.

Un diagrama de dispersión es un tipo de gráfico donde los valores correspondientes de un conjunto de datos se ubican como puntos de un plano cartesiano. Una relación entre los puntos se muestra, algunas veces, como positiva, negativa, sólida o débil.

Algunas veces un diagrama de dispersión muestra que no hay ningún tipo de relación. Aparte de encontrar relaciones, los diagramas de dispersión son útiles en la predicción de valores basados en la relación que se reveló.

Observa este diagrama de dispersión.

Puedes ver que hay una relación entre los valores independientes y dependientes del gráfico. Miremos cómo podemos examinar estas relaciones.

Como habrás adivinado, los diagramas de dispersión son útiles porque sus formas podrían indicar una relación entre las variables. Considera lo siguiente: ¿qué sucede con la cuenta de gas de las personas cuando la temperatura exterior aumenta? O ¿qué sucede con el consumo de gasolina de un vehículo cuando aumentan las millas recorridas?

Para la primera pregunta, podrías haber pensado que como la temperatura exterior aumenta, la cuenta de gas de las personas baja porque utilizan menos la calefacción. Cuando una variable aumenta, la otra disminuye. ¿Qué sucede con la segunda pregunta? Podrás imaginar que cuando las millas recorridas en un auto aumentan, la cantidad de gasolina también lo hace. Por lo tanto, cuando una variable aumenta, la otra también aumenta.

Podemos decir que estás variables se correlacionan o están conectadas la una a la otra. Cuando miramos a un diagrama de dispersión, podemos determinar las diferentes variables y su correlación.

En la situación mencionada, la primera ilustra una relación negativa, ya que un variable aumenta y la otra disminuye. La segunda ilustra una relación positiva, ya que una variable aumenta y la otra también. Bien, si no hay ninguna relación, mientras una variable aumenta, la otra puede aumentar, disminuir, quedarse igual, la segunda variable es independiente de la primera. Esto sucede generalmente también. Este es un ejemplo en que no se presentan relaciones. Como el número de autos azules en una carretera y el número de accidentes. Las dos variables no tienen relación.

Estas tres tendencia, positiva, negativa y sin relación, son evidentes en los diagramas de dispersión. Así es como lucen.

Relación Positiva

Mientras los valores de x aumenta, los valores de y aumentan. Quizás algunos puntos no siguen un patrón exacto, pero la tendencia , global, la tendencia general o movimiento, es clara desde la izquierda inferior a la derecha superior del gráfico.

Relación Negativa

En este caso, mientras los valores de x aumenta, los valores de y disminuyen. Podrías argumentar que la pendiente no es tan inclinada, lo que es verdad. Sin embargo, la tendencia general es evidente. Este gráfico se mueve desde la izquierda superior a la derecha inferior.

Sin relación

Algunas veces, no relación entre las variables. Los diagramas de dispersión de estas situaciones no mostrarán una tendencia. En otras palabras, parece que no hay un patrón definido con los puntos. No puedes ver que se tome ninguna dirección en particular.

Los diagramas de dispersión son útiles para encontrar la relación entre las variables ya que están ahí para hacer predicciones. Aquí, harás una línea de tendencia , o una línea que describe mejor los datos en un diagrama de dispersión ,para estimar las salidas incógnitas para las entradas dadas.

Una línea de tendencia es una línea recta que representa de mejor manera los puntos en un diagrama de dispersión. La línea de tendencia puede atravesar algunos puntos pero no necesariamente los atraviesa todos. La línea de tendencia se utiliza para mostrar los patrones de los datos. Esta línea de tendencia puede mostrar una tendencia positiva o una tendencia negativa. Sin embargo, si no hay relación, entonces no se podrá dibujar ninguna línea de tendencia de manera adecuada.

Tu línea de tendencia es tu mejor aproximación, por lo que debe ser diferente a la de los otros.

La línea en este gráfico es la línea de tendencia ; Es la línea que mejor describe los datos. Casi la mitad de los puntos deben en estar en algún lado de la línea.

Podrás notar que los valores atípicos son prácticamente ignorados mientras se dibuja la línea de tendencia. Esta línea de tendencia va desde la izquierda inferior hasta la derecha superior y muestra una relación positiva.

Fíjate que esta tendencia desciende e indica una correlación o relación negativa. También puedes ver que se pasa del gráfico. Por lo tanto, podemos usar un gráfica como esta para predecir la tendencia. Es como si la tendencia continuara descendiendo.

Utiliza lo aprendido para responder estas preguntas.

Ejemplo A

Si los datos no siguen un patrón, ¿Qué tipo de correlación describiría este diagrama de dispersión?

Solución: Sin Correlación

Ejemplo B

Si los datos ascienden en un patrón desde la base izquierda hasta la punta derecha, ¿qué tipo de correlación describirían estos datos?

Solución: Correlación Positiva

Ejemplo C

Si la distancia de un auto aumenta cuando su velocidad aumenta, ¿qué tipo de correlación tendrían los datos?

Solución: Correlación Positiva

Ahora, miremos otra vez el dilema que estaba al principio de esta Sección.

La tendencia de estos datos muestra que mientras la altura de los corredores aumenta, su tiempo disminuye, lo que significa que la persona que corre es más rápida. Por lo tanto, el Sr. Watson puede probar que sí hay una relación entre la altura y la velocidad.

Vocabulario

Diagrama de Dispersión
Un gráfico donde los valores correspondientes se ubican en un plano cartesiano y donde se puede determinar la relación entre los valores.
Valor de entrada
El valor x Es el valor independiente.
Valor de Salida
El valor y Es el valor dependiente.
Correlación Positiva
Un diagrama de dispersión donde los puntos graficados van hacia abajo de izquierda a derecha.
Correlación Negativa
Un diagrama de dispersión donde los puntos graficados van hacia abajo de izquierda a derecha.
Sin Correlación
Un diagrama de dispersión donde no está clara la relación entre los valores dependientes e independientes.

Práctica Guiada

Aquí hay un ejercicio para que trates tú mismo.

¿Qué tipo de relación muestran los datos?

Solución

Mientras una variable aumenta, la otra variable también lo hace.

Este diagrama de dispersión muestra una correlación positiva en los datos.

Revisión en Video

Haz clic en la imagen de arriba para ver más contenido. (requiere conexión a internet)

Scatterplots and Lines of Best Fit

*este video solo está disponible en inglés.

Práctica

Instrucciones: ¿Qué tipo de relación se muestra en los siguientes diagramas de dispersión?

  1. Si los datos disminuyen cuando una variable aumenta, ¿Qué tipo de relación se muestra?
  2. Utiliza la siguiente tabla para hacer un diagrama de dispersión.

& x \qquad \ 3 \qquad \ 6 \qquad \ 8 \qquad \ 14 \qquad 18 \qquad 23 \qquad 29 \qquad 32 \qquad 37\\\& y \qquad 55 \qquad 50 \qquad 46 \qquad 40 \qquad 37 \qquad 18 \qquad 26 \qquad 20 \qquad 18

  1. Dibuja una línea de tendencia.
  2. Identifica el tipo de relación.

Una zoólogo estudió la relación entre los kilometres desde un lago y el número de felinos por 100 kilómetros cuadrados. Ella encontró los siguientes datos:

& \text{Distance from Lake} \qquad 3 \qquad \ 1 \qquad \ 4 \qquad 3 \qquad 4.5 \qquad 5 \qquad .5 \qquad 2 \qquad 2.5 \qquad 3.5 \qquad 8 \qquad 6 \qquad 5\\\& \# \text{ of Felines} \qquad \qquad \quad \ 5 \qquad 10 \qquad 2 \qquad 8 \qquad \ 6 \qquad \ \ 5 \qquad \ 8 \qquad 8 \qquad \ 6 \qquad \ \ 6 \qquad \ 0 \qquad 2 \qquad 4

  1. Haz un diagrama de dispersión que ilustre estos datos.
  2. Dibuja una línea de tendencia.
  3. ¿Cuál es la correlación?
  4. Estima el número de felinos en 1,5 kilómetros desde el lago.

Instrucciones: Define los siguientes términos.

  1. Valor de entrada
  2. Valor de Salida
  3. Correlación Positiva
  4. Correlación Negativa
  5. Sin Correlación
  6. Conjunto de datos

Licencia

Licencia epub de ck12

Para acceder a una versión personalizada de este libro, así como otros contenidos interactivos, visite www.ck12.org

 

Fundación CK- 12  es una organización sin fines de lucro con la misión de reducir el costo de los materiales de libros de texto para el mercado K- 12, tanto en los EE.UU. así como en todo el mundo. Mediante el uso de contenido libre y un modelo colaborativo basado en la web denominado FlexBook®. CK-12 tiene la intención de ser pioneros en la generación y distribución de contenidos educativos de alta calidad que van a servir como texto base y además proporcionar un entorno para el aprendizaje adaptativo, impulsado a través  de FlexBook Platform®.

Copyright © 2012 CK-12 Foundation, www.ck12.org

Los nombres "CK-12" y "CK12", los logotipos asociados y los términos"FlexBook®" and "FlexBook Platform®" (en adelante "Marcas CK- 12") son marcas comerciales y marcas de servicio de la Fundación    CK- 12 y están protegidos por leyes federales, estatales e internacionales.

Cualquier forma de reproducción de este libro en cualquier formato o medio, en todo o secciones, debe incluir el enlace de atribución de referencia http://www.ck12.org/saythanks (colocado en un lugar visible), además de los siguientes términos.

Con excepción de lo señalado, todo el contenido CK- 12 (incluyendo material de Curriculum CK- 12) se ha puesto a disposición de los usuarios de acuerdo con la licencia Creative Commons Attribution-Non-Commercial 3.0 Unported (CC BY-NC 3.0) License (http://creativecommons.org/licenses/by-nc/3.0/), en su versión modificada y actualizada ("CC License"), que se incorpora al presente por medio de ésta referencia.

Las condiciones completas en su versión en Ingles se pueden encontrar en http://www.ck12.org/terms.

by-nc-na

×