Utilización del Diagrama de Dispersión para Interpretar los Datos
En esta sección, aprenderás a utilizar un diagrama de dispersión para interpretar los datos.
¿Alguna vez has tenido un entrenador? Bueno, ser un entrenador de atletismo es un trabajo duro. Observa este dilema.
El Sr. Watson está tratando de evaluar a su equipo y sus fortalezas. Él ha determinado que hay una correlación entre la velocidad y la altura de los estudiantes. Él está tan seguro de eso que juntó datos para apoyar su argumento. Cuando miraba a los estudiantes que corren los 800 metros, el recopiló las siguientes alturas y tiempos.
El Sr. Watson tomó sus datos y creó el siguiente diagrama de dispersión.
El Sr. Watson está seguro de que hay una correlación positiva entre la velocidad y la altura.
¿Puede probarlo con este diagrama de dispersión? Presta atención y aprenderás cómo utilizar un diagrama de dispersión para interpretar los datos.
Orientación
En el mundo real, muchas cosas se relacionan entre sí. Por ejemplo, entre más fumas, menor es tu esperanza de vida. O entre más años estés en el colegio tus ingresos serán mayores en el futuro. Muchos campos tratan de encontrar la relación entre dos variables.
Una herramienta que nos ayuda a lograr esto son los diagramas de dispersión.
Un diagrama de dispersión es un tipo de gráfico donde los valores correspondientes de un conjunto de datos se ubican como puntos de un plano cartesiano. Una relación entre los puntos se muestra, algunas veces, como positiva, negativa, sólida o débil.
Algunas veces un diagrama de dispersión muestra que no hay ningún tipo de relación. Aparte de encontrar relaciones, los diagramas de dispersión son útiles en la predicción de valores basados en la relación que se reveló.
Observa este diagrama de dispersión.
Puedes ver que hay una relación entre los valores independientes y dependientes del gráfico. Miremos cómo podemos examinar estas relaciones.
Como habrás adivinado, los diagramas de dispersión son útiles porque sus formas podrían indicar una relación entre las variables. Considera lo siguiente: ¿qué sucede con la cuenta de gas de las personas cuando la temperatura exterior aumenta? O ¿qué sucede con el consumo de gasolina de un vehículo cuando aumentan las millas recorridas?
Para la primera pregunta, podrías haber pensado que como la temperatura exterior aumenta, la cuenta de gas de las personas baja porque utilizan menos la calefacción. Cuando una variable aumenta, la otra disminuye. ¿Qué sucede con la segunda pregunta? Podrás imaginar que cuando las millas recorridas en un auto aumentan, la cantidad de gasolina también lo hace. Por lo tanto, cuando una variable aumenta, la otra también aumenta.
Podemos decir que estás variables se correlacionan o están conectadas la una a la otra. Cuando miramos a un diagrama de dispersión, podemos determinar las diferentes variables y su correlación.
En la situación mencionada, la primera ilustra una relación negativa, ya que un variable aumenta y la otra disminuye. La segunda ilustra una relación positiva, ya que una variable aumenta y la otra también. Bien, si no hay ninguna relación, mientras una variable aumenta, la otra puede aumentar, disminuir, quedarse igual, la segunda variable es independiente de la primera. Esto sucede generalmente también. Este es un ejemplo en que no se presentan relaciones. Como el número de autos azules en una carretera y el número de accidentes. Las dos variables no tienen relación.
Estas tres tendencia, positiva, negativa y sin relación, son evidentes en los diagramas de dispersión. Así es como lucen.
Relación Positiva
Mientras los valores de
aumenta, los valores de
aumentan. Quizás algunos puntos no siguen un patrón exacto, pero la
tendencia
, global, la tendencia general o movimiento, es clara desde la izquierda inferior a la derecha superior del gráfico.
Relación Negativa
En este caso, mientras los valores de
aumenta, los valores de
disminuyen. Podrías argumentar que la pendiente no es tan inclinada, lo que es verdad. Sin embargo, la tendencia general es evidente. Este gráfico se mueve desde la izquierda superior a la derecha inferior.
Sin relación
Algunas veces, no relación entre las variables. Los diagramas de dispersión de estas situaciones no mostrarán una tendencia. En otras palabras, parece que no hay un patrón definido con los puntos. No puedes ver que se tome ninguna dirección en particular.
Los diagramas de dispersión son útiles para encontrar la relación entre las variables ya que están ahí para hacer predicciones. Aquí, harás una línea de tendencia , o una línea que describe mejor los datos en un diagrama de dispersión ,para estimar las salidas incógnitas para las entradas dadas.
Una línea de tendencia es una línea recta que representa de mejor manera los puntos en un diagrama de dispersión. La línea de tendencia puede atravesar algunos puntos pero no necesariamente los atraviesa todos. La línea de tendencia se utiliza para mostrar los patrones de los datos. Esta línea de tendencia puede mostrar una tendencia positiva o una tendencia negativa. Sin embargo, si no hay relación, entonces no se podrá dibujar ninguna línea de tendencia de manera adecuada.
Tu línea de tendencia es tu mejor aproximación, por lo que debe ser diferente a la de los otros.
La línea en este gráfico es la línea de tendencia ; Es la línea que mejor describe los datos. Casi la mitad de los puntos deben en estar en algún lado de la línea.
Podrás notar que los valores atípicos son prácticamente ignorados mientras se dibuja la línea de tendencia. Esta línea de tendencia va desde la izquierda inferior hasta la derecha superior y muestra una relación positiva.
Fíjate que esta tendencia desciende e indica una correlación o relación negativa. También puedes ver que se pasa del gráfico. Por lo tanto, podemos usar un gráfica como esta para predecir la tendencia. Es como si la tendencia continuara descendiendo.
Utiliza lo aprendido para responder estas preguntas.
Ejemplo A
Si los datos no siguen un patrón, ¿Qué tipo de correlación describiría este diagrama de dispersión?
Solución: Sin Correlación
Ejemplo B
Si los datos ascienden en un patrón desde la base izquierda hasta la punta derecha, ¿qué tipo de correlación describirían estos datos?
Solución: Correlación Positiva
Ejemplo C
Si la distancia de un auto aumenta cuando su velocidad aumenta, ¿qué tipo de correlación tendrían los datos?
Solución: Correlación Positiva
Ahora, miremos otra vez el dilema que estaba al principio de esta Sección.
La tendencia de estos datos muestra que mientras la altura de los corredores aumenta, su tiempo disminuye, lo que significa que la persona que corre es más rápida. Por lo tanto, el Sr. Watson puede probar que sí hay una relación entre la altura y la velocidad.
Vocabulario
- Diagrama de Dispersión
- Un gráfico donde los valores correspondientes se ubican en un plano cartesiano y donde se puede determinar la relación entre los valores.
- Valor de entrada
-
El valor
Es el valor independiente.
- Valor de Salida
-
El valor
Es el valor dependiente.
- Correlación Positiva
- Un diagrama de dispersión donde los puntos graficados van hacia abajo de izquierda a derecha.
- Correlación Negativa
- Un diagrama de dispersión donde los puntos graficados van hacia abajo de izquierda a derecha.
- Sin Correlación
- Un diagrama de dispersión donde no está clara la relación entre los valores dependientes e independientes.
Práctica Guiada
Aquí hay un ejercicio para que trates tú mismo.
¿Qué tipo de relación muestran los datos?
Solución
Mientras una variable aumenta, la otra variable también lo hace.
Este diagrama de dispersión muestra una correlación positiva en los datos.
Revisión en Video
Haz clic en la imagen de arriba para ver más contenido. (requiere conexión a internet)
Scatterplots and Lines of Best Fit
*este video solo está disponible en inglés.Práctica
Instrucciones: ¿Qué tipo de relación se muestra en los siguientes diagramas de dispersión?
- Si los datos disminuyen cuando una variable aumenta, ¿Qué tipo de relación se muestra?
-
- Utiliza la siguiente tabla para hacer un diagrama de dispersión.
- Dibuja una línea de tendencia.
- Identifica el tipo de relación.
Una zoólogo estudió la relación entre los kilometres desde un lago y el número de felinos por 100 kilómetros cuadrados. Ella encontró los siguientes datos:
- Haz un diagrama de dispersión que ilustre estos datos.
- Dibuja una línea de tendencia.
- ¿Cuál es la correlación?
- Estima el número de felinos en 1,5 kilómetros desde el lago.
Instrucciones: Define los siguientes términos.
- Valor de entrada
- Valor de Salida
- Correlación Positiva
- Correlación Negativa
- Sin Correlación
- Conjunto de datos