Interpolación y extrapolación lineal
En esta Sección aprenderás cómo hacer inferencias de datos usando interpolación lineal y extrapolación lineal.
Supongamos que has graficado un número de puntos de datos en un plano cartesiano, con la coordenada
de cada punto representando el número de meses desde que plantaste un árbol, y la coordenada
de cada punto representando la altura del árbol en metros. Si tienes datos para 1 mes, 2 meses, 3 meses, y 4 meses, ¿crees que puedes adivinar cuál será el alto del árbol después de 5 meses? ¿Qué tal el alto del árbol a los 2,5 meses? Después de esta Sección serás capaz de hacer este tipo de suposiciones usando interpolación y extrapolación lineal.
Predicciones con modelos lineales
La información numérica aparece en todas las áreas de la vida. Puedes encontrarla en diarios, revistas, libros, en la televisión, o en la Internet. En la Sección de anterior viste cómo encontrar la ecuación de la recta más adecuada para un conjunto de datos. Usar una recta adecuada es un buen método si la relación entre variables dependientes e independientes es lineal. Sin embargo, no todos los datos caben en una línea recta. Esta Sección mostrará otros métodos que ayudan a estimar valores. Estos métodos son útiles tanto en relaciones lineales como no lineales.
Interpolación lineal
La interpolación lineal es útil cuando buscamos un valor entre puntos dados. Se puede considerar como "llenar los espacios" de una tabla de datos.
La estrategia para la interpolación lineal es usar una línea recta para conectar los datos conocidos a ambos lados del punto desconocido. La interpolación lineal es a menudo no precisa para datos no lineales. Si los puntos del conjunto de datos cambian en una gran cantidad, la interpolación lineal podría no dar un buen estimado.
Extrapolación lineal
La extrapolación lineal puede ayudarnos a estimar valores que son mayores o menores que los valores en un conjunto de datos. Piensa en esto como el "estimado a largo plazo" de los datos.
La estrategia para la extrapolación lineal es usar un subconjunto de datos en vez de todos los datos. Esto es especialmente cierto para los datos no lineales que encontrarás en lecciones posteriores. Para este tipo de datos, a veces es útil extrapolar usando los últimos dos o tres puntos de datos para estimar un valor más alto que el rango de datos.
Recolección y organización de datos
Se puede recolectar datos por varios medios, incluyendo encuestas o experimentos.
Una encuesta es un método de recolección de datos usado para reunir información sobre opiniones, creencias o hábitos individuales.
La información reunida por el Instituto Nacional de Estadísticas y Censos es un ejemplo de datos reunidos usando encuestas. El Instituto Nacional de Estadísticas y Censos reúne información sobre muchos aspectos de la población.
Un experimento es una prueba o investigación controlada.
Digamos que estamos interesados en cómo la edad media para los primeros matrimonios ha cambiado durante el siglo
. El Instituto Nacional de Estadísticas y Censos proporciona la siguiente información sobre la edad media del primer matrimonio para hombres y mujeres. A continuación está la tabla de datos y su diagrama de dispersión correspondiente.
| Año | Edad media de hombres | Edad media de mujeres |
|---|---|---|
| 1890 | 26.1 | 22.0 |
| 1900 | 25.9 | 21.9 |
| 1910 | 25.1 | 21.6 |
| 1920 | 24.6 | 21.2 |
| 1930 | 24.3 | 21.3 |
| 1940 | 24.3 | 21.5 |
| 1950 | 22.8 | 20.3 |
| 1960 | 22.8 | 20.3 |
| 1970 | 23.2 | 20.8 |
| 1980 | 24.7 | 22.0 |
| 1990 | 26.1 | 23.9 |
| 2000 | 26.8 | 25.1 |
Edad media de hombres y mujeres al contraer matrimonio por primera vez por año
Ejemplo A
Estima la edad media del primer matrimonio para un hombre en el año 1946. .
Solución:
Primero usaremos el método de interpolación porque hay un "espacio" que necesita ser llenado. 1946 está entre 1940 y 1950, por lo tanto éstos son los puntos que usaremos.
Al conectar estos dos puntos podemos encontrar una ecuación.
Para estimar la edad media de matrimonio en hombres en el año 1946, sustituye
en la ecuación.
Ejemplo B
Estimar la edad media de primer matrimonio de una mujer en el año 1968.
Solución:
Usa el método de interpolación para crear una recta que se aproxima a los valores entre 1960 y 1970, ya que 1968 está entre esos años. Usaremos los puntos (1960, 20.3) y (1970, 20.8) como dos puntos que definen una recta.
Para estimar la edad media de matrimonio de mujeres en el año 1968, sustituye
en la ecuación.
Cómo predecir usando una ecuación
Cuando la interpolación y extrapolación lineales no producen predicciones precisas, usar la recta más adecuada ( regresión lineal ) puede ser la mejor alternativa. Los métodos "a mano" y con calculadora para determinar la recta más adecuada fueron presentados en la Sección anterior.
Ejemplo C
La siguiente tabla muestra los records mundiales de tiempo de la carrera de 100 metros planos de mujeres. Estima el record mundial de tiempo para el año 2010. ¿Es este un buen estimado?
| Ganador | País. | Año | Segundos | Ganador | País. | Año | Segundos |
|---|---|---|---|---|---|---|---|
| Mary Lines | UK | 1922 | 12.8 | Vera Krepkina | Sov. | 1958 | 11.3 |
| Leni Schmidt | Germ. | 1925 | 12.4 | Wyomia Tyus | USA | 1964 | 11.2 |
| Gertrurd Glasitsch | Germ. | 1927 | 12.1 | Barbara Ferrell | USA | 1968 | 11.1 |
| Tollien Schuurman | Neth. | 1930 | 12.0 | Ellen Strophal | E. Germ. | 1972 | 11.0 |
| Helen Stephens | USA | 1935 | 11.8 | Inge Helten | W. Germ. | 1975 | 11.0 |
| Lulu Mae Hymes | USA | 1939 | 11.5 | Marlies Gohr | E. Germ. | 1982 | 10.9 |
| Fanny Blankers-Koen | Neth. | 1943 | 11.5 | Florence Griffith Joyner | USA | 1988 | 10.5 |
| Marjorie Jackson | Austr. | 1952 | 11.4 |
Solución:
Empieza por dibujar un diagrama de dispersión de los datos. Conecta los últimos dos puntos del gráfico y encuentra la ecuación de la recta.
Record mundial de tiempos para la carrera de 100 metros planos de mujeres
3 Source: http://en.wikipedia.org/wiki/World_Record_progression_100_m_women .
El tiempo record mundial estimado para el año 2010 es:
.
¿Qué tan precisa es esta estimación? Es probable que no sea muy precisa porque 2010 está muy lejos de 1988. Este ejemplo demuestra la debilidad de la extrapolación lineal. Los estimados dados por la extrapolación lineal no son nunca tan buenos como usar el método de la ecuación de la recta más adecuada. En este ejemplo en particular el último punto claramente no encaja en la tendencia general de los datos, por lo tanto la pendiente de la recta de extrapolación es mucha más abrupta de lo que debería ser.
Como nota histórica, el último punto de datos corresponde al record de Florence Griffith Joyner en 1988. Luego de su carrera ella fue acusada de usar drogas que mejoran el rendimiento, lo cual nunca fue probado. Además, hubo problemas con la precisión del tiempo porque algunos oficiales dijeron que no se consideró el tiempo de cola en esta carrera, aunque todas las otras carreras del día fueron disputadas con un fuerte viento en contra.
Video de Repaso
Haz clic en la imagen de arriba para ver más contenido (requiere conexión a internet)
*Este video solo se encuentra disponible en inglés
Haz clic en la imagen de arriba para ver más contenido (requiere conexión a internet)
*Este video solo se encuentra disponible en inglés
Práctica guiada
El Centro de Control de Enfermedades de los EE.UU. tiene la siguiente información organizada por años sobre el porcentaje de mujeres embarazadas fumadoras. Estima el porcentaje de mujeres embarazadas fumadoras en el año 1998. .
| Año | Porcentaje |
|---|---|
| 1990 | 18.4 |
| 1991 | 17.7 |
| 1992 | 16.9 |
| 1993 | 15.8 |
| 1994 | 14.6 |
| 1995 | 13.9 |
| 1996 | 13.6 |
| 2000 | 12.2 |
| 2002 | 11.4 |
| 2003 | 10.4 |
| 2004 | 10.2 |
Porcentaje de mujeres embarazadas fumadoras por año
Solución:
Queremos usar la información cercana a 1998 para interpolar los datos. Hacemos esto conectando los puntos en ambos lados de 1998 con una línea recta y encontramos la ecuación de esa recta.
Para estimar el porcentaje de mujeres embarazadas fumadoras en el año 1998 sustituimos
en la ecuación.
Práctica
El siguiente video muestra ejemplos con explicaciones de algunos de los ejercicios de práctica. Ten en cuenta que los números pueden diferir entre los ejercicios del video y los ejercicios listados a continuación. Sin embargo, el ejercicio de práctica es el mismo en ambos casos. CK-12 Basic Algebra: Predicting with Linear Models (11:46)
Haz clic en la imagen de arriba para ver más contenido (requiere conexión a internet)
*Este video solo se encuentra disponible en inglés
- ¿Qué significa interpolar los datos ? ¿En qué casos sería útil este método?
- ¿En qué se diferencian la interpolación y la extrapolación? ¿En qué casos sería más beneficiosa la extrapolación?
- ¿Cuál era el problema al usar el método de interpolación para encontrar una ecuación para el record mundial de tiempo en mujeres?
- Usa los datos de los record mundiales de tiempo y determina una ecuación para la recta más adecuada.
- Usa los datos de la edad media del primer matrimonio para estimar la edad de matrimonio para mujeres en 1946. Ajusta una recta, a mano, a los datos antes de 1970.
- Usa los datos de la edad media del primer matrimonio para estimar la edad de matrimonio para mujeres en 1984. Ajusta una recta, a mano, para los datos desde 1970 para estimar esto con precisión.
- Usa los datos de edad media del primer matrimonio para estimar la edad media me matrimonio para hombres en 1995. Utiliza interpolación lineal de los puntos entre 1990 y 2000.
- Usa los datos de mujeres embarazadas fumadoras para estimar el porcentaje de mujeres embarazadas fumadoras en 1997. Utiliza interpolación lineal de los puntos entre 1996 y 2000.
- Usa los datos de mujeres embarazadas fumadoras para estimar el porcentaje de mujeres embarazadas fumadoras en 2006. Utiliza extrapolación lineal con los dos últimos puntos de datos.
- Usa los datos de records mundiales de tiempo para estimar el record mundial de tiempo para la carrera de 100 metros de mujeres para 1920. Utiliza extrapolación lineal porque los primeros dos o tres puntos tienen una pendiente diferente al resto de los datos.
-
La tabla a continuación muestra la temperatura más alta vs. las horas de luz solar para el día
de cada mes en el año 2006 en San Diego, California. Estima la temperatura alta para un día con 13,2 horas de luz solar usando interpolación lineal.
| Horas de luz solar |
Temperatura alta
|
|---|---|
| 10.25 | 60 |
| 11.0 | 62 |
| 12 | 62 |
| 13 | 66 |
| 13.8 | 68 |
| 14.3 | 73 |
| 14 | 86 |
| 13.4 | 75 |
| 12.4 | 71 |
| 11.4 | 66 |
| 10.5 | 73 |
| 10 | 61 |
- Usa la tabla anterior para estimar la temperatura alta de un día con 9 horas de luz solar usando extrapolación lineal. ¿Es precisa esta predicción? Encuentra la respuesta usando una recta adecuada.