REGRESIÓN LINEAL SIMPLE

REGRESIÓN LINEAL SIMPLE

POR

 

GLORIA ARROYO CERVANTES

Y

  OSVALDO CAMACHO CASTILLO

 

Objetivos: Introducir la técnica de regresión lineal simple,  en la que para cada valor x de una variable no aleatoria -conocida como predictora,  regresora o independiente-,  interviene una variable aleatoria Yx, denominada variable respuesta o dependiente;  relacionadas, a través del  valor medio o esperado de la variable respuesta,  por la expresión
 


 

Regresión lineal simple.  Tiene como objetivo el estudiar cómo los cambios en una variable, no aleatoria, afectan a una variable aleatoria, en el caso de existir una relación funcional entre ambas variables que puede ser establecida por una expresión lineal, es decir,  su representación gráfica es una línea recta

 

Cuando la relación lineal concierne al valor medio o esperado de la variable aleatoria, estamos ante un modelo de regresión lineal simple. La respuesta aleatoria al valor x de la variable controlada se designa por Yx y, según lo establecido, se tendrá:

 

 

De manera equivalente, otra  formulación del modelo de regresión lineal simple sería:  si xi es un valor de la variable predictora e Yi la variable respuesta que le corresponde, entonces 

Ei es el error o desviación aleatoria de Yi

Estimación de los parámetros de la recta de regresión. El primer problema a abordar es obtener los estimadores de los parámetros de la recta de regresión,  partiendo de una muestra de tamaño n, es decir, n pares (x1, Y1) , (x2, Y2), ..., (xn, Yn); que representan nuestra intención de extraer para cada xi un individuo de la población o variable Yi

Una vez realizada la muestra, se dispondrá de n pares de valores o puntos del plano (x1, y1) , (x2, y2), ..., (xn, yn). El método de estimación aplicable en regresión, denominado de los mínimos cuadrados, permite esencialmente determinar la recta que "mejor" se ajuste o mejor se adapte a la nube de n puntos. Las estimaciones  de los parámetros de la recta de regresión obtenidas con este procedimiento son:

 

Por tanto la recta de regresión estimada será:

 

 

Un ejemplo. La recta de regresión representada corresponde a la estimación obtenida a partir de 20 pares de observaciones: x representa la temperatura fijada en un recinto cerrado e Y el ritmo cardíaco de un vertebrado.

 

Problema:
Se trata de encontrar la recta de regresión, junto con su gráfica, que mejor se ajuste o mejor aproxime los siguientes datos, de distintas temperaturas de un recinto cerrado y los correspondientes  ritmos cardiacos de una especie de lagarto:
 

temp. (ºC) 22 22 24 24 26 26 28 28 30 30 32 32 34 34 36 36 38 38 40 40
lat./minuto 20.8 22.3 24.1 25.6 25.7 27.2 27.3 28.8 29.4 31.9 32.4 33.8 32.8 34.1 32.4 37.9 38.0 36.5 39.0 41.0