REGRESIÓN LINEAL SIMPLE
POR
Y
Objetivos:
Introducir la técnica de regresión lineal simple,
en la que para cada valor x de una variable no aleatoria X
-conocida como predictora, regresora o
independiente-,
interviene una
variable aleatoria Yx, denominada
variable respuesta o dependiente;
relacionadas, a través del valor medio o esperado de la
variable respuesta, por
la expresión
|
Regresión lineal simple. Tiene como objetivo el estudiar cómo los cambios en una variable, no aleatoria, afectan a una variable aleatoria, en el caso de existir una relación funcional entre ambas variables que puede ser establecida por una expresión lineal, es decir, su representación gráfica es una línea recta.
Cuando la relación lineal concierne al valor medio o esperado de la variable aleatoria, estamos ante un modelo de regresión lineal simple. La respuesta aleatoria al valor x de la variable controlada se designa por Yx y, según lo establecido, se tendrá:

De manera equivalente, otra formulación del modelo de regresión lineal simple sería: si xi es un valor de la variable predictora e Yi la variable respuesta que le corresponde, entonces

Ei es el error o desviación aleatoria de Yi
Estimación de los parámetros de la recta de regresión. El primer problema a abordar es obtener los estimadores de los parámetros de la recta de regresión, partiendo de una muestra de tamaño n, es decir, n pares (x1, Y1) , (x2, Y2), ..., (xn, Yn); que representan nuestra intención de extraer para cada xi un individuo de la población o variable Yi .
Una vez realizada la muestra, se dispondrá de n pares de valores o puntos del plano (x1, y1) , (x2, y2), ..., (xn, yn). El método de estimación aplicable en regresión, denominado de los mínimos cuadrados, permite esencialmente determinar la recta que "mejor" se ajuste o mejor se adapte a la nube de n puntos. Las estimaciones de los parámetros de la recta de regresión obtenidas con este procedimiento son:
Por tanto la recta de regresión estimada será:

Un ejemplo. La recta de regresión representada corresponde a la estimación obtenida a partir de 20 pares de observaciones: x representa la temperatura fijada en un recinto cerrado e Y el ritmo cardíaco de un vertebrado.
|
Problema:
Se trata de encontrar la recta de regresión, junto con su gráfica, que mejor se
ajuste o mejor aproxime los siguientes datos, de distintas temperaturas de un
recinto cerrado y los correspondientes ritmos cardiacos de una especie de
lagarto:
| temp. (ºC) | 22 | 22 | 24 | 24 | 26 | 26 | 28 | 28 | 30 | 30 | 32 | 32 | 34 | 34 | 36 | 36 | 38 | 38 | 40 | 40 |
| lat./minuto | 20.8 | 22.3 | 24.1 | 25.6 | 25.7 | 27.2 | 27.3 | 28.8 | 29.4 | 31.9 | 32.4 | 33.8 | 32.8 | 34.1 | 32.4 | 37.9 | 38.0 | 36.5 | 39.0 | 41.0 |