El cuarteto de Anscombe

El cuarteto de Anscombe es un conjunto de datos creados artificialmente para poner de manifiesto que a la hora de calcular una recta de regresión es fundamental, previamente, visualizar los datos con objeto de ver si se adecuan a un modelo lineal o no.

#INICIO -------------------------
rm(list=ls(all=TRUE))

#Cargamos el paquete datasets y leemos el conjunto de datos anscombe
library(datasets);anscombe;attach(anscombe)

#Generamos los cuatro modelos de regresión lineal
modelo1<-lm(y1~x1);modelo2<-lm(y2~x2);modelo3<-lm(y3~x3);modelo4<-lm(y4~x4)

#Obtenemos las rectas de regresión de los cuatro modelos
summary(modelo1);summary(modelo2);summary(modelo3);summary(modelo4)

#Gráficos de dispersión y rectas de regresión
par(mfrow=c(2,2))
plot(x1,y1, main="Modelo 1",pch=19)
abline(modelo1,col="red",lwd=2)
plot(x2,y2, main="Modelo 2",pch=19)
abline(modelo2,col="red",lwd=2)
plot(x3,y3, main="Modelo 3",pch=19)
abline(modelo3,col="red",lwd=2)
plot(x4,y4, main="Modelo 4",pch=19)
abline(modelo4,col="red",lwd=2)
#FIN -------------------------

Como se observa, los resultados correspondientes a las cuatro regresiones son prácticamente idénticos. Sin embargo, en las gráficas se aprecia con claridad la no adecuación de la regresión lineal a los tres últimos conjuntos de datos

No hay comentarios:

Publicar un comentario