8.2 Estimación de μ(s)

Suponemos que μ(s) es una función suave, continua que varía espacialmente. Podemos modelar μ(s) usando polinomios locales, splines o cualquier función de covariables y parámetros.

Las covariables pueden incluir las coordenadas geográficas y variables que expliquen la variabilidad espacial (por ejemplo, si analizamos contaminación del aire podemos usar temperatura o dirección del aire.)

Adicionalmente se pueden añadir otras covariables que contribuyan a explicar la variación en el proceso (por ejemplo, si estamos analizando concentración de contaminantes en el aire podemos incluir covariables como temperatura o dirección del viento).

Veamos un ejemplo donde se midió el pH del agua en 250 sitios.

Comenzamos con un análisis exploratorio:

  • Gráficas de los datos y de curvas de nivel nos pueden ayudar en la detección de atípicos espaciales.

  • Podemos explorar la dependencia espacial de μ(s) en las coordenadas geográficas graficando Y(si) contra las coordenadas, o si los datos están muestreados sobre una cuadrícula graficando la media y mediana de la fila contra el ínidce de la fila o columna.

Podemos modelar μ(s) como una función lineal de las covariables. Por ejemplo, si modelamos μ(s) como una función lineal únicamente de las coordenadas tenemos:

μ(s)=β0+β1sx+β2sy+β3sx2+β4sy2+β5sxsy

  • Cuando se utiliza un polinomio de las coordenadas geográficas es conveniente utilizar un polinomio completo, esto es, incluir todos los monomios de grado menor o igual al grado del polinomio. Esto garantiza que la superficie que ajustamos es invariante a la elección del origen y la orientación de las coordenadas (transformaciones lineales).

  • Es común centrar las coordenadas geográficas restando la media.

Supongamos que queremos modelar la tendencia espacial utilizando únicamente información de las coordenadas, sea X(s) un vector de tamaño p×1 que contiene la información geográfica. Entonces, para obtener una estimación provisional de la tendencia espacial de Y(s) podemos ajustar un modelo de regresión: Y(s)=μ(s)+ϵ(s)=X(s)Tβ+ϵ(s) donde ϵ(s) son iid. Notemos que si queremos incorporar otras covariables (además de información de las coordenadas), simplemente las añadimos a la matriz X(s).

Volvamos al ejemplo del ph del agua.