Tutorial para hacer efectos fijos en R

Errores más comunes y un paso a paso

Tutorial para hacer efectos fijos en R

Probablemente conoces modelos con datos en panel que mezclan geografía y tiempo.

Los datos en esos casos se ven algo así:

PaísAñoXY
México20211.5230
México20221.7242
Brasil20212.3345
Brasil20222.2370

Son fáciles de identificar porque:

  • Se repiten los países a través de todos los años.
  • Los países y el tiempo son variables por sí mismas que agrupan características no-observables.
  • El análisis involucra cómo cambia una variable en un país dado, año tras año.

Esta es una regresión en R de un modelo de panel usando efectos fijos:

library(plm)
# Datos de ejemplo
datos <- data.frame(
  pais = rep(c("México", "Brasil", "Argentina"), each = 10),
  año = rep(2010:2019, times = 3),
  inversion_educacion = c(runif(10, 4, 6), runif(10, 5, 7), runif(10, 3, 5)),
  rendimiento_escolar = c(runif(10, 450, 500), runif(10, 470, 520), runif(10, 430, 480))
)
# Convertir a panel
datos_panel <- pdata.frame(datos, index = c("pais", "año"))

# Modelo de efectos fijos
modelo_ef <- plm(rendimiento_escolar ~ inversion_educacion, data = datos_panel, model = "within")
summary(modelo_ef)

Más adelante explicamos todos los elementos. Por el momento nota que estamos usando una sintaxis muy similar a la que usaríamos en una regresión lineal con lm().

Aplicar este código es muy fácil. El único detalle que queda es entenderlo para saber cuándo y cómo usarlo.

Cuándo y cómo usar efectos fijos

No sólo hay datos en panel de países o regiones geográficas.

Los datos en panel se volvieron una forma muy popular para presentar los datos. El banco mundial te permite descargar bases de datos y acomodarlos directamente en un arreglo en panel, por ejemplo. Pero esa es una solución a un problema más viejo.

Se trata de agrupar características inobservables.

México y Perú son países diferentes [cita requerida]. A pesar de tener muchas similitudes, hay muchas características que los distinguen y que no se pueden medir tan fácilmente. Su cultura, sus leyes y su disputa por el primer lugar en quién tiene la mejor comida del planeta son sólo algunas características que los distinguen.

Son características que no siempre se pueden medir en números, pero sabemos que nos distinguen.

Lo interesante es que estas distinciones no sólo se pueden observar en países. También podríamos hacer una base de datos en panel con observaciones en el tiempo por empresa, por cliente o por individuo. Aquí estamos conjuntando todas las características que no observamos en una sola.

Por eso el estándar es llamarle individuo a cada una de estas variables características.

4 errores que cometen los econometristas novatos al usar modelos de efectos fijos

Con mucha pena te voy a contar que he cometido todos estos errores.

Y si me permites decirte, no importa que quien te lo señale sea un árbitro anónimo. Me puse rojo de vergüenza cuando me lo hicieron notar y me di cuenta.

No los vayas a cometer:

  1. Ignorar las variables invariantes en el tiempo. En ocasiones hay variables importantes para nuestro modelo, pero los datos disponibles no tienen mediciones en el tiempo. Si usamos un modelo de efectos fijos, todas esas variables que no varían en el tiempo se pierden cuando se hace la transformación within.
  2. Especificación incorrecta del modelo sin una razón teórica. Hay un modelo muy famoso para determinar si debemos usar modelo de efectos fijos o efectos aleatorios: la prueba de Hausman. Sin embargo, por si misma esta prueba no determina el tipo de modelo que se debe usar sin una justificación teórica.
  3. Sobreajuste con demasiados efectos fijos. Cuando te das cuenta de que incluir efectos fijos ayuda al ajuste del modelo, es fácil sentirnos tentados a incluir más, sin tener una justificación apropiada de los mismos.
  4. No considerar relaciones dinámicas. Hay algunas variables que por su naturaleza actúan con diferencias en el tiempo. Son los indicadores adelantados o rezagados. Aplicar efectos fijos en variables que tienen este tipo de relación dinámica en el tiempo es un error porque los efectos fijos son estáticos por naturaleza.

Guía paso a paso para usar modelos de efectos fijos

Vamos a trabajar con un conjunto de datos en panel para entender cómo aplicar un modelo de efectos fijos.

Descarga la siguiente base de datos y ejecuta el código que te daré a continuación.

¡Genial! Te has registrado exitosamente.

¡Bienvenido de vuelta! Has iniciado sesión correctamente.

Te has suscrito correctamente a Escribe tu primer paper de Economía.

¡Éxito! Revisa tu correo electrónico para obtener el enlace mágico para iniciar sesión.

¡Éxito! Se ha actualizado la información de facturación.

No se actualizó tu información de facturación.

Sígueme en Mastodon