La gente cree que la economía son grandes ideas de sobremesa: mercados, inflación, desigualdad.
Eso es el titular. Es la portada del libro.
La maquinaria real, la que le da sustancia y credibilidad a esas ideas, es la econometría. Es la disciplina que separa a los que hablan de los que demuestran.
Si la economía es el estudio de cómo la gente toma decisiones, la econometría es el detector de mentiras que usamos para ver si nuestras teorías sobre esas decisiones son ciertas o pura basura. Es la aplicación BRUTAL de la estadística a las preguntas económicas. Es donde el razonamiento verbal se calla y la evidencia cuantitativa empieza a hablar.
Pero no te confundas. La econometría no es un recetario de técnicas. Es una forma de pensar. Una forma rigurosa de enfrentarse a la incertidumbre, la causalidad y la validez de un modelo.
Bien hecha, le pone una correa a tus ideas y las obliga a caminar sobre la evidencia.
Mal hecha, es solo maquillaje para una mentira. Es darle un barniz estadístico a una afirmación sin fundamento.
Lo que sigue no son instrucciones técnicas. Son los compromisos fundamentales.
La constitución no escrita de la práctica empírica seria.
Estos son los 10 Mandamientos de la Econometría.
I. EMPEZARÁS CON UN MODELO TEÓRICO.
NO CORRAS UN SOLO MODELO SIN UNA TEORÍA.
Hacerlo es el equivalente a apretar botones en un software esperando un milagro.
Una regresión sin teoría es un ejercicio mecánico sin disciplina. Un modelo teórico, por simple que sea, te da estructura. Te dice qué variables importan, cuáles son ruido y qué esperas encontrar. Te da un mapa. Sin él, estás navegando a ciegas.
Piensa en la ecuación de Mincer:
$$ \log(\text{salario}_i) = \beta_0 + \beta_1 \cdot \text{educ}_i + \beta_2 \cdot \text{exp}i + \beta_3 \cdot \text{exp}i^2 + \varepsilon_i
$$
Esta ecuación no salió de la nada. Refleja un modelo de capital humano: la educación y la experiencia aumentan la productividad, pero con rendimientos decrecientes. Cada coeficiente (\beta) tiene una razón de ser. Estimar esto sin entender su base teórica lo reduce a un simple ejercicio de ajuste de curvas.
Sin teoría, tu modelo puede ser técnicamente correcto, pero conceptualmente HUECO.
II. CONOCERÁS TUS DATOS.
Los datos son el cimiento. Si el cimiento es débil, todo el edificio se derrumba.
Conocer tus datos significa saber de dónde vienen, cómo se midieron y qué limitaciones tienen. ¿Son autoinformados (mentiras potenciales) o administrativos (más fiables)? ¿Tu muestra es representativa o está sesgada?
Tratar los datos como números abstractos es como un cirujano operando sin saber la historia clínica del paciente. Es una negligencia. Míralos. Grafícalos. Interrógalos con estadísticas descriptivas ANTES de lanzar cualquier modelo complejo.
La econometría no es una caja negra. La familiaridad profunda con tus datos es lo que te ancla a la realidad.
III. HARÁS EXPLÍCITA TU ESTRATEGIA DE IDENTIFICACIÓN
La credibilidad de cualquier afirmación causal descansa AQUÍ. La estrategia de identificación es tu argumento de por qué la variación que usas para estimar tu efecto es "como si fuera aleatoria".
¿Estás usando un experimento natural? ¿Una variable instrumental? ¿Diferencias en Diferencias? Tienes que declararlo de frente y defender por qué tus supuestos son creíbles.
Sin esto, tus estimaciones son solo correlaciones con nombres elegantes. Basura.
La identificación es el puente entre la asociación estadística y la interpretación causal. Es la columna vertebral de tu inferencia.
Hazla explícita. SIEMPRE.
IV. RESPETARÁS EL TÉRMINO DE ERROR
El término de error no es una molestia a ignorar. Es una señal. Es todo lo que tu modelo no observa, no mide o no especifica bien. Su comportamiento determina si tus estimaciones son confiables o inútiles.
La suposición clave de MCO (OLS) es que tus variables son exógenas:
$$
E(\varepsilon_i | x{1i}, \dots, x{ki}) = 0.
$$
En español simple: todo lo que está en el término de error NO está correlacionado con tus variables explicativas.
Es un supuesto GIGANTE. Si se rompe (por variables omitidas, simultaneidad, etc.), tu estimador está sesgado.
Diagnostica tus residuos. Testea la heterocedasticidad. Piensa en lo que contiene tu término de error. No es ruido aleatorio.
Es la frontera entre lo que tu modelo explica y lo que ignora. Trátalo con respeto.
V. DESCONFIARÁS DE LA FORMA FUNCIONAL.
Cada vez que asumes una relación lineal, estás haciendo una apuesta GIGANTE: que el efecto marginal de tu variable es constante.
$$ y_i = \beta_0 + \beta_1 x_i + \varepsilon_i
$$ Esto asume que el efecto de \beta_1 es el mismo si x es pequeño o si es enorme.
A menudo, eso es una fantasía. El mundo real tiene rendimientos decrecientes, umbrales y no linealidades.
Usar un logaritmo cambia la interpretación de raíz. En
$$
\log(y_i) = \dots + \beta_1 x_i,
$$
\beta_1 es una semi-elasticidad.
En
$$
y_i = \dots + \beta_1 \log(x_i),
$$
es otra cosa. No son diferencias cosméticas, son teorías distintas.
Usa la teoría y la visualización de datos para guiar tu elección. Verifica si tus conclusiones dependen críticamente de una forma funcional específica. Nunca confundas una simplificación conveniente con una verdad estructural.
VI. NO CONFUNDIRÁS SIGNIFICANCIA ESTADÍSTICA CON IMPORTANCIA ECONÓMICA.
Un p-valor pequeño no es una medalla de oro. Solo te dice que tu efecto probablemente no es cero.
FELICIDADES. ¿Y QUÉ?
En muestras grandes, efectos minúsculos pueden ser "altamente significativos". Un coeficiente de 0.001 con un t-stat de 5.0 es estadísticamente significativo, pero económicamente podría ser una completa irrelevancia.
Concéntrate en la magnitud del efecto y en los intervalos de confianza. Pregúntate: ¿este tamaño de efecto cambia las decisiones en el mundo real?
El punto es aprender algo sobre la economía, no pasar un examen estadístico.
VII. TE PROTEGERÁS DEL SOBREAJUSTE (OVERFITTING).
Un modelo que lo explica todo en tu muestra, probablemente no explica NADA fuera de ella.
El sobreajuste ocurre cuando tu modelo es tan complejo que memoriza el ruido de tus datos en lugar de capturar la señal subyacente.
El R-cuadrado subirá, claro. Pero el modelo fallará miserablemente al predecir datos nuevos. Es un espejismo.
Usa la teoría para disciplinar qué variables incluyes. Usa validación cruzada (cross-validation) para evaluar el rendimiento predictivo. Resiste la tentación de añadir basura solo para cazar significancia.
La simplicidad no es debilidad; es fuerza bajo presión.
VIII. PROBARÁS LA ROBUSTEZ SIN PIEDAD.
Un resultado que solo aparece bajo una especificación única es un resultado frágil. Y un resultado frágil NO es un resultado.
Tus hallazgos deben sobrevivir al estrés. No es opcional, es ESENCIAL.
- Varía la especificación: ¿El efecto sobrevive si añades o quitas controles?
- Varía la muestra: ¿El resultado es impulsado por valores atípicos o un subgrupo particular?
- Varía el estimador: ¿Qué pasa si usas errores estándar robustos, efectos fijos o una variable instrumental?
Si tus conclusiones se desmoronan con una mínima presión, nunca fueron sólidas. La robustez revela la fuerza.
IX. NO ADORARÁS AL R-CUADRADO (R^2).
El R^2 es la métrica de vanidad por excelencia de la econometría. Mide la proporción de la varianza explicada, pero un R^2 alto NO implica causalidad, validez ni relevancia.
Puedes inflar el R^2 simplemente añadiendo basura a tu modelo. Un R^2 bajo puede ser perfectamente aceptable en modelos causales donde la identificación es sólida pero ruidosa.
No juzgues un modelo por su R^2. Júzgala por su capacidad para responder tu pregunta de forma creíble.
El objetivo es entender el proceso, no ajustar los datos perfectamente.
X. DISTINGUIRÁS SIEMPRE CORRELACIÓN DE CAUSALIDAD.
Este es el mandamiento final y el más importante. Si lo rompes, te conviertes en un charlatán.
Correlación es co-movimiento. Causalidad es el mecanismo que lo explica. NO SON INTERCAMBIABLES.
La inferencia causal exige una estrategia de identificación. Sin ella, no importa qué tan fuerte o significativa sea tu correlación, no puedes afirmar NADA sobre la causa. La política pública y las decisiones de negocio basadas en correlaciones espurias son una receta para el desastre.
Correlación no es causalidad. Reconócelo. Respétalo. Explícalo. Grábatelo a fuego.
Referencias
Este post está inspirado en esta publicación de Mike Kutch en Substack: https://open.substack.com/pub/mikekutsch/p/the-ten-commandments-of-econometrics?r=3p8ak3&utm_medium=ios