Escribe tu primer paper de economía

Guías de 5 minutos para economistas ocupados para escribir (y publicar) su primer paper de economía usando datos y modelos de econometría.

Marionomics: Escribe tu paper de economía

Las redes sociales son granjas de atención

Las redes sociales son granjas de atención

Tengo mucho tiempo pensando en cómo las redes sociales viven de nuestra atención.

Y no quiero ponerme muy filosófico, pero en cierto modo, nuestra vida no está hecha más que de nuestra atención.

Somos sólo los momentos que vivimos. Es como esa vieja pregunta de que si un árbol cae en medio del bosque y no hay nadie para escucharlo, ¿realmente hizo ruido? Porque aunque físicamente si se haya generado ese ruido, ¿qué más da?

Nadie está pensando en los huracanes en Júpiter en este momento. Daría igual si se producen o no.

Pero estos pensamientos tienen consecuencias más graves cuando los contrastamos con la forma en que las empresas extraen valor de sus trabajadores de acuerdo a Marx. Esta es la primera vez que directamente intento escribir algo relacionado con Marx, y personalmente me considero que no lo conozco o entiendo lo suficiente, así que si digo algo que no es correcto ténganme paciencia (y de preferencia me contestan este correo).

Marx y la transformación del trabajo en un commodity (plusvalor)

Mi punto es este: para las empresas que manejan las redes sociales, nuestra atención individual es solo un número que en sí mismo no vale tanto. Lo que para nosotros lo es todo, para ellos sólo es un punto en un dataset enorme que ellos entrenan en un algoritmo.

Como contexto, el negocio de las redes sociales es que ellos venden nuestra atención y ganan dinero por ese espacio publicitario.

Es un negocio muy lucrativo porque esa atención está ya curada y quienes se anuncian por redes sociales saben que sus anuncios les llegarán a quienes tienen más probabilidades de realmente ser compradores. Cada click, cada scroll, cada pausa, cada segundo que te quedas viendo, el algoritmo entiende mejor y mejor quién eres y aprende qué tipo de anuncios te van a interesar más.

Hay una empresa pagando centavos de dólar por ese segundo que te quedaste viendo un anuncio.

Y si tú te quieres salir de ese juego, no importa, hay millones más como tú

Voy a defender a Marx con un argumento de libre mercado: si seguimos hablando de él es porque hay mercado para sus ideas.

De forma más concreta: con sólo mencionar su nombre, las redes saben que este mensaje debe ir a ciertas personas dispuestas a comentar (para bien y para mal). Las redes no quieren que seas feliz: quieren lucrar con tu atención.

Irónicamente, eso es algo muy parecido a la forma en que Marx describe que las empresas extraen el plusvalor (surplus) de nuestro trabajo. Solo que en vez de nuestro trabajo, lo hacen con nuestra atención. Esas 8 horas de atención que venden como espacio publicitario para nosotros lo es todo, pero para las empresas que manejan las redes son apenas unos centavos. Tu atención pasa por la máquina y se transforma en un commodity, empaquetado dentro de un modelo de predicción.

Te puedes salir de las redes, pero eso no importa. Ya tienen millones como tú alimentando el modelo y pasando horas interminables cada día en el doomscroll infinito, regalando su información a cambio de un poco de entretenimiento. Por eso invierten tanto dinero haciendo que pases cada vez más tiempo con tus ojos en la pantalla, aún cuando el resultado sea malo para tu salud mental.

Mi entendimiento de Marxismo es limitado

Estoy tratando de aprender más del tema porque es muy interesante y realmente da un entendimiento más profundo del mundo.

Aunque para ser honestos, tal vez debería quedarme en el terreno de las matemáticas y los datos, que es donde está mi fuerte. Tengo una plataforma donde estoy juntando los cursos que estoy desarrollando. Los míos van de econometría, datos y programación para economistas, y para los demás temas que yo personalmente no domino estoy invitando a profesores y economistas increíbles de todas partes.

Actualmente estoy trabajando en los cursos de:

  • Microeconomía Aplicada.
  • Investigación de operaciones con Python e IA.

Que son los cursos que doy en la universidad. Adicionalmente, puedes encontrar ahí el curso del Reto Banxico 2025, que conjunta ponencias de ponentes de todo el país relevantes para escribir un documento para participar en un concurso de política monetaria. Ahí viene desde cómo usar la API de Banxico usando Python hasta consejos para escribir un artículo de economía.

Sigue este enlace para conocer la plataforma

Nos vemos ahí.

La Investigación de Operaciones necesita un push-up

La Investigación de Operaciones necesita un push-up

¡Hola!

Esta semana comienzo mi curso de Investigación de Operaciones en la Universidad. Llevo ya un año dando esa clase y desde el inicio me di cuenta de que le hacía falta una actualización. No tiene caso estar enseñando a resolver problemas que una computadora puede solucionar mejor que el alumno (y que el maestro, por cierto).

Lo más lógico era agregar ejercicios para resolverse con un lenguaje de programación, pero eso no era suficiente en la era de la Inteligencia Artificial.

Veo tres grandes mejoras que la literatura en investigación de operaciones requiere urgentemente:

  • El uso integral de programación en Python. Python es un lenguaje de programación muy versátil. Todos los problemas de Investigación de Operaciones (IO) se pueden resolver usando Python.
  • El uso de la IA para el planteamiento de los problemas.
  • Un panorama ético del uso de la IO.

Veamos a fondo…

No se puede aprender ni enseñar Investigación de Operaciones sin un lenguaje de programación

El salón asignado por default para mi clase de investigación de operaciones no tiene computadoras.

Para mi este es un indicador de que en ningún momento se dejó previsto que esa clase debería de asignarse en un laboratorio, con computadoras y con el uso de lenguajes de programación. Siempre a mitad de clase nos acabamos moviendo al laboratorio porque aprender IO sin usar un lenguaje de programación no tiene mucho sentido.

Esta es mi lógica:

  • No hay razón para pasar horas y horas resolviendo problemas que una computadora puede hacer mejor que nosotros. Aclaro que yo personalmente considero resolver ejercicios matemáticos una especie de gimnasia mental y un fin en sí mismo, pero si lo que queremos es aprender a resolver problemas de IO, entonces nos tenemos que enfocar en la forma más eficiente de resolverlos.
  • ¿Por qué Python? Si vamos a delegar el trabajo de análisis a la computadora, debemos de elegir nuestra herramienta de trabajo. Python tiene muchas ventajas: todo lo que quieras hacer de IA lo puedes hacer en Python, que también se puede usar en muchas otras cosas.

Usar IA para el planteamiento de los problemas en lenguaje matemático

El objetivo de la IO es tomar mejores decisiones.

Para entender lo que significa “mejores decisiones” requerimos ahondar en lo que queremos decir por “mejores”. En general nos referimos a decisiones que son óptimas en un sentido matemático, y eso es algo que las máquinas suelen hacer mejor que las personas.

Es mejor aprender a delegar.

  • Los modelos de IA tradicionales nos pueden ayudar. Se trata de aprender a integrar los modelos de optimización a procesos que son manejados por máquinas.
  • Y claro, en ocasiones eso incluye a los modelos de lenguaje grande (LLM) como chatGPT. Antes, encontrar la forma correcta de plantear un modelo requería de mucha experiencia. Ahora sólo requiere un conocimiento más superficial.
  • Por esa razón, vale la pena hacer las clases de IO más enfocadas a que los alumnos conozcan muchos modelos y el tipo de problemas que pueden solucionar con ellos. Le pasan el trabajo del planteamiento a una IA y lo automatizan con otro tipo de IA

Necesitamos una visión más ética de la IO

En ningún momento los libros de IO ponen en contexto los objetivos que estamos maximizando.

Como diría el Dr. Ian Malcolm en la película de Jurassic Park:

Tus científicos estaban tan preocupados en si podían, que no se detuvieron a preguntarse si deberían.

El hecho de que exista un método para maximizar el número de horas que un usuario de la red social pasa en la plataforma, no significa que deberíamos aplicarlo. A primera vista, parece que estoy tratando de forzar una visión moral a algo que podría vivir de manera independiente, pero incorporar una visión ética no se trata únicamente de pregonar, de limitar los objetivos o de meter variables.

Veo al menos dos formas en las que incorporar una visión ética modifica los modelos de IO:

  • Incorporar externalidades no se trata simplemente de limitar las restricciones. Por ejemplo, si queremos optimizar la producción en una fábrica que contamina, debemos incorporar el daño que se causa al medio ambiente y los mecanismos para repararlo dentro de nuestro cálculo de optimización. Así sea de manera voluntaria u obligatoria.
  • Puede llegar a ser imposible agregar preferencias en un modelo cuando tiene 3 o más agentes. El teorema de imposibilidad de Arrow implica que, si queremos planear un viaje entre tres personas, pero uno quiere reposar en la playa lo más posible, otro quiere conocer el mayor número de restaurantes y el siguiente quiere optimizar su experiencia en la vida nocturna, probablemente eso cambia mucho la forma de plantear el problema.

Imagina eso, pero para resolver problemas sociales, donde entra una fábrica, el medio ambiente, el gobierno, las comunidades, etc.

Si es difícil de resolver con matemáticas, sin ellas será imposible.

Este es el inicio de una serie nueva de IO

Un breve anuncio: Este verano estuve haciendo modificaciones al newsletter para mejorarlo mucho.

Ahora la suscripción de pago viene junto con una plataforma, donde subiré cursos.

Hay dos cursos con los que comenzaré: Microeconomía Aplicada e Investigación de Operaciones. Ya está cargado un curso de política monetaria con invitados especiales de todo el país.

Entra a la plataforma aquí

PS: Si ya tienes tu suscripción premium y no tienes acceso a Skool, no tienes que pagar doble: avísame y te doy acceso.

PS2: El acceso está en 5 usd en Skool y tendrá el mismo precio aquí. ¡Pero es por tiempo limitado! El precio subirá a 7 usd al llegar a los 200 suscriptores y seguirá subiendo hasta llegar a 20 usd al mes. ¿Por qué? Porque este es el arranque de una plataforma de actualización para economistas. Yo estaré trabajando los temas de econometría, pero seguiré invitando a economistas importantes de todo el país.

Los 10 mandamientos de la econometría

Los 10 mandamientos de la econometría

La gente cree que la economía son grandes ideas de sobremesa: mercados, inflación, desigualdad.

Eso es el titular. Es la portada del libro.

La maquinaria real, la que le da sustancia y credibilidad a esas ideas, es la econometría. Es la disciplina que separa a los que hablan de los que demuestran.

Si la economía es el estudio de cómo la gente toma decisiones, la econometría es el detector de mentiras que usamos para ver si nuestras teorías sobre esas decisiones son ciertas o pura basura. Es la aplicación BRUTAL de la estadística a las preguntas económicas. Es donde el razonamiento verbal se calla y la evidencia cuantitativa empieza a hablar.

Pero no te confundas. La econometría no es un recetario de técnicas. Es una forma de pensar. Una forma rigurosa de enfrentarse a la incertidumbre, la causalidad y la validez de un modelo.

Bien hecha, le pone una correa a tus ideas y las obliga a caminar sobre la evidencia.

Mal hecha, es solo maquillaje para una mentira. Es darle un barniz estadístico a una afirmación sin fundamento.

Lo que sigue no son instrucciones técnicas. Son los compromisos fundamentales.

La constitución no escrita de la práctica empírica seria.

Estos son los 10 Mandamientos de la Econometría.

I. EMPEZARÁS CON UN MODELO TEÓRICO.

NO CORRAS UN SOLO MODELO SIN UNA TEORÍA.

Hacerlo es el equivalente a apretar botones en un software esperando un milagro.

Una regresión sin teoría es un ejercicio mecánico sin disciplina. Un modelo teórico, por simple que sea, te da estructura. Te dice qué variables importan, cuáles son ruido y qué esperas encontrar. Te da un mapa. Sin él, estás navegando a ciegas.

Piensa en la ecuación de Mincer:

$$ \log(\text{salario}_i) = \beta_0 + \beta_1 \cdot \text{educ}_i + \beta_2 \cdot \text{exp}i + \beta_3 \cdot \text{exp}i^2 + \varepsilon_i

$$

Esta ecuación no salió de la nada. Refleja un modelo de capital humano: la educación y la experiencia aumentan la productividad, pero con rendimientos decrecientes. Cada coeficiente (\beta) tiene una razón de ser. Estimar esto sin entender su base teórica lo reduce a un simple ejercicio de ajuste de curvas.

Sin teoría, tu modelo puede ser técnicamente correcto, pero conceptualmente HUECO.

II. CONOCERÁS TUS DATOS.

Los datos son el cimiento. Si el cimiento es débil, todo el edificio se derrumba.

Conocer tus datos significa saber de dónde vienen, cómo se midieron y qué limitaciones tienen. ¿Son autoinformados (mentiras potenciales) o administrativos (más fiables)? ¿Tu muestra es representativa o está sesgada?

Tratar los datos como números abstractos es como un cirujano operando sin saber la historia clínica del paciente. Es una negligencia. Míralos. Grafícalos. Interrógalos con estadísticas descriptivas ANTES de lanzar cualquier modelo complejo.

La econometría no es una caja negra. La familiaridad profunda con tus datos es lo que te ancla a la realidad.

III. HARÁS EXPLÍCITA TU ESTRATEGIA DE IDENTIFICACIÓN

La credibilidad de cualquier afirmación causal descansa AQUÍ. La estrategia de identificación es tu argumento de por qué la variación que usas para estimar tu efecto es "como si fuera aleatoria".

¿Estás usando un experimento natural? ¿Una variable instrumental? ¿Diferencias en Diferencias? Tienes que declararlo de frente y defender por qué tus supuestos son creíbles.

Sin esto, tus estimaciones son solo correlaciones con nombres elegantes. Basura.

La identificación es el puente entre la asociación estadística y la interpretación causal. Es la columna vertebral de tu inferencia.

Hazla explícita. SIEMPRE.

IV. RESPETARÁS EL TÉRMINO DE ERROR

El término de error no es una molestia a ignorar. Es una señal. Es todo lo que tu modelo no observa, no mide o no especifica bien. Su comportamiento determina si tus estimaciones son confiables o inútiles.

La suposición clave de MCO (OLS) es que tus variables son exógenas:

$$

E(\varepsilon_i | x{1i}, \dots, x{ki}) = 0.

$$

En español simple: todo lo que está en el término de error NO está correlacionado con tus variables explicativas.

Es un supuesto GIGANTE. Si se rompe (por variables omitidas, simultaneidad, etc.), tu estimador está sesgado.

Diagnostica tus residuos. Testea la heterocedasticidad. Piensa en lo que contiene tu término de error. No es ruido aleatorio.

Es la frontera entre lo que tu modelo explica y lo que ignora. Trátalo con respeto.

V. DESCONFIARÁS DE LA FORMA FUNCIONAL.

Cada vez que asumes una relación lineal, estás haciendo una apuesta GIGANTE: que el efecto marginal de tu variable es constante.

$$ y_i = \beta_0 + \beta_1 x_i + \varepsilon_i

$$ Esto asume que el efecto de \beta_1 es el mismo si x es pequeño o si es enorme.

A menudo, eso es una fantasía. El mundo real tiene rendimientos decrecientes, umbrales y no linealidades.

Usar un logaritmo cambia la interpretación de raíz. En

$$

\log(y_i) = \dots + \beta_1 x_i,

$$

\beta_1 es una semi-elasticidad.

En

$$

y_i = \dots + \beta_1 \log(x_i),

$$

es otra cosa. No son diferencias cosméticas, son teorías distintas.

Usa la teoría y la visualización de datos para guiar tu elección. Verifica si tus conclusiones dependen críticamente de una forma funcional específica. Nunca confundas una simplificación conveniente con una verdad estructural.

VI. NO CONFUNDIRÁS SIGNIFICANCIA ESTADÍSTICA CON IMPORTANCIA ECONÓMICA.

Un p-valor pequeño no es una medalla de oro. Solo te dice que tu efecto probablemente no es cero.

FELICIDADES. ¿Y QUÉ?

En muestras grandes, efectos minúsculos pueden ser "altamente significativos". Un coeficiente de 0.001 con un t-stat de 5.0 es estadísticamente significativo, pero económicamente podría ser una completa irrelevancia.

Concéntrate en la magnitud del efecto y en los intervalos de confianza. Pregúntate: ¿este tamaño de efecto cambia las decisiones en el mundo real?

El punto es aprender algo sobre la economía, no pasar un examen estadístico.

VII. TE PROTEGERÁS DEL SOBREAJUSTE (OVERFITTING).

Un modelo que lo explica todo en tu muestra, probablemente no explica NADA fuera de ella.

El sobreajuste ocurre cuando tu modelo es tan complejo que memoriza el ruido de tus datos en lugar de capturar la señal subyacente.

El R-cuadrado subirá, claro. Pero el modelo fallará miserablemente al predecir datos nuevos. Es un espejismo.

Usa la teoría para disciplinar qué variables incluyes. Usa validación cruzada (cross-validation) para evaluar el rendimiento predictivo. Resiste la tentación de añadir basura solo para cazar significancia.

La simplicidad no es debilidad; es fuerza bajo presión.

VIII. PROBARÁS LA ROBUSTEZ SIN PIEDAD.

Un resultado que solo aparece bajo una especificación única es un resultado frágil. Y un resultado frágil NO es un resultado.

Tus hallazgos deben sobrevivir al estrés. No es opcional, es ESENCIAL.

  • Varía la especificación: ¿El efecto sobrevive si añades o quitas controles?
  • Varía la muestra: ¿El resultado es impulsado por valores atípicos o un subgrupo particular?
  • Varía el estimador: ¿Qué pasa si usas errores estándar robustos, efectos fijos o una variable instrumental?

Si tus conclusiones se desmoronan con una mínima presión, nunca fueron sólidas. La robustez revela la fuerza.

IX. NO ADORARÁS AL R-CUADRADO (R^2).

El R^2 es la métrica de vanidad por excelencia de la econometría. Mide la proporción de la varianza explicada, pero un R^2 alto NO implica causalidad, validez ni relevancia.

Puedes inflar el R^2 simplemente añadiendo basura a tu modelo. Un R^2 bajo puede ser perfectamente aceptable en modelos causales donde la identificación es sólida pero ruidosa.

No juzgues un modelo por su R^2. Júzgala por su capacidad para responder tu pregunta de forma creíble.

El objetivo es entender el proceso, no ajustar los datos perfectamente.

X. DISTINGUIRÁS SIEMPRE CORRELACIÓN DE CAUSALIDAD.

Este es el mandamiento final y el más importante. Si lo rompes, te conviertes en un charlatán.

Correlación es co-movimiento. Causalidad es el mecanismo que lo explica. NO SON INTERCAMBIABLES.

La inferencia causal exige una estrategia de identificación. Sin ella, no importa qué tan fuerte o significativa sea tu correlación, no puedes afirmar NADA sobre la causa. La política pública y las decisiones de negocio basadas en correlaciones espurias son una receta para el desastre.

Correlación no es causalidad. Reconócelo. Respétalo. Explícalo. Grábatelo a fuego.

Referencias

Este post está inspirado en esta publicación de Mike Kutch en Substack: https://open.substack.com/pub/mikekutsch/p/the-ten-commandments-of-econometrics?r=3p8ak3&utm_medium=ios

[minicurso] Descarga e instala R y RStudio

Recientemente tuve que formatear mi computadora y con ella se me fueron todos los programas que había estado usando frecuentemente.

Incluídos R y RStudio.

Así que decidí aprovechar y hacer un pequeño tutorial para descargarlo e instalarlo. Son sólo 2 minutos y 3, respectivamente.

Espero que te sean de utilidad.

Descargar R y Rstudio

Instalar R y RStudio

La revolución dentro de la revolución

La revolución dentro de la revolución

¡Hola!

Esta es la última parte de esta serie sobre la revolución de la credibilidad.

En cierto modo, con esto terminaría el primer capítulo de mi segundo libro. Es la parte en la que más batallé, porque es la que conecta el capítulo 1 con el resto del libro.

La idea es esta: No hay un libro de Diferencias en Diferencias en español porque es un área que está avanzando muy rápido en los últimos años, pero es algo en lo que yo creo que no nos podemos quedar atrás en otras partes del mundo. Es demasiado importante: es la forma en la que estamos evaluando nuestros programas y debemos poder hacerlo bien.

Así que esta es mi forma de avanzar en ese frente 10x más rápido. En lugar de que empecemos a ver libros al respecto en 10 años, estamos viendo los avances por partes HOY. Con tu apoyo, claro está.

Anyway... Me tardé un poco más de lo esperado en esta parte porque no lograba llegar al punto. Pero si algo te puedo decir es que esta es la mejor explicación en español o en inglés que he visto sobre los avances de DD. Es el atajo para estar en la línea junto con los econometristas más avanzados DEL MUNDO. No estoy exagerando: realmente lo creo.

Disfruta.


Los métodos de Diferencias en Diferencias han cambiado mucho desde los tiempos del estudio de David Card en Miami.

El problema surgió porque investigadores en el área de econometría se han dedicado a hacerle ingeniería inversa a los estimadores y han encontrado complejidades adicionales a algo que parecía muy sencillo e intuitivo. El modelo 2x2 que discutimos anteriormente es uno de los más populares para hacer investigación aplicada. Casi una tercera parte de los artículos de economía aplicada en el NBER de los últimos años usaron Diferencias en Diferencias (Goldsmith-Pinkham, 2024).

Pues resulta que Diferencias en Diferencias ni es simple, ni es intuitivo, ni es tan fácil de entender como al inicio parece.

Sumado a esto, la profesión de economista ha pasado de ser sólo teoría a una disciplina empírica (Hamermesh, 2013), por lo que las herramientas para la evaluación econométrica creíble sigue y seguirá creciendo.

Pero lo más importante: los datos no siempre se ajustan al modelo canónico. Por eso es necesario adaptar los modelos para que se puedan aplicar a la realidad.

Roth, et al. (2023) identifican tres diferentes formas en las que se relajan los supuestos estándar del modelo de Diferencias en Diferencias:

  • Múltiples periodos y variación en el periodo de tratamiento.
  • Posibles violaciones al supuesto de las tendencias paralelas.
  • Se separan del supuesto de observar a una muestra de muchos clusters independiente que se toman de una super-población.

Son estas las desviaciones que han hecho que la discusión se haya enriquecido tan fuertemente en los últimos años —y que entrar en el mundo de las diferencias en diferencias se convierta en una confusión. Rápidamente dejamos atrás el mundo en el que hacer DD era un proceso sencillo que sólo se trataba de encontrar un buen experimento natural y aplicar un modelo de efectos fijos de dos vías.

Esto es bueno y malo.

Bueno, porque ahora podemos usar DD para situaciones más complejas con múltiples periodos y relajando los supuestos canónicos de tendencias paralelas. Malo porque tenemos que ser más cuidadosos al momento de estimar nuestros errores estándar.

Este es un newsletter que trata de ciencia económica. En particular: econometría.

La econometría no es lo mismo que la ciencia de datos: es un área especial especializada en los datos económicos. Yo soy de la idea de que si eres economista, vale mucho la pena que aprendas a fondo la econometría y que te posiciones como econometrista, no como data scientist.

En los últimos años la econometría ha evolucionado y dejó de ser las recetas de cocina de los libros de texto de los 80s y se convirtió en un área completa de estudio con sus técnicas de inferencia causal propias. La diferencia está en el enfoque, que plantea pensar en experimentos y de ahí crear la estrategia de identificación.

En esta serie estaremos hablando de esta revolución de la credibilidad, incluyendo cómo evitar el sesgo de selección y cómo encontrar experimentos naturales. Es la primera serie que nos llevará a profundizar en el modelo de diferencias en diferencias, que es uno de los modelos de más crecimiento en los últimos años.

Su popularidad ha crecido mucho porque permite tener estudios con mucho valor y muchas credibilidad (sin todo el presupuesto que requiere hacer experimentos).

Así que, si es de tu interés aprender esta técnica, te veo en el resto de las publicaciones de esta serie.

¿Qué hay debajo del paywall? En esta edición:

  • La mejor explicación que jamás has visto sobre cómo funciona DD moderno (lo sé porque yo mismo jamás lo había entendido hasta ahora).
  • Todas las referencias que estoy usando.
  • Y este es el post que conecta toda la serie y que le da razón de ser a mi segundo libro de econometría sobre Diferencias en Diferencias.

Además, con tu acceso se abre el acceso a todas mis publicaciones de pago. Pasadas y futuras.

PS: Te dejé un periodo de prueba de 7 días para que puedas verlas.

Obtener mi prueba gratis

Múltiples periodos y variación en el tiempo de tratamiento

Para hacer un modelo de DD 2x2 solamente necesitas un antes y un después.

Pero la realidad es más sucia.

Las políticas no se implementan para todos al mismo tiempo. Un estado adopta una ley en 2010, otro en 2012, y un tercero en 2015. Esto se conoce como tratamiento escalonado (staggered adoption).

La reacción natural de cualquier economista fue decir: "¡Más datos! ¡Mejor!". Y aplicar el mismo modelo de siempre: una regresión con efectos fijos de dos vías (TWFE, por sus siglas en inglés). Parecía lógico. Controlas por unidades (estados) y por tiempo (años) y dejas que la variable de tratamiento te dé la respuesta.

ERROR.

Aquí es donde la "revolución" explotó. Investigadores como Goodman-Bacon (2018) y de Chaisemartin & D'Haultfoeuille (2019) metieron las manos en el motor del TWFE y descubrieron algo espantoso.

El estimador TWFE, cuando hay tratamiento escalonado, es un promedio ponderado de todas las posibles comparaciones 2x2 que puedes hacer con tus datos. El problema es que algunas de esas ponderaciones son NEGATIVAS.

¿Qué significa esto? Significa que el modelo empieza a hacer comparaciones que no tienen ningún sentido. En particular, empieza a usar a las unidades que YA FUERON TRATADAS como grupo de control para las unidades que se tratan después.

Piensa en lo absurdo que es eso. Estás usando un grupo cuyo resultado ya está afectado por la política para medir el efecto de esa misma política en otro grupo. Es como intentar medir la estatura de alguien usando una regla que se encoge.

La consecuencia es brutal: si los efectos del tratamiento no son iguales para todos y a lo largo del tiempo (y NUNCA lo son), estas ponderaciones negativas pueden contaminar tu resultado. Puedes obtener un efecto negativo cuando todos los efectos reales son positivos. O puedes obtener un efecto cero cuando en realidad hay un impacto enorme.

Tu modelo te está mintiendo a la cara.

Es como el chiste de los tres econometristas. Uno dispara a la derecha, otro a la izquierda, y el tercero grita "¡Le dimos!". El estimador TWFE es ese tercer economista.

La solución fue dejar de usar al tercer economista.

Investigadores como Callaway & Sant’Anna (2018), Sun & Abraham (2018), Borusyak, Jaravel, & Spiess (2024) y Gardner (2022) crearon nuevos estimadores que son más inteligentes. En lugar de promediar todo a lo loco, estos métodos identifican las comparaciones "limpias" (tratados vs. nunca tratados, o tratados vs. aún no tratados) y descartan las comparaciones "sucias" (las que generan ponderaciones negativas).

El resultado es una estimación del efecto del tratamiento en la que sí puedes confiar.

Tendencias no-paralelas

El supuesto clave de CUALQUIER modelo de Diferencias en Diferencias es el de tendencias paralelas. La idea es que, si no hubiera habido tratamiento, el grupo de tratamiento y el de control se habrían comportado de la misma manera.

$$ E[Y_{g_1,2}(0) - Y_{g_1,1}(0)] = E[Y_{g_0,2}(0) - Y_{g_0,1}(0)] $$

Gráficamente, sus líneas de tendencia son paralelas antes del tratamiento. Si no lo son, todo el modelo se derrumba. Tu grupo de control no sirve para nada y tus resultados son basura.

Pero, ¿qué pasa si las tendencias no son perfectamente paralelas? ¿Tiramos todo a la basura?

No necesariamente. Aquí es donde entran los métodos más sofisticados.

El más conocido es Diferencias en Diferencias Sintético (Arkhangelsky et al., 2021). La idea es brillante en su simplicidad: si no puedes encontrar un buen grupo de control, ¡constrúyelo!

En lugar de comparar tu unidad tratada con el promedio simple de todas las unidades no tratadas, el método sintético crea un "clon" de tu unidad tratada. Lo hace buscando una combinación ponderada de unidades de control que replique la tendencia pre-tratamiento de tu unidad tratada. Esencialmente, construyes un contrafactual casi perfecto.

Este método es increíblemente poderoso porque te permite ser creíble incluso cuando no tienes un grupo de control obvio.

Es la respuesta para cuando la realidad no te da un experimento natural limpio en bandeja de plata.

Supuestos alternativos en el muestreo

Este punto es más técnico, pero igual de importante. Se trata de cómo calculas tus errores estándar.

Un error estándar te dice cuánta confianza puedes tener en tu estimación. Un error estándar pequeño significa que estás bastante seguro; uno grande significa que tu resultado podría ser pura suerte.

Los métodos clásicos asumen cosas muy convenientes sobre tus datos: que tienes muchos grupos, que son independientes entre sí, etc. Pero en muchas aplicaciones, especialmente en políticas públicas, tienes pocos grupos tratados (a veces solo uno) y los errores pueden estar correlacionados de formas extrañas.

Si calculas mal tus errores estándar, tus p-values y tus intervalos de confianza son inútiles. Podrías estar publicando un artículo sobre un efecto "estadísticamente significativo" que en realidad es solo ruido. ES UNA DE LAS FORMAS MÁS FÁCILES DE ENGAÑARSE A SÍ MISMO.

La literatura moderna de DD ha puesto un énfasis enorme en esto. Los nuevos paquetes de software para estimadores como los de Callaway & Sant’Anna no solo te dan una estimación robusta del efecto, sino que también implementan procedimientos (como el bootstrap) para calcular errores estándar que son válidos en una gama mucho más amplia de escenarios.

La lección es clara: no basta con obtener el coeficiente correcto. Tienes que saber cuán preciso es ese coeficiente. Ignorar la estructura de tus datos al calcular la incertidumbre es negligencia metodológica.

Referencias

Arkhangelsky, D., Athey, S., Hirshberg, D. A., Imbens, G. W., & Wager, S. (2021). Synthetic Difference-in-Differences. American Economic Review, 111(12), 4088–4118. https://doi.org/10.1257/aer.20190159

Baker, A. C., Larcker, D. F., & Wang, C. C. Y. (2022). How much should we trust staggered difference-in-differences estimates? Journal of Financial Economics, 144(2), 370–395. https://doi.org/10.1016/j.jfineco.2022.01.004

Borusyak, K., Jaravel, X., & Spiess, J. (2024). Revisiting Event-Study Designs: Robust and Efficient Estimation. The Review of Economic Studies, 91(6), 3253–3285. https://academic.oup.com/restud/article/91/6/3253/7601390

Callaway, B., & Sant'Anna, P. H. C. (2018). Difference-in-Differences with Multiple Time Periods. arXiv preprint arXiv:1803.09015.

de Chaisemartin, C., & D'Haultfoeuille, X. (2019). Two-Way Fixed Effects Estimators with Heterogeneous Treatment Effects (Working Paper No. 25904). National Bureau of Economic Research. https://www.nber.org/system/files/working_papers/w25904/w25904.pdf

Goldsmith-Pinkham, P. (2024). Tracking the Credibility Revolution across Fields. arXiv preprint arXiv:2405.20604.

Gardner, J. (2022). Two-stage difference-in-differences. arXiv preprint arXiv:2207.05943.

Goodman-Bacon, A. (2018). Difference-in-Differences with Variation in Treatment Timing (Working Paper No. 25018). National Bureau of Economic Research. https://www.nber.org/system/files/working_papers/w25018/w25018.pdf

Hamermesh, D. S. (2013). Six Decades of Top Economics Publishing: Who and How? Journal of Economic Literature, 51(1), 162–172. https://doi.org/10.1257/jel.51.1.162

Roth, J., Sant’Anna, P. H. C., Bilinski, A., & Poe, J. (2023). What’s trending in difference-in-differences? A synthesis of the recent econometrics literature. Journal of Econometrics, 235(2), 2218–2244. https://doi.org/10.1016/j.jeconom.2023.03.008

Sun, L., & Abraham, S. (2018). Estimating Dynamic Treatment Effects in Event Studies with Heterogeneous Treatment Effects. arXiv preprint arXiv:1804.05785.

Mi viaje a Rusia: Una visión de economista en 2025

Mi viaje a Rusia: Una visión de economista en 2025

Hace ya seis años que no viajo a Rusia.

Fui en 2015, 2016, 2018 y 2019. Luego llegó la pandemia y luego las sanciones: ya no hay vuelos directos ni podemos usar el dinero como antes.

Así que tendremos que:

  • Volar a Estonia y subirnos a un camión a la frontera.
  • En la frontera pasar caminando para continuar nuestro camino a San Petersburgo.
  • Nuestras tarjetas no funcionan en Rusia, las redes de bancos están cortadas.

Y quién sabe qué otras sorpresas tendremos que sortear.

No es un viaje normal.

En este texto quiero documentar algunos detalles que me llaman la atención. Me tocó ver Rusia durante una época con mercados completamente abiertos y una economía bastante sólida. Me da mucha curiosidad cómo han logrado librar los cambios debido a las sanciones de Estados Unidos.

En particular me interesa saber:

  • ¿Cómo se ve una economía cuando la cortan de la red de bancos?
  • ¿De dónde sacan chocolates? (En Rusia los chocolates son muy importantes y no se si las marcas que normalmente estaban ahí sigan).

Mi visión es meramente económica. No tengo el contexto suficiente de la política internacional para emitir una opinión al respecto. Aparte de que ya hay mucho escrito al respecto y no quiero aportar a la división en internet sobre temas y personas que no conozco.

Así que… si estamos listos para Hablar de economía, comencemos

Este post es parte de las publicaciones de paga.

Si nunca te has suscrito a un newsletter de paga, lo que obtienes al suscribirte no es únicamente el acceso a esta publicación sino a todas las que tengo marcadas como Pro hasta el momento.

Y eso es sólo de manera inmediata.

Un newsletter de pago es como un libro que nunca se acaba con los temas que más te gustan.

  • Aquí tengo mini-cursos de econometría.
  • Durante este año seguiré hablando de econometría moderna. En particular de Diferencias en Diferencias (estoy escribiendo mi segundo libro).
  • Y de vez en cuando escribo cosas que son interesantes desde la perspectiva económica.

Por ejemplo este post. Aquí profundicé un poco sobre la red de bancos y las restricciones de Rusia. ¿Por qué? Porque estaré tomando nota de lo que observe al respecto.

Es una mini-serie que creo que dice mucho del estado actual del mundo y que creo que te llamará la atención.

Si tienes curiosidad, tienes un periodo de prueba de 7 días para que lo pruebes y me dices que te parece. Cero riesgo.

Sigue leyendo.

Convertirme en Pro

La situación actual en Rusia: la segunda cortina de hierro

Recordemos brevemente: en 2022, Rusia se hizo sujeto de sanciones económicas en respuesta a la guerra en Ucrania.

El conflicto había ya empezado años atrás. Lo primero que yo recuerdo fue cuando se anexó Crimea y creo recordar que el fin era el acceso estratégico al mar negro para poder distribuir gas natural a Europa… pero no me hagas mucho caso. Mi memoria de esos temas no es tan buena.

El punto es que el conflicto escaló y el mundo puso sus ojos en Rusia y le pusieron sanciones:

  • Las marcas decidieron quitar sus inversiones del país.
  • Le congelaron las reservas internacionales fuera del país.
  • Varios países dejaron de comprarle petróleo.
  • Se les quitó a los bancos rusos el acceso a la red SWIFT. La red de comunicación entre bancos.

También se cortó el espacio aéreo de las dos partes. En 2019 pude subirme a un avión subiendo mis maletas en Durango y las pude recoger en San Petersburgo sin problemas.

Ahora esto no es posible. Mis opciones eran:

  • Ir a Estambul y de ahí tomar el vuelo a San Petersburgo. Perdí la oportunidad de tomar este vuelo. Si lo intentara ahora, me iba a salir el triple de lo que me costó.
  • Ir a Estonia, tomar un camión hasta la frontera. Bajarnos. Caminar la frontera en una fila de horas. Volver a subirnos al camión hasta San Petersburgo.

Una locura.

¿Cómo es Rusia desconectada a la red de bancos?

Lo primero que vamos a notar al cruzar la frontera es que nuestras tarjetas mexicanas con visa y mastercard van a dejar de funcionar.

Se le pusieron muchas restricciones adicionales al Rublo Ruso desde el 2022 que comenzó el conflicto en Ucrania. Básicamente se intentó hacer presión para que el rublo cayera y eso causara descontento en la ciudadanía rusa, que a su vez llevara a presionar al gobierno ruso para soltar a Ucrania. Rusia estaba preparado con reservas y con alianzas estratégicas y el rublo se recuperó muy rápido. No tengo idea de cómo lo han logrado. Me imagino que el gas que se vende a otros aliados que no le tienen restricciones, como Turquía, China o India deben ser suficientes para sostener la divisa. Porque los dólares que entran por las fronteras si son muy restrictivos.

Esa caída fuerte en 2022 fue al inicio de las sanciones

Al pasar la frontera no se permiten Euros. La regla es que se deben permitir cantidades para uso personal, pero los rumores son que incluso eso llegan a confiscar. Los dólares no tienen tantas restricciones, pero los billetes tienen que estar en condiciones perfectas, casi saliendo de la imprenta.

El tipo de cambio actualmente está a nuestro favor a como había estado en viajes anteriores, pero me pregunto si eso realmente nos dará una ventaja, pues la inflación en Rusia ha sido mucho más alta que la de México y la diferencia en el tipo de cambio simplemente podría ser reflejo de esa diferencia. La inflación está actualmente en 9.9% (si me preguntas a mi, no hay suficientes incentivos en los institutos para que el rosstat no esté mintiendo, así que podría ser un poco diferente lo que veamos en la realidad).

La inflación en Rusia. Fuente Rosstat

El turismo de San Petersburgo

Voy a la que para mi es la ciudad más bonita del mundo.

Siempre que había ido, estaba lleno de turistas de Rusia, de Europa y de todo el mundo. En el consulado de Rusia en México siempre habían filas largas todos los días de personas que se preparaban para visitar el país.

Pero en esta ocasión tiene que ser diferente.

No espero ver muchas personas de todo el mundo. Probablemente sigan muchos turistas de países como China, que no sancionó a Rusia de la misma manera. También debe seguir mucho turismo de Turquía, y de la misma Rusia.

Nosotros vamos con familia, así que muchos detalles de hospedaje e incluso de gastos los tenemos un poco más fácil, pero no me imagino ir de turista con las sanciones si no puedo pagarme un café con mi tarjeta.

¿De dónde sacan los chocolates en Rusia?

No quiero alarmarte, pero estamos en medio de una crisis de chocolates a nivel mundial.

La crisis del cambio climático ha causado muchos problemas en la cadena de suministro del chocolate. Y Rusia es un país que consume mucho chocolate.

Los mexicanos realmente no consumimos mucho chocolate, así que es muy difícil imaginarnos dimensionar esto, pero en Rusia, el chocolate ocupa solo pasillos enteros en los supermercados grandes. La competencia entre marcas es fiera y los chocolates son increíbles.

¿Por qué? Porque en Rusia, si visitas a alguien, 100% te va a ofrecer un té. Y un chocolate es una manera muy segura de acompañar ese té.

Pero mi pregunta es, ¿de dónde están sacando ese chocolate?

Parece una pregunta tonta, pero si no pueden hacer negocios con Europa, me imagino que eso debe de generar complicaciones para traer muchas de las marcas que querían. Por otro lado, la mayor parte de la producción se hace en países que no le pusieron sanciones a Rusia. Pensaría entonces que Rusia

  • O comenzó a hacer más chocolate de manera doméstica (viva la autarquía)
  • O están dando la vuelta a las sanciones haciendo más producción en otros países.

En cualquier caso, me aseguraré de revisar bien la parte de atrás de las etiquetas del chocolate.

Paises con sanciones a Rusia. Fuente: Tol - Own work based on: BlankMap-World.svg, CC0, https://commons.wikimedia.org/w/index.php?curid=115589113

La ecuación mas bella del mundo

La ecuación mas bella del mundo

La realidad: los símbolos matemáticos se ven increíbles en nuestro cuerpo como tatuajes.

La única razón por la que no los usamos más seguido es porque ¡qué pena tatuarnos algo que no sea correcto! Es como cuando el tatuaje en Chino resulta en palabras que no nos tatuaríamos en nuestro idioma. De ese caso, ejemplos abundan.

En agosto me hice una cita para hacerme un retoque en mi tatuaje, y platicando con mi tatuador, le mencioné un poco sobre lo que hago y vi cómo se le iluminaron los ojos de inspiración. Guardó esto como nota de lo que hará: Números binarios - representaciones matemáticas.

De inmediato pensé dos cosas:

  1. Qué bien que entendió lo que quiero para mi tatuaje.
  2. Pero… ¿él qué entiende por “representaciones matemáticas”?

Y como una gran parte de las personas en el mundo sienten ñáñaras cuando les hablas de matemáticas, me temo que simplemente irá a Pinterest y me arriesgo a acabar con el equivalente matemático a tatuarme “caldo de pollo” en chino por todo mi pecho.

Esta es una guía para ayudar a los tatuadores no-matemáticos a hacer tatuajes inspirados en las matemáticas y para personas que desean hacerse un tatuaje inspirado en las matemáticas y no quieren terminar haciendo el ridículo en las pool party de los congresos de matemáticas.

Las matemáticas son extremadamente bellas por si mismas. Apreciar la belleza matemática activa las mismas regiones en el cerebro que apreciar un gran arte o una pieza musical (Zeki, 2014). Estoy seguro de que son muchas más personas las que desean plasmar esa belleza en el cuerpo en la forma de un tatuaje.

En las siguientes secciones presentaré algunas de las representaciones que a mi parecer se prestan de manera natural para una representación en forma de tatuaje, ya sea porque son símbolos que por sí mismos se ven atractivos y estéticos o porque lo que representan es muy profundo.

Lo más común es que se cumplan esas dos características.


La ecuación mas bella del mundo

Hay dos razones para tatuarse algo matemático: por el significado y el efecto visual.

Hay expresiones que cargan mucho significado, pero que no se ven en esencia complejas. Por ejemplo:

$$e^{\pi i} + 1 = 0$$

Es considerada una de las ecuaciones más bellas que existen. Se llama la identidad de Euler, en honor a uno de los matemáticos más brillantes que han existido en este planeta. Se considera bella porque unifica cinco símbolos matemáticos fundamentales en una sola ecuación (Geiger, 2013).

  • Los números 1 y 0 son la base de todos los números. Son la base del sistema binario y son la identidad de la multiplicación y la suma, respectivamente.
  • El número pi. Tal vez lo conoces porque te obligaron a aprender que es 3.141592... se trata de la relación entre la circunferencia de un círculo y su diámetro. En palabras sencillas, si tomas el diámetro de una rueda con un hilo, ese hilo tendrá que pasar poco más de 3 veces para rodear esa misma rueda, sin importar su tamaño. Es una proporción muy bella e interesante. También es interesante por ser de esos números que se conocen como irracionales y tiene otras propiedades muy interesantes.
  • El número e, también conocido como el número Euler (si estás en matemáticas más de dos minutos, vas a escuchar ese nombre muy seguido), es la base de los logaritmos naturales. Formalmente, $e$ es el límite expresado como $$\lim_{n\to\infty}\left( 1 + \frac{1}{n}\right)^n$$, que es la expresión que surge al calcular el interés compuesto. Una de las propiedades más interesantes de $e$ y la que lo define es que es su propia derivada. Es decir, $$\frac{d}{dt}e^t = e^t$$ nos dice que entre más grande sea $e^t$, mayor será su tasa de crecimiento. Es ahí cuando se le llama a algo crecimiento exponencial.
  • El número $i$, conocido como el número imaginario y a los números que incluyen $i$ se les conoce como números complejos.[1] Normalmente no deberíamos ser capaces de sacar la raíz cuadrada a un número negativo. Pero los matemáticos son muy creativos y simplemente le agregaron una dimensión al plano de tal modo que ya no tenemos una línea de números, sino un plano cartesiano con arriba, abajo, izquierda y derecha. Cuando hacemos esto, ya no estamos en el plano real, sino en el plano complejo. Veremos un poco más de esto en la sección de representaciones geométricas.

De todos estos símbolos se han escrito libros enteros. No exagero.

La belleza de la ecuación anterior está en que, en el momento en el que agregamos $i$ en esta relación, estamos creando un campo vectorial que hace rotar la velocidad en 90 grados para cada posición en la que nos coloquemos en el plano.

Como vimos, $$\frac{d}{dt}e^t = e^t$$, es decir, la tasa de crecimiento de $e^t$ es la misma que su magnitud.

Entonces,

$$\frac{d}{dt}e^{it} = i\cdot e^{it}$$

Considerando que $$e^{i \cdot 0} = 1$$,

Para cada posición de e^it, su derivada incluye una rotació

Solo hay una trayectoria comenzando en la posición (1,0) en la que la velocidad siempre coincide con el vector a una rotación de 90º: un círculo de radio 1 que va a una velocidad de una unidad por segundo. ¿Cuál es la distancia que has recorrido en el círculo después de pi segundos?

Después de una rotación por la mitad del círculo, se ha recorrido una distancia de $\pi$, terminando en la posición $(-1,0)$ del plano

La figura anterior muestra cómo después de una rotación por la mitad del círculo, hemos recorrido pi y caemos en la posición (-1,0) de nuestro plano cartesiano. Es decir, $$e^{i\cdot \pi} = -1$$.

Pasar ese -1 del lado izquierdo de la ecuación es más un tema de estética, para asegurarnos de que los números 0 y 1 aparezcan.

Esta identidad resulta fascinante y establece el estándar de belleza para todo en las matemáticas. Y la ecuación junto con la figura harían un gran tatuaje.

  1. El nombre es un poco engañoso. Ya sea que digamos que en realidad, todos los números son imaginarios o que realmente son números que sí existen y que tienen muchísimas aplicaciones en el mundo físico. ↩︎

Este texto es parte de una guía más larga que escribí en un documento PDF para realmente compartir a mi tatuador.

En esta guía vemos muchos aspectos visuales de las matemáticas que pueden usarse en los tatuajes:

  • Secuencias de fibonacci y la proporción áurea
  • Conjuntos de Mandelbrot y su relación con la teoría del caos.
  • Muchas ecuaciones que se verían geniales en un tatuaje
  • Y todas las explicaciones para que tu tatuador nunca se confunda y te acabe tatuando "caldo de pollo" en el brazo.

Está detrás de este muro de pago. Afortunadamente, tienes un periodo de prueba para que lo descargues totalmente gratis.

Y si decides continuar, tendrás

  • Acceso a todas las publicaciones futuras mientras mantengas tu suscripción.
  • Podrás pedirme que escriba sobre los temas que te interesan (ya lo puedes hacer, pero doy preferencia a los suscriptores Pro).
  • Y acceso a todas las publicaciones de paga que he escrito en el newsletter. Todas se desbloquean al instante.

Lo peor que puede pasar es que entres, descargues el PDF, veas las publicaciones y decidas que no es el momento de continuar tu suscripción.

Así que no hay razón de dudar.

Conviértete en Pro

Descarga el documento completo en LaTeX

Aquí está el documento completo con todas las explicaciones.

¿Por qué está en PDF? Porque este documento lo hice en LaTeX y lo comencé a hacer para mi mismo (si se lo voy a mandar a mi tatuador).

El estimador de Diferencias en Diferencias

¡Hola!

En esta entrega comenzamos con la parte técnica de nuestra serie sobre la revolución de la credibilidad.

(Lo que quiere decir: este post se ve mejor en la página porque tiene ecuaciones).

En realidad, cuando Leamer (1983) hacía una crítica a la estafa dentro de la econometría, no estaba acusando a nadie personalmente. Simplemente hacía una observación de que, si deseamos hacer que nuestros estudios sean más creíbles, necesitamos adoptar una metodología que se acerque más al método experimental.

En este post veremos:

  • Un diseño clásico de un modelo de Diferecias en Diferencias de 2x2
  • Notación y cómo el uso de Diferencias en Diferencias (DD) elimina el sesgo de selección.
  • Y el supuesto de tendencias paralelas: la base para que el modelo DD funcione.

¿Listos?

Sigamos.

El diseño clásico de un modelo DD

Comenzaremos con un diseño clásico de 2x2:

  • El tratamiento es una variable binaria. El grupo seleccionado podría haber recibido tratamiento ($D=1$) o no recibió tratamiento ($D=0$).
  • El tratamiento es absorbente. Una vez que una unidad recibe el “tratamiento”, no se puede regresar a ser “no tratada”. El estado de ser tratada lo “absorbe”.
  • No hay variación en el tiempo de tratamiento. Todos los grupos de tratamiento son tratados al mismo tiempo. Cuando este elemento se rompe, la complejidad del diseño aumenta muy rápido.

Ahora incluyamos un poco de notación: sea el par $(g,t)$ un grupo en un periodo particular. En el ejemplo más básico de un modelo de DD, nos interesan únicamente el grupo de control ($g_0$) y el grupo de tratamiento ($g_1$) en dos periodos ($t=1,2$). En el grupo de control, las unidades permanecen sin tratamiento durante ambos periodos, y en el grupo de tratamiento, estas pasan de no-tratadas en el periodo 1 a tratadas en el periodo 2.

Por lo tanto, tenemos 4 pares

$$ (g_1,1), (g_1,2),(g_0,1),(g_0,2) $$

Resultados Potenciales vs. Resultados Observados

Para $g\in\{g_0,g_1\}$ y $t\in\{1,2\}$, definimos $Y_{g,t}(0)$ y $Y_{g,t}(1)$ como los resultados potenciales en el grupo $g$ para el periodo $t$ con y sin tratamiento, respectivamente (cf. Plawa-Neyman, Dabrowska & Speed, 1990; Rubin, 1972). Es decir, independientemente de si es el grupo de tratamiento o control, suponemos la existencia de un contrafactual. Decimos que un resultado es contrafactual cuando el grupo al que pertenece no coincide con el resultado observado. Por ejemplo, $Y_{g_1,2}(0)$ es un contrafactual.

Si el par $(g,t)$ tiene a todas sus unidades sin tratamiento, entonces

$$ Y_{g,t} = Y_{g,t}(0) $$

Sea $D_{g,t}$ un indicador dummy que toma como valor 1 si el par $(g,t)$ recibió tratamiento, y 0 en caso contrario. Entonces podemos encontrar que

$$ Y_{g,t} = (1-D_{g,t})Y_{g,t}(0) + D_{g,t}Y_{g,t}(1) $$

Que es lo mismo que decir que $Y_{g,t} = Y_{g,t}(0)$ cuando $D_{g,t} =0$ y $Y_{g,t} = Y_{g,t}(1)$ cuando $D_{g,t} =1$.

El estimador DD y el sesgo de selección

Nos interesa estimar el efecto de tratamiento promedio en las unidades tratadas (ATT):

$$E(Y_{g_1,2}(1)-Y_{g_1,2}(0))$$

💡
En inglés, el efecto de tratamiento promedio en las unidades tratadas se conoce como average treatment effect on the treater, y se suele resumir como ATT.

El problema es que $Y_{g_1,2}(0)$ es un contrafactual, no es el dato que realmente observamos. Podríamos intentar usar conjuntos de datos que si observamos.

  • Por ejemplo, podríamos usar la diferencia entre grupos con y sin tratamiento en el segundo periodo $Y_{g_1,2}-Y_{g_0,2}$, sin embargo, el grupo de tratamiento no se determinó de manera aleatoria. Esa condición sólo se logra cuando se hace un ensayo aleatorio y se determinan los grupos aleatoriamente para evitar sesgo de selección.
  • Alternativamente, podríamos usar una comparación de antes y después ($Y_{g_1,2}-Y_{g_1,1}$), pero este enfoque no nos garantiza que los cambios que observamos se hubieran dado aún sin el tratamiento.

Por lo tanto, usamos el estimador

$$ DD := Y_{g_1,2}-Y_{g_1,1}-(Y_{g_0,2},Y_{g_0,1}) $$

A este estimador se le conoce como el estimador de Diferencias en Diferencias. Su nombre lo recibe porque aplica al mismo tiempo la diferencia entre grupos y la diferencia en el tiempo. Nota que este estimador nos genera un efecto similar al de la ecuación del ATT, sin la necesidad de asignar los grupos de manera aleatoria.

Esto es lo que hace tan popular esta técnica. No es necesario hacer un ensayo aleatorio para obtener resultados similares a los de uno. Solo necesitas aplicar las diferencias entre grupos antes y después y que se cumplan algunos supuestos.

Este es un newsletter que trata de ciencia económica. En particular: econometría.

La econometría no es lo mismo que la ciencia de datos: es un área especial especializada en los datos económicos. Yo soy de la idea de que si eres economista, vale mucho la pena que aprendas a fondo la econometría y que te posiciones como econometrista, no como data scientist.

En los últimos años la econometría ha evolucionado y dejó de ser las recetas de cocina de los libros de texto de los 80s y se convirtió en un área completa de estudio con sus técnicas de inferencia causal propias. La diferencia está en el enfoque, que plantea pensar en experimentos y de ahí crear la estrategia de identificación.

En esta serie estaremos hablando de esta revolución de la credibilidad, incluyendo cómo evitar el sesgo de selección y cómo encontrar experimentos naturales. Es la primera serie que nos llevará a profundizar en el modelo de diferencias en diferencias, que es uno de los modelos de más crecimiento en los últimos años.

Su popularidad ha crecido mucho porque permite tener estudios con mucho valor y muchas credibilidad (sin todo el presupuesto que requiere hacer experimentos).

Así que, si es de tu interés aprender esta técnica, te veo en el resto de las publicaciones de esta serie.

¿Qué hay debajo del paywall? En esta edición:

  • Una visualización gráfica de las tendencias paralelas
  • Una demostración al teorema de las tendencias paralelas (por qué DD sirve tanto como un experimento)

Además, con tu acceso se abre el acceso a todas mis publicaciones de pago. Todas.

PS: Algunas de estas publicaciones estarán detrás de un muro de apago, pero te dejé un periodo de prueba de 7 días para que puedas verlas.

Quiero mi prueba gratis

Para que DD sea un estimador confiable se requiere el supuesto de tendencias paralelas

Este es el supuesto más crítico del modelo de DD.

El supuesto de tendencias paralelas indica que, en ausencia de un tratamiento, la diferencia entre las tendencias del resultado en los grupos de tratamiento y control deberían permanecer constantes en el tiempo.

En otras palabras, si no se hubiera dado el tratamiento, el grupo $g_1$ se debería comportar igual que el grupo de control.

Visualmente se vería así:

La figura nos muestra dos líneas que corren de manera paralela hasta el punto en el que se aplica el tratamiento.

La idea central del supuesto de tendencias paralelas es que, sin el tratamiento, el comportamiento de los dos grupos debería ser exactamente el mismo.

En lenguaje matemático, el supuesto de tendencias paralelas requiere que

$$ E[Y_{g_1,2}(0)-Y_{g_1,1}(0)] = E[Y_{g_0,2}(0)- Y_{g_0,1}(0)] $$

💡
Teorema de tendencias paralelas. Cuando se cumple la condición de tendencias paralelas, el estimador DD es insesgado.

Demostración (cf. De Chaisemartin & D’Haultfœuille, 2025):

Comenzamos expresando el estimador de Diferencias en Diferencias con los resultados observados.

$$ E[DD] = E[Y_{g_1,2}-Y_{g_1,1}-(Y_{g_0,2}-Y_{g_0,1})] \\ = E[Y_{g_1,2}(1) - Y_{g_1,1}(0) - (Y_{g_0,2}(0)-Y_{g_0,1}(0))] $$

Nota que si el supuesto de tendencias paralelas aplica, podemos despejar el contrafactual $Y_{g_1,1}(0)$, y los demás términos se cancelan para dejar el mismo estimador que tendríamos en un experimento.

$$ E[DD] = E[Y_{g_1,2}(1) - Y_{g_1,2}(0)] + E[Y_{g_1,2}(0) - Y_{g_1,1}(0)] -E[Y_{g_1,2}(0) - Y_{g_1,1}(0)] \ \\ =E[Y_{g_1,2}(1) - Y_{g_1,2}(0)] $$

Referencias

De Chaisemartin, C., & D’Haultfœuille, X. (2025). Credible answers to hard questions: Differences-in-differences for natural experiments. SSRN. https://dx.doi.org/10.2139/ssrn.4487202

Leamer, E. E. (1983). Let's take the con out of econometrics. The American Economic Review73(1), 31–43

Rubin, D. B. (1972). Estimating causal effects of treatments in experimental and observational studies (Research Bulletin No. RB-72-39). Educational Testing Service. https://doi.org/10.1002/j.2333-8504.1972.tb00631.x

Splawa-Neyman, J., Dabrowska, D. M., & Speed, T. P. (1990). On the application of probability theory to agricultural experiments. Essay on principles. Section 9. Statistical Science5(4), 465–472. https://doi.org/10.1214/ss/1177012031

¡Genial! Te has registrado exitosamente.

¡Bienvenido de vuelta! Has iniciado sesión correctamente.

Te has suscrito correctamente a Marionomics: Escribe tu paper de economía.

¡Éxito! Revisa tu correo electrónico para obtener el enlace mágico para iniciar sesión.

¡Éxito! Se ha actualizado la información de facturación.

No se actualizó tu información de facturación.