¡Hola!
En esta entrega comenzamos con la parte técnica de nuestra serie sobre la revolución de la credibilidad.
(Lo que quiere decir: este post se ve mejor en la página porque tiene ecuaciones).
En realidad, cuando Leamer (1983) hacía una crítica a la estafa dentro de la econometría, no estaba acusando a nadie personalmente. Simplemente hacía una observación de que, si deseamos hacer que nuestros estudios sean más creíbles, necesitamos adoptar una metodología que se acerque más al método experimental.
En este post veremos:
- Un diseño clásico de un modelo de Diferecias en Diferencias de 2x2
- Notación y cómo el uso de Diferencias en Diferencias (DD) elimina el sesgo de selección.
- Y el supuesto de tendencias paralelas: la base para que el modelo DD funcione.
¿Listos?
Sigamos.
El diseño clásico de un modelo DD
Comenzaremos con un diseño clásico de 2x2:
- El tratamiento es una variable binaria. El grupo seleccionado podría haber recibido tratamiento ($D=1$) o no recibió tratamiento ($D=0$).
- El tratamiento es absorbente. Una vez que una unidad recibe el “tratamiento”, no se puede regresar a ser “no tratada”. El estado de ser tratada lo “absorbe”.
- No hay variación en el tiempo de tratamiento. Todos los grupos de tratamiento son tratados al mismo tiempo. Cuando este elemento se rompe, la complejidad del diseño aumenta muy rápido.
Ahora incluyamos un poco de notación: sea el par $(g,t)$ un grupo en un periodo particular. En el ejemplo más básico de un modelo de DD, nos interesan únicamente el grupo de control ($g_0$) y el grupo de tratamiento ($g_1$) en dos periodos ($t=1,2$). En el grupo de control, las unidades permanecen sin tratamiento durante ambos periodos, y en el grupo de tratamiento, estas pasan de no-tratadas en el periodo 1 a tratadas en el periodo 2.
Por lo tanto, tenemos 4 pares
$$ (g_1,1), (g_1,2),(g_0,1),(g_0,2) $$
Resultados Potenciales vs. Resultados Observados
Para $g\in\{g_0,g_1\}$ y $t\in\{1,2\}$, definimos $Y_{g,t}(0)$ y $Y_{g,t}(1)$ como los resultados potenciales en el grupo $g$ para el periodo $t$ con y sin tratamiento, respectivamente (cf. Plawa-Neyman, Dabrowska & Speed, 1990; Rubin, 1972). Es decir, independientemente de si es el grupo de tratamiento o control, suponemos la existencia de un contrafactual. Decimos que un resultado es contrafactual cuando el grupo al que pertenece no coincide con el resultado observado. Por ejemplo, $Y_{g_1,2}(0)$ es un contrafactual.
Si el par $(g,t)$ tiene a todas sus unidades sin tratamiento, entonces
$$ Y_{g,t} = Y_{g,t}(0) $$
Sea $D_{g,t}$ un indicador dummy que toma como valor 1 si el par $(g,t)$ recibió tratamiento, y 0 en caso contrario. Entonces podemos encontrar que
$$ Y_{g,t} = (1-D_{g,t})Y_{g,t}(0) + D_{g,t}Y_{g,t}(1) $$
Que es lo mismo que decir que $Y_{g,t} = Y_{g,t}(0)$ cuando $D_{g,t} =0$ y $Y_{g,t} = Y_{g,t}(1)$ cuando $D_{g,t} =1$.
El estimador DD y el sesgo de selección
Nos interesa estimar el efecto de tratamiento promedio en las unidades tratadas (ATT):
$$E(Y_{g_1,2}(1)-Y_{g_1,2}(0))$$
El problema es que $Y_{g_1,2}(0)$ es un contrafactual, no es el dato que realmente observamos. Podríamos intentar usar conjuntos de datos que si observamos.
- Por ejemplo, podríamos usar la diferencia entre grupos con y sin tratamiento en el segundo periodo $Y_{g_1,2}-Y_{g_0,2}$, sin embargo, el grupo de tratamiento no se determinó de manera aleatoria. Esa condición sólo se logra cuando se hace un ensayo aleatorio y se determinan los grupos aleatoriamente para evitar sesgo de selección.
- Alternativamente, podríamos usar una comparación de antes y después ($Y_{g_1,2}-Y_{g_1,1}$), pero este enfoque no nos garantiza que los cambios que observamos se hubieran dado aún sin el tratamiento.
Por lo tanto, usamos el estimador
$$ DD := Y_{g_1,2}-Y_{g_1,1}-(Y_{g_0,2},Y_{g_0,1}) $$
A este estimador se le conoce como el estimador de Diferencias en Diferencias. Su nombre lo recibe porque aplica al mismo tiempo la diferencia entre grupos y la diferencia en el tiempo. Nota que este estimador nos genera un efecto similar al de la ecuación del ATT, sin la necesidad de asignar los grupos de manera aleatoria.
Esto es lo que hace tan popular esta técnica. No es necesario hacer un ensayo aleatorio para obtener resultados similares a los de uno. Solo necesitas aplicar las diferencias entre grupos antes y después y que se cumplan algunos supuestos.
Este es un newsletter que trata de ciencia económica. En particular: econometría.
La econometría no es lo mismo que la ciencia de datos: es un área especial especializada en los datos económicos. Yo soy de la idea de que si eres economista, vale mucho la pena que aprendas a fondo la econometría y que te posiciones como econometrista, no como data scientist.
En los últimos años la econometría ha evolucionado y dejó de ser las recetas de cocina de los libros de texto de los 80s y se convirtió en un área completa de estudio con sus técnicas de inferencia causal propias. La diferencia está en el enfoque, que plantea pensar en experimentos y de ahí crear la estrategia de identificación.
En esta serie estaremos hablando de esta revolución de la credibilidad, incluyendo cómo evitar el sesgo de selección y cómo encontrar experimentos naturales. Es la primera serie que nos llevará a profundizar en el modelo de diferencias en diferencias, que es uno de los modelos de más crecimiento en los últimos años.
Su popularidad ha crecido mucho porque permite tener estudios con mucho valor y muchas credibilidad (sin todo el presupuesto que requiere hacer experimentos).
Así que, si es de tu interés aprender esta técnica, te veo en el resto de las publicaciones de esta serie.
¿Qué hay debajo del paywall? En esta edición:
- Una visualización gráfica de las tendencias paralelas
- Una demostración al teorema de las tendencias paralelas (por qué DD sirve tanto como un experimento)
Además, con tu acceso se abre el acceso a todas mis publicaciones de pago. Todas.
PS: Algunas de estas publicaciones estarán detrás de un muro de apago, pero te dejé un periodo de prueba de 7 días para que puedas verlas.
Para que DD sea un estimador confiable se requiere el supuesto de tendencias paralelas
Este es el supuesto más crítico del modelo de DD.
El supuesto de tendencias paralelas indica que, en ausencia de un tratamiento, la diferencia entre las tendencias del resultado en los grupos de tratamiento y control deberían permanecer constantes en el tiempo.
Leer el artículo completo
Registrarse ahora para leer el artículo completo y acceder a todos los artículos por solo suscriptores pagos.
Suscribirse