Escribe tu primer paper de economía

La mayoría de los economistas tienen problemas para escribir textos académicos. Explorar sobre econometría es complejo y es difícil estar al corriente con las tendencias de investigación. Aquí encontrarás tutoriales de econometría en R y Python, deep dives en literatura reciente y modelos de trabajo para hacer tu escritura más fácil y publicar con éxito. Publica un paper que te posicione en tu área y te permita obtener un trabajo de investigador.

Escribe tu primer paper de Economía

Peso fuerte, pero ¿a qué costo?

Peso fuerte, pero ¿a qué costo?

El dólar llegó esta semana a 18.77, que es un mínimo histórico. Hablemos entonces de por qué, lo que significa y cómo afecta.

¿Por qué bajó el dólar?

El precio del dólar responde a las mismas fuerzas que los demás bienes y servicios en el mundo: la oferta y la demanda. Cuando hay mucha demanda de pesos, sube el peso contra el dólar.

La demanda de pesos se da cuando se exporta. Imagina que vendes quesos y los exportas al extranjero. La persona que consume los quesos los compró en dólares, pero alguien cambió dólares por pesos en algún lugar del camino desde tu tienda a la casa del consumidor para pagarte.

Si una sola persona lo hace, no pasa nada. Pero cuando son muchas personas haciendo lo mismo, las compras y ventas generan señales en el mercado. Muchas exportaciones fortalecen al peso. Muchas importaciones lo debilitan.

Pero hay otro mercado que influye mucho en el precio del dólar: el mercado financiero. Los inversionistas reaccionan casi en tiempo real a las noticias y sus movimientos pueden generar fluctuaciones fuertes en el precio de una moneda.

Las tasas de interés son interesantes

Para los inversionistas, las tasas de interés son el indicador que les ayuda a decidir si mantener su dinero en un país o en otro. Los países “en desarrollo” generalmente se consideran más riesgosos, por lo que se espera que ofrezcan una tasa de interés mayor a la de los países “desarrollados”.

Por eso todos los banqueros centrales del mundo deben estar muy al pendiente de lo que haga Jerome Powell, el presidente de la FED. Si la FED sube sus tasas de interés y las de tu país no suben, te arriesgas a que los inversionistas saquen su dinero del país para ponerlo en EEUU. Y si el ambiente tiene riesgos, peor aún. Hablé un poco de estos movimientos en Noviembre.

Guía para entender los mercados en Noviembre de 2022
🚨 En este post * La FED va a seguir subiendo tasas de interés * La reacción (negativa de los mercados) * Bajo desempleo en Estados Unidos * El peso (mexicano) ha aguantado bien (hasta el momento) Ya llevamos más de un año con inflación más alta de los objetivos que no hemos podido controlar. La FED está determinada a seguir subiendo las

Las relaciones con China son complicadas

Y bueno. Si hay riesgo en Estados Unidos y eres un inversionista internacional, tienes básicamente todos los demás mercados del mundo para invertir. Excepto que de momento China se está viendo un poco complicado por tensiones estratégicas. Hablé un poco de eso en el post sobre los semiconductores.

CHIPS y la Guerra de los Semiconductores
Este es un repost del artículo que escribí en Agosto relacionado con el problema de Taiwan, China y Estados Unidos. En su momento el tema estaba muy caliente, pero las repercusiones en el país a largo plazo son muchas y vale la pena echarle nuevamente un ojo.

El tema también tiene que ver con las inversiones. Una inversión se hace con diferentes panoramas de tiempo en el futuro. Una inversión depende de lo que se piensa que pasará en el futuro, y cuando esté futuro es incierto, lo mejor es sacar el dinero y ponerlo en otra parte.

México ha sido uno de los países que podrían funcionar como refugio. Aunque esto es complejo de analizar y no se puede asegurar que sea un factor tan relevante en realidad o no.

Lo que si sabemos es que las decisiones de Banxico son lo más importante para determinar si esto durará o no.

El peso fuerte no siempre son buenas noticias

En México tenemos una manía por ver a la moneda como una señal de fortaleza económica, pero no siempre es el caso. En realidad depende mucho de si tu eres exportador o importador si son buenas noticias para ti o no.

Si tu negocio es importar o requiere de bienes importados para funcionar, entonces si te conviene un peso fuerte: tus costos se vuelven más baratos y tus ganancias crecen. México importa mucho, así que en general un peso fuerte contribuye a que nuestro indicador de inflación de este mes nos va a salir más bajo (y puede calmar las expectativas).

Si en cambio tu exportas, o lo que haces depende de la exportación, un peso fuerte significa que estás recibiendo menos pesos por cada dólar que vendes. Por ejemplo, el turismo se vuelve más caro y puede desincentivar a las personas a consumir productos nacionales.

¿Cómo medir si en general el peso fuerte es bueno o malo? Observa la balanza comercial. En la balanza comercial te indica las importaciones y las exportaciones que tiene el país. En México ambas casi siempre van a la par, y los últimos meses habíamos tenido ligeramente más importaciones que exportaciones, por lo que puede que sea aalgo positivo.

🔮Una mirada al 2023

Si quieres analizar lo que pasará durante el año, tu primer indicador que debes vigilar es la inflación. Todo el tema de las tasas de interés son una reacción a la inflación que se generó desde 2021 y que no se ha podido aplacar en el mundo.

Hasta el momento parece que la estrategia ha funcionado. La inflación se está controlando en EEUU y muy probablemente se ajuste también en México, aunque no hay garantías de nada. Si la tendencia continúa, todo depende del ritmo en el que ambos bancos comiencen a bajar las tasas de interés para que el dólar se vuelva a ajustar en su precio de equilibrio.

Si el Banco de México baja las tasas de interés más lento de lo que se espera, entonces los capitales vuelven a salir.

¿Y si no funciona?

La inflación es complicada. Subir las tasas de interés para combatir la inflación es cómo llevar un machete para hacer una cirugía que requiere bisturí.

Subir las tasas ayuda a controlar las expectativas de inflación, pero no corrige las causas de fondo: los semiconductores siguen con problemas en su cadena de suministro, los costos del transporte de mercancías siguen altos y la guerra en Ucrania continúa.

Recesión en la puerta

Si subes demasiado las tasas de interés, corres el riesgo de caer en recesión. Demasiadas recesiones se han generado en el pasado por la subida en las tasas de interés y sectores como la tecnología ya han sufrido de despidos masivos.

Y aún con todo esto, nadie sabe realmente si vamos a caer en una recesión debido a estas medidas. Si, hay indicadores que nos dan una pista sobre lo que viene.

Por ejemplo está la curva de rendimientos. Muchos toman como un signo definitivo de que una recesión está en camino cuando la curva de rendimientos se invierte. La idea es que en situaciones normales, las inversiones a largo plazo requieren mayor rendimiento que las de corto plazo, pero cuando los inversionistas ven problemas en el horizonte, las inversiones a corto plazo necesitan dar mayores rendimientos para ser atractivas.

La curva de rendimientos ha funcionado bien en el pasado, pero la economía es demasiado complicada para que alguien te asegure que es un signo definitivo. Después de todo, ¿Cuánto tiempo realmente tenemos como humanidad desde que tenemos este tipo de registros de la economía?

CHIPS y la Guerra de los Semiconductores

Chips y semiconductores

Este es un repost del artículo que escribí en Agosto relacionado con el problema de Taiwan, China y Estados Unidos. En su momento el tema estaba muy caliente, pero las repercusiones en el país a largo plazo son muchas y vale la pena echarle nuevamente un ojo.


Estados Unidos acaba de aprobar la ley para la producción de semiconductores en el país. La ley tiene el ingenioso nombre de Creating Helpful Incentives to Produce Semiconductors (Creando Incentivos útiles para producir semiconductores, que crea la palabra CHIPS con sus siglas en inglés). Se busca con esta ley suplir la creación de semiconductores hechos en Taiwán por productos hechos en Estados Unidos.

¿Por qué es tan importante esta ley? Porque estamos en medio de una crisis de desabasto de semiconductores que puede empeorar fácilmente por una situación geopolítica compleja.

La novena compañía más grande del mundo

En 1985 la cuota de mercado de los Estados Unidos en la manufactura de semiconductores era alrededor de 35%. Al día de hoy es solamente 12%. Este cambio en el mercado se debe al rápido crecimiento de la empresa Taiwanesa de Semiconductores TSMC. Esta empresa encontró una forma innovadora de llevar semiconductores al mercado y ahora posee el 53% del mercado y un valor de 453 mil millones de dólares.

Si eres seguidor de Apple tal vez hayas escuchado del famoso chip M1. Lo han presumido tanto que podríamos pensar que lo fabrican en Apple mismo. Y cómo la mayoría de sus productos, Apple lo diseñó, pero es TSMC el que lo manufactura.

Apple no es el único. Prácticamente todas las empresas que “hacen chips” mandan a hacer sus productos a TSMC. AMD, Qualcomm, ARM y Broadcom todas trabajan de manera casi exclusiva con TSMC. Ese fue el principio bajo el que Morris Chang fundó la compañía: un producto complejo de hacer a gran escala.

¿Cómo llegamos a esto?

En los 80s, si deseabas entrar en el mercado de tecnología, era indispensable fabricar tus propios chips. La entrada de TSMC al mercado dio cabida a que empresas como Apple o Microsoft pudieran dejar de lado esta manufactura y enfocarse en crear hardware y software.

El famoso enfoque de Apple en crear una interfaz más visual y amigable que Steve Jobs cuenta en su famoso discurso no habría sido posible si en el inicio de Apple, hubieran tenido que diseñar y fabricar los semiconductores.

Chips Americanos

La amenaza a la soberanía de Taiwán que representa China en la actualidad es clave para determinar el futuro de los semiconductores en el mundo. Si China se apodera de la isla no permitirá que los semiconductores lleguen a los Estados Unidos. No a precios competitivos.

Por eso el CHIPS Act es un paso en la dirección correcta. Sin embargo, es un proceso que lleva tiempo. No veremos chips gringos este año.

Por su parte, China ha invertido más de 600 mil millones de dólares en la producción de semiconductores, diez veces el tamaño del presupuesto asignado al proyecto.

Lo que sigue es un update de Enero 2023


¿Y qué va a pasar?

La verdad es súper complicado sacar conclusiones definitivas, pues son muchas variables muy complejas. Si te estás imaginando que podrían aparecer competidores de TSMC en latinoamérica que le podrían empezar a surtir a EEUU, lo veo muy poco probable (aunque se vale soñar).

La razón es que el nivel de especialización que se requiere para hacer ese tipo de fundidoras para semiconductores es de volar la cabeza.

Las ciudades involucradas en la cadena de valor de los semiconductores son prácticamente ciudades charter, diseñadas y especializadas para este negocio. Las máquinas que las hacen, las características físicas que deben tener, todo es un cúmulo de experiencias y conocimiento especializado que se requiere simplemente es muy difícil de reproducir.

Pero los milagros a veces suceden.

Y ¿En qué me afecta?

Depende mucho de lo que pase, pero de momento ya llevamos un par de años con problemas en la producción de automóviles. Para obtener un auto necesitas ponerte en lista de espera.

También es complicado sacar conclusiones porque no todos los chips son iguales. No es lo mismo los chips que tienen las luces de navidad que las que se usan para las computadoras que manejan maquinaria industrial o las de un celular.


Grafos Acíclicos Dirigidos (GAD)

Grafos Acíclicos Dirigidos (GAD)

Esta es la última parte del primer capítulo de Econometría con Python que estoy haciendo. El siguiente post (la próxima semana) ya comenzaré con el capítulo de regresión lineal. El outline está increíble: nos vamos directo a las tripas de la regresión con ejemplos y simulaciones. Todo lo que estoy publicando aquí va a ser en Python, pero el libro también tendrá sus versiones en R. Ya estoy emocionado por todo lo que veremos.


Hay una manera gráfica de representar las relaciones causales. Se llaman Grafos Acíclicos Dirigidos (GAD). Básicamente son dibujos donde se relacionan las variables que nos interesan usando flechas para representar la causalidad.

Los DAG se usan para plantear un modelo del estado del arte del fenómeno que estamos estudiando. También se usan para encontrar posibles problemas que el modelo nos plantea.

Mi primer DAG

Para mostrar el poder de los GAD, comencemos con un ejemplo sencillo.

Considera el siguiente diagrama:

Es sencillo. Muestra únicamente la relación de $D$ con $Y$. Pero es común que las relaciones causales sean afectadas por otros factores externos. Veamos un ejemplo.

El efecto de asistir a una universidad de elite

¿Cuál el efecto que puede tener asistir a una universidad de elite? Existen muchos estudios que estiman que las personas que entran a las universidades Ivy League (Harvard, Stanford, MIT, etc) tienen más ingresos que las personas que estudian en otras instituciones.

Pero como hemos visto antes, la correlación no necesariamente significa que haya causalidad. Hay otros factores detrás de los ingresos de las personas que son difícil separar de la entrada a una universidad particular. Por ejemplo, la educación de los padres o los ingresos familiares pueden influir en la entrada a la universidad. Todos estos aspectos suelen interactuar entre si, lo cual vuelve complejo estudiar causas y efectos.

En 1999 se publicó un estudio hecho por Stacy Berg Dale y Alan Krueger que abordó este problema de una forma ingeniosa. No es posible simplemente comparar los ingresos de aquellos que ingresaron a las universidades de elite con quienes no lo hicieron, pues ambos podrían ser radicalmente diferentes.

Por lo tanto, lo que hicieron ellos fue comparar doppelgängers. Un doppelgänger es un gemelo o réplica idéntica, en este caso de los jóvenes que entraron a las escuelas de élite en los Estados Unidos.

Este tipo de estudios no es muy común. ¿De donde sacaron los doppelgängers para su estudio? Se requiere que sean jóvenes con las mismas características que los chicos que entraron a estas universidades: con mismo nivel socioeconómico, ingresos familiares y educación de los padres en promedio. La única diferencia es que son chicos que no entraron a la universidad de élite.

La respuesta que encontraron a este acertijo fue usar los datos de jóvenes que fueron aceptados, pero que por alguna circunstancia externa al final decidieron enrolarse en otra universidad. Estos alumnos son verdaderos doppelgängers de los alumnos que fueron admitidos y asistieron, pues en teoría tienen todas las otras características que sirven para hacer una comparación: tienen el nivel educativo y probablemente características socioeconómicas comparables.

Incluso los atributos inobservables como las habilidades o la inteligencia deberían ser comparables bajo este diseño.

Con este diseño, los investigadores encontraron que quienes fueron alumnos de escuelas más selectivas no tienen realmente mayores ingresos que los que fueron aceptados, pero no asistieron.

¿Qué significa esto? La conclusión es que son las otras características, como la educación e ingresos de sus padres y sus condiciones socioeconómicas las que representan una mayor influencia en los ingresos de una persona. Esto explica por qué personas como Mark Zuckerberg o Bill Gates se pudieron salir de la universidad y aún así sus empresas resultaron ser exitosas, mientras que para el resto de nosotros la educación resulta importante para hacer que nuestro emprendimiento tenga buenos resultados.

Cerrando Puertas traseras

No siempre tenemos la dicha de encontrar datos que nos permitan hacer este tipo de diseños para nuestro estudio. Pero eso no significa que no debamos poner atención a las puertas traseras, como es el caso de los factores socioeconómicos en nuestro estudio. El objetivo al momento de diseñar nuestro análisis es crear las condiciones para que nuestro análisis encuentre una interpretación causal.

Por ejemplo, el siguiente diagrama muestra una historia más completa sobre nuestra teoría de cómo la situación familiar y la educación podrían afectar a los ingresos de formas directas e indirectas.

Observa que hemos incluido la educación de los padres como factor que influencia a los ingresos de los individuos, pero sólo de manera indirecta a través de los ingresos familiares. Cuando esto pasa se dice que hay mediación o que la educación afecta a los ingresos por medio de los ingresos familiares.

Lo mismo podemos observar que pasa con la entrada a la universidad. La educación de los padres es un factor que influye en si una persona entra o no a la universidad, pero es por este medio que afecta de manera indirecta a los ingresos.

Hay factores que pueden afectar de manera directa e indirecta al mismo tiempo. Por ejemplo, los ingresos familiares afectan los ingresos de manera directa así como afectan la probabilidad de que una persona entre a la universidad. Este es un caso de dependencia mutua.

Finalmente, hemos incluido una variable no observable de habilidades que afecta tanto al ingreso a la universidad como a los ingresos. Las variables no observables pueden representar problemas importantes en la estimación de las variables, como veremos más adelante. Pero precisamente por los problemas que pueden representar es importante reconocerlos en nuestros modelos y tomarlos en consideración.

Las reglas de los GAD

Diseñar gráficos acíclicos dirigidos tiene una serie de reglas que se deben seguir para que los modelos que resulten tengan sentido.

En primer lugar, los GAD no tienen ciclos: no hay ninguna ruta en el grafo que comienza y termina en el mismo nodo. Esto asegura que el modelo no tiene dependencias cíclicas y, por lo tanto, es más fácil de entender y analizar.

Otra regla importante es que cada nodo debe tener al menos una flecha entrante y una flecha saliente. Esto garantiza que todos los nodos están conectados y participan en el modelo. Además, las flechas van en una sola dirección, lo que significa que cada flecha tiene un origen y un destino. Si A causa B, no es posible que B cause A al mismo tiempo. Esto ayuda a representar relaciones causales y jerárquicas entre diferentes elementos.

El machismo es un problema económico

El machismo es un problema económico

El año 2022 cerró de una manera muy entretenida. Primero Andrew Tate mandó un tweet dirigido a Greta Thunberg“presumiendo” sus 33 coches (ni idea de para qué). Greta le dio una respuesta irónica, lo que hizo que Tate se enojara y mandara un video por Twitter que reveló su ubicación en Rumania, llevándolo a su arresto.

La situación es un tanto chusca. Incluso hay quien dice que Tate se fue sobre la activista porque alguien le mandó un mensaje de que GRETA va sobre ti (GRETA eran las siglas de la agencia contra la trata que estuvo detrás de su arresto).

Pero más allá de lo superficial, tenemos que pensar en masculinidades. En platzi hay un curso genial sobre masculinidades positivas que te va a cambiar el panorama sobre la caja de la masculinidad y la forma en que el machismo opera y nos afecta tanto a hombres como a mujeres.

¿Por qué pensar en masculinidades? Porque el machismo también tiene efectos en la economía. Conoce aquí cuatro formas en las que esto sucede.

¿Quieres hacer crecer la economía? Prueba tumbar el patriarcado

El invento que cambió por completo la historia de la humanidad fue sin duda el arado. El arado nos llevó de una sociedad de cazadores-recolectores a la sociedad de la agricultura.

Pero la era agrícola tal vez fue la mayor estafa de la humanidad. Si bien nos permitió hacer crecer nuestra población y establecer grandes ciudades, fue con la agricultura que cambió la estructura de la sociedad y las familias.

Cuando antes las actividades de caza y recolección eran compartidas, las familias vivían en espacios compartidos (también las mujeres cazaban mamuts). Pero en cuanto se volvió importante el espacio que ocupa un terreno, se le dió más importancia a quién se heredan las tierras. También al ser el hombre quien era más apto para el trabajo del campo, fue cuando “la mujer a la casa y el hombre al campo” era óptimo.

En la era industrial la estructura se mantuvo en parte como una norma social, pero en el siglo XX hubieron diversos cambios e inventos que lograron que esto cambiara. Uno que me parece importante es la píldora anticonceptiva. En los años 70s se incrementó el número de graduadas de la universidad en los Estados Unidos y en otras partes del mundo. ¿La razón? La píldora anticonceptiva se volvió más accesible para las mujeres, lo que les dio más oportunidad de planear su vida.

De los países “avanzados” que tardaron más en aprobar la píldora está Japón. Pero cuando su economía se estancó, una de las claves para liberar un enorme potencial de fuerza de trabajo fue permitir que las mujeres se incorporaran al mercado laboral con medidas fiscales y de redes de cuidados.

Cuando las mujeres se incorporan al mercado laboral con mejores oportunidades, la economía crece.

Los hombres también podemos cuidar

Todos necesitamos cuidados en algún momento de nuestras vidas. Pero una parte desproporcionada de las tareas de cuidados caen en las manos de las mujeres. Alrededor de 606 millones de mujeres en el mundo no se consideran disponibles para el mercado laboral o no están buscando activamente trabajo por realizar trabajos de cuidados no remuneradas.

No hay nada que haga a los cuidados una actividad femenina. Requirió de un esfuerzo enorme por parte de Florence Nightingale hacer que emplearan a las mujeres como enfermeras. Los hombres también podemos y debemos incorporarnos a las actividades de cuidados.

Las licencias parentales a hombres para que dediquen tiempo a los cuidados de los niños son una de las propuestas más populares en la actualidad. Los resultados de esta medida han sido mixtos: si bien estos permisos si aumentan el tiempo que los hombres dedican a los cuidados, en ocasiones los mismos estereotipos de la caja de la masculinidad evitan que más hombres tomen esta opción.

Alcoholismo y resultados económicos

Por si fuera poco, está el alcohol. El alcohol interfiere con el desarrollo de los adolescentes, genera problemas de salud, interfiere con la productividad, competitividad y exacerba las desigualdades sociales. Y uno de los motores que impulsan el alcoholismo es el machismo.

De acuerdo a un estudio hecho en Reino Unido, Estados Unidos y México, los comportamientos de riesgo (incluido el abuso del alcohol) son uno de los pilares de la llamada caja de la masculinidad. La caja de la masculinidad se refiere a aquellas cosas que se supone “debe ser un hombre” de acuerdo a la masculinidad hegemónica (que sólo vive en nuestras cabezas).

Estar dentro de la caja de la masculinidad lleva a conductas de riesgo mayores derivadas de la presión social. El estudio sólo la relaciona con los accidentes de tráfico, pero el alcohol puede llevar a problemas no sólo para quien lo consume, sino también para las personas a su alrededor.

Se estima que los costos económicos del alcohol representan de un 0.6% a un 2% del PIB global. Hay otros estudios que calculan los costos hasta en un 5.44% del PIB Global. Los principales costos vienen por los problemas a la salud que conlleva, por la violencia y el crimen que genera y por desempleo. Una gran parte de los costos sociales que el alcohol genera vienen de las hospitalizaciones y costos adicionales en policías.

Diversidad en la fuerza de trabajo

Los equipos diversos son equipos más productivos, con mayores niveles de creatividad y de satisfacción. El machismo no sólo bloquea el acceso de las mujeres al trabajo, cuando las deja entrar suele ser con menores ingresos y con menos oportunidades para ascender.

En ocasiones las causas son muy sutiles. Por ejemplo, la expectativas en una oficina de que los empleados atiendan reuniones en ciertos horarios pueden excluir de maneras sutiles a las mujeres cuando tienen labores de cuidados.

En otras ocasiones las exclusiones pueden ser más explícitas. La normalización de la homofobia segrega a miembros de la comunidad LGBT+ y los aleja de oportunidades para aportar a las empresas y a la comunidad.

¿Predicciones de 2023?

¿Predicciones de 2023?

¡Feliz Año Nuevo!

Iniciado 2023, en todos lados vas a encontrar predicciones sobre lo que pasará. La verdad es que las predicciones hacen buen espectáculo, especialmente cuando son audaces y particularmente cuando resultan ser verdaderas.

Piénsalo de esta manera: si realizas una predicción y esta se materializa aa lo largo del año, puedes volver a ella y decir “se los dije”. Si tienes un blog como este, estas acciones te pueden ayudar a hacerte viral y subir tu reputación como alguien a quién poner atención.

En cambio, si la predicción resultó no ser correcta, lo más probable es que simplemente quede en el olvido. Muy pocas personas lo van a recordar y de quienes lo recuerden a muy pocas les importa. La ganancia es grande, pero la pérdida potencial es muy baja.

El secreto de las predicciones

Lo curioso es que no es necesario que las predicciones sean buenas. Puede ser más importante que sean muchas. ¿Recuerdas las predicciones de los Simpson? parte de la explicación que tienen es que el show es tan largo que han tenido muchas oportunidades de plantear escenarios diferentes y alguno le atina. Hasta un reloj descompuesto da la hora correcta dos veces al día.

El resultado es que hay muchas predicciones de personas que se escuchan muy confiadas de sí mismas y que muy pocas personas cuestionan. A la vez, las predicciones más mesuradas y que se basan en datos, análisis y conocimiento científico quedan en segundo plano, pues para empezar son menos.

Es una receta perfecta para tener malas predicciones.

Un mago economista haciendo una predicción del futuro. Si, así se hace.

Cómo mejorar las predicciones: Pon tu dinero donde pones tu boca

Si el problema de las predicciones es lo poco que cuesta en términos de reputación, entonces la solución es clara: las predicciones deben venir con una apuesta de por medio. La persona que hace la predicción debe estar dispuesta a poner su dinero donde pone la boca.

Los economistas tenemos una solución para esto: pon las ideas en un mercado. Los mercados de predicciones son mercados abiertos en los que se plantea una pregunta con un precio a las posibles respuestas. Entre más alto sea el precio para una respuesta, más personas piensan que esta será la respuesta correcta.

Estos mercados son muy populares en política. Dan respuestas más acertadas a las que te encuentras en encuestas. Las encuestas se pueden comprar para que reflejen el resultado que se desea, pero inflar el resultado en los mercados de predicción se puede convertir en una guerra de desgaste que se acaba el dinero de los partidos.

Cuando esto pasa, lo más eficiente acaba siendo que quienes están dispuestos a apostar es porque están mandando una señal al mercado de que algo saben sobre quién va a ganar. Puede ser que le vas al partido A, pero tal vez no estás dispuesta a poner de tu dinero para mandar esa señal de que sabes que va a ganar a menos de que estés segura.

¿Conoces a alguien que disfrute leyendo mis artículos en mi Substack? ¡Entonces una suscripción premium sería un regalo perfecto! No solo podrán recibir mis últimos artículos directamente en su correo, sino que también tendrán acceso a contenido exclusivo y estarán apoyando mi trabajo. ¡Regala una suscripción premium hoy mismo y haz que tu amigo o ser querido se una a la comunidad de lectores de mi Substack!

Mercados Eficientes

Cuando todos apuestan su dinero para dar una predicción están mandando una señal de lo que saben. Si suficientes personas hacen (o dejan de hacer) lo mismo, entonces la información que reflejan los precios está completa.

Esta es la hipótesis de los mercados eficientes. La hipótesis de los mercados eficientes es como la fila del supermercado. En el momento en el que se abre una caja las personas corren a ella. El resultado es que para la mayoría de nosotros el beneficio es muy pequeño.

Lo mismo sucede en los mercados de predicciones. Cuando hay información nueva que puede cambiar el resultado de una elección, esta se ve reflejada en los precios del mercado. Algunos cuantos aprovecharon y sacaron ganancia de ese cambio, pero la mayoría de nosotros no tenemos más que ver cómo los precios se mueven y reflejan lo que los demás saben.

Evidencia

No es sólo una teoría. En diversos estudios se ha encontrado que los precios de los mercados de predicciones reflejan correctamente el comportamiento de los eventos en los que se basan. En ocasiones se presentan algunos sesgos, pero en general son buenos resultados.

En México todo este tipo de apuestas están prohibidas. Probablemente por esta razón no encontramos mercados de este tipo en el país, pero probablemente haya alguna manera de hacer que funcionen. Lo que he visto que se hace en Estados Unidos es que los mercados operan con dinero “de juguete” y al final se dan premios a los ganadores. Desconozco si esto sería posible aquí.

Bonus: Las predicciones de chatGPT

Dicho todo esto, hice una serie de predicciones apoyado de chatGPT. Si quería lanzar un post con predicciones, pero sabiendo lo que te acabo de decir, habría sido incongruente de mi parte hacerlo igual que todos. Así que aquí van unas predicciones genéricas, como de horóscopo.

Le dije a la IA que las hiciera parecer plausibles. ¿Qué piensas?

  1. El crecimiento económico en México se ralentizará en el próximo año debido a una desaceleración en el mercado interno y la incertidumbre en el comercio internacional
  2. La inflación en México se mantendrá estable en el próximo año gracias a la estabilidad en los precios de las materias primas y la política monetaria del banco central
  3. El tipo de cambio del peso mexicano se mantendrá estable en el próximo año debido a la estabilidad en el mercado cambiario y la política monetaria del banco central
  4. El sector servicios en México seguirá siendo el motor de la economía en el próximo año, con un aumento sostenido en la demanda de servicios de tecnología y turismo
  5. El sector manufacturero en México seguirá enfrentando retos en el próximo año debido a la competencia extranjera y la falta de inversión en tecnología y capacitación

Python: El modelo de Resultados Potenciales

Python: El modelo de Resultados Potenciales

El ejemplo en el post anterior sirve para ilustrar el modelo de resultados potenciales en individuos. Pero lo que en realidad deseamos es obtener conclusiones generales para tomar decisiones. Yo no soy Alicia o Bob, pero quiero saber si debería asistir a la fiesta. Aquí está el post anterior, por si te lo perdiste o quieres usarlo como repaso. También te dejo al final de este post un enlace para el notebook de Google Colab donde puedes correr todo el código, clonar el proyecto y revisar los resultados.

El modelo de resultados potenciales
La econometría moderna sufrió un cambio de paradigma a partir del modelo de resultados potenciales. Es este modelo el que permite pensar en términos de experimentos aún cuando los datos son observacionales para obtener inferencia causal. El truco está en pensar en términos de

Este tipo de preguntas requieren que hagamos inferencia sobre lo que pasaría si yo fuera. Para eso, podemos estimar lo que se espera que pase con mi calificación si asisto a la fiesta. En otras palabras, queremos conocer el valor esperado del efecto de ir a la fiesta para tomar la decisión de si ir o no.

El principio para entender el modelo de resultados potenciales en un conjunto de datos es el mismo que usamos en la sección anterior, así que podemos comenzar con una extensión de la ecuación que nos muestra el efecto promedio del tratamiento. Veamos nuevamente lo que tenemos. Imagina que en lugar de ver el caso de Alicia y Bob únicamente, tenemos una base de datos de 1000 estudiantes donde indica si asistieron a la fiesta o no (creo que lo deberíamos cambiar a concierto o festival en este punto). La base de datos también nos indica la calificación que se sacaron en econometría.

Veamos cómo se vería esta base de datos creando una simulación en Python. No podemos usar para esto datos reales porque queremos ver los datos contrafactuales que vienen de universos paralelos. Supongamos que la calificación del estudiante $i$ se genera a partir de la siguiente función lineal

De ahí, $\beta_0$ es un parámetro fijo que nos indica para este caso la calificación que el estudiante se sacaría si no fuera a la fiesta y $\varepsilon$ es un término de error estocástico o aleatorio. Es importante incluir este término de error porque bien sabemos que ir a la fiesta no es lo único que puede influir en la calificación de econometría: algunos tendrán mayor calificación que otros.

Un supuesto crítico es que $\varepsilon$ tiene una distribución normal. Esto se representa de la siguiente manera:

Las distribuciones se representan como funciones: con un paréntesis que nos indican sus parámetros. En el caso de la distribución normal nos interesan dos cosas: en dónde está centrada y qué tan dispersa es. El centro de la distribución es el primer parámetro, que hemos definido que debe ser cero para nuestro término de error. El valor de $\sigma^2$ nos indica la varianza o la dispersión de nuestra calificación.

Creando la base de datos

Lo primero que haremos será crear la columna $D_i$ que nos muestra la elección de cada estudiante de manera aleatoria: un 1 significa que si asistieron a la fiesta y un 0 significa que no. También haremos el valor de $\beta_0$ que básicamente es la calificación si deciden no ir a la fiesta.

import numpy as np
np.random.seed(42)

n = 1000 # Determinamos el número de observaciones de nuestra base de datos

b0 = np.random.choice([6,7,8,9],n)

Haremos un poco de trampa a continuación. Vamos a crear nuestra base de datos y vamos a crear el valor de $D_i$. Pero aquí está el secreto: este valor va a depender de $\beta_0$.

Esto refleja una situación parecida a la que encontramos en el modelo individual. Las personas que tienen mayor calificación son las que están más dispuestas a asistir a la fiesta si piensan que no les va a afectar de manera significativa. En el siguiente bloque de código crearemos nuestra base de datos en pandas y generaremos la columna $D_i$ conforme a la regla que establecimos arriba.

import pandas as pd

df = pd.DataFrame({"b0":b0})
df['Di'] = np.where(df['b0']>7,1,0)

Y aquí llega el momento de la verdad. Vamos a crear nuestra variable $Y$, que contiene las calificaciones de los alumnos. Digamos que el efecto real de asistir a la fiesta es de $\delta = -1$, por lo que al crear la variable en python tendremos como resultado

df['e'] = np.random.normal(0,1,1000)
df['Y'] = df['b0'] + (-1)*df['Di'] + df['e']

Esta es la razón por la que estamos haciendo los datos por medio de una simulación. En la realidad $\delta$ es un parámetro de nuestro modelo que tenemos que estimar, no lo conocemos realmente hasta que hacemos el proceso de inferencia. El resultado de $Y$ contiene nuestro error aleatorio $\varepsilon$, que tiene una desviación estándar de 1.

Empieza a escribir también usando Substack. Usa el botón abajo para crear tu publicación y conectarla con Marionomics: Econometría y Datos

Gracias al término aleatorio no es sencillo entender el patrón que nos dan los datos con sólo velos a simple vista. Por eso necesitamos la estadística. Hagamos la diferencia de medias de las calificaciones de aquellos que asistieron a la fiesta y los que no.

El siguiente bloque de código muestra los resultados de esta operación. Verifica por tu cuenta propia la operación y observa el resultado. ¿Encuentras algo extraño?

print(df[df['Di'] == 1]['Y'].mean() - df[df['Di'] == 0]['Y'].mean())

El sesgo de selección

Nuevamente nos topamos con el mismo efecto. Si no supiéramos que el efecto real era $\delta = -1$, podríamos caer en la ilusión de que asistir a la fiesta en realidad aumenta nuestras calificaciones. Lo peor es que los seres humanos somos muy buenos para encontrar motivos a lo que vemos: tal vez en la fiesta fluyen las ideas de manera libre y eso hace que los alumnos hagan un mejor examen. Tal vez los resultados muestran lo importante que es descansar y pasar un buen rato con los amigos. Pero estudiar econometría requiere dedicarle tiempo y esfuerzo. ¿Qué sucedió en realidad?

Bueno, los datos son inventados, pero eso no significa que no podamos aprender algo de ellos. Para comenzar, veamos que el modelo individual que hicimos anteriormente se puede extender para un conjunto de datos y sus valores esperados.

Hicimos el mismo truco que en la sección pasada: agregamos un elemento que suma 0 para mostrar que el efecto real está contaminado con un sesgo de selección. El dato de $E[Y^0_i |D_i=1]$ no existe en la vida real, es el contrafactual de lo que hubieran sacado como calificación los alumnos que fueron a la fiesta si no hubieran ido. Podemos observar que, en efecto, el resultado de esto es $-1$, como lo esperaríamos de un estimador sin sesgos. Veamos en python este resultado.

Primero creamos las columnas de $Y^0_i$ y $Y_i^1$ independientes de lo que el estudiante haya decidido en la realidad.

df['Y0'] = df['b0'] + df['e']
df['Y1'] = df['b0'] + (-1) + df['e']

Puedes observar que cuando la decisión coincide, la calificación debe ser la misma, pero cuando no, entonces se trata de un contrafactual. Es decir, la primera fila muestra a alguien que si fue a la fiesta ($D_i =1$) y su calificación fue de 7.3. Su calificación si no hubiera ido a la fiesta según nuestros datos habría sido de 8.3.

Veamos entonces la primera parte de la ecuación anterior

Esta es la que nos genera el efecto real de asistir a la fiesta. Podemos extraer estos datos de nuestra simulación en python usando el siguiente código

df[df['Di'] == 1]['Y1'].mean() - df[df['Di'] == 1]['Y0'].mean()

Que lástima que el dato de $E[Y_i^0 | D_i = 1]$ es un contrafactual y no podemos medirlo en la realidad. Pero al menos podemos encontrar ahí el efecto real de -1 que estábamos buscando. Aprovechando que ya estamos aquí, podemos medir nuestro sesgo de selección, que está en el extremo de la derecha en nuestra ecuación y podemos examinarlo de la siguiente manera.

df[df['Di'] == 1]['Y0'].mean() - df[df['Di'] == 0]['Y0'].mean()

Como esperamos, nuestro sesgo de selección tiene un valor muy cercano a 2.

Bueno, y ¿Cómo solucionamos el sesgo de selección?

Para solucionar el sesgo de selección hay que comprender primero de dónde se origina. En nuestro ejemplo es claro que fuimos nosotros quienes lo creamos de manera artificial, pero se dio por las mismas razones que podemos esperar en la vida real.

La decisión que tomaron los estudiantes de nuestra base de datos simulada fue una respuesta a su propia calificación. Esto nos generó un problema de endogeneidad. Veremos más adelante cómo podemos lidiar con estos problemas y por qué es tan importante entenderlos.

De momento consideremos que nuestra muestra contiene este sesgo y lo que debemos hacer para eliminarlo y encontrar el verdadero efecto es seleccionar nuestros datos por un proceso verdaderamente aleatorio que incluya de igual manera a los que asisten a la fiesta y a los que no lo hacen.

Comencemos por crear una copia de la base de datos

df2 = df.copy()

En esta copia vamos a trabajar. Lo primero es sustituir el valor de $D_i$ para que se genere a partir de un proceso aleatorio.

df2['Di'] = np.random.choice([0,1], n)

Ahora toca sustituir los valores de $Y$. El siguiente código genera el valor usando los mismos valores de $\beta_0$ y $\varepsilon$ de la base de datos anterior.

df2['Y'] = df2['b0'] + (-1)*df2['Di'] + df2['e']
df2['Y0'] = df2['b0'] + df2['e']
df2['Y1'] = df2['b0'] + (-1) + df2['e']
df2

Finalmente, hagamos el cálculo de una diferencia de medias simples. Nota que esta vez el sesgo de selección ha desaparecido y tenemos un valor muy cercano al $-1$ que sabemos es el efecto real de asistir a la fiesta.

df2[df2['Di'] == 1]['Y'].mean() - df2[df2['Di'] == 0]['Y'].mean()

Listo. Hemos mostrado cómo solucionar el sesgo de selección en nuestro modelo simulado. El proceso de aleatorización que hicimos aquí se puede simular cuando tenemos la opción de crear un experimento aleatorizado y logramos asegurarnos del control de variables que nos pueden afectar nuestro resultado.

Pero seamos sinceros, los economistas rara vez tenemos la oportunidad de controlar nuestras variables de esa manera. Normalmente a lo que nos enfrentamos son a datos que se recolectaron, en muchas ocasiones por alguien más y normalmente con un propósito diferente a los que nosotros deseamos. En los capítulos siguientes aprenderemos a usar técnicas de regresión para obtener resultados de inferencia causal con este tipo de datos, pero que mantengan el espíritu de estos modelos como si hubiéramos hecho un experimento.

La verdad sobre Santa Claus

La verdad sobre Santa Claus

Santa tiene una lista de niños buenos y niños malos. La idea es que los niños buenos reciben más regalos que los niños malos.

No me pregunten que tipo de modelo de inteligencia artificial usa para la clasificación de los niños, pero a mi me da la sensación de que el modelo está sesgado. Sobre todo considerando que los niños pobres reciben menos regalos que los niños de familia con mayores ingresos.

En este post veremos un estudio científico que determina de una vez por todas si portarse mal te hace acreedor a que Santa te deje sin castigo o te regale un pedazo de carbón. También veremos un poco de cómo Santa Claus llegó a tener la imagen que ahora conocemos todos. Spoiler: no lo inventó Coca-cola.

Santa Claus no da menos regalos a los niños malos, pero si eres pobre…

En Navidad de 2015, un grupo de investigadores recolectaron información de hospitales en el Reino Unido para determinar qué factores infuencian si Santa Claus visita a los niños.

Para determinar que tan bueno o malo es un niño, usaron datos de ausentismo en las primarias y las tasas de encarcelamiento juvenil de chicos de entre 10 y 17 años, así como la distancia del hospital al “Polo Norte” (o la ciudad más cercana). También usaron el índice de privación económica, para determinar las condiciones socioeconómicas de los chicos.

Lo que encontraron fue que los chicos con un mayor índice de privación recibieron menos visitas de Santa Claus, tristemente. Ser pobre si te pone en la lista de los niños malos. Y pues no, no hubo una diferencia significativa de visitas de Santa Claus para niños “malos” en comparación de los “buenos”.

No tengo idea de cómo decirle esto a mis hijos

Esta semana fuimos padrinos de niños que no tienen a sus padres y fuimos a hacerles un regalo. Salí contento de poder aportar aunque sea un poco, pero también muy angustiado por no hacer aún más.

Pero también estaba preocupado de que mis hijos me preguntaran por qué a estos niños no les va a mandar regalo Santa Claus igual que a ellos. En este post, la Dra. Clara Goodwin plantea que podemos darles explicaciones causales: es que no tienen chimenea.

Finding Out "The Truth" About Santa Claus
Source: Betty Llensa/ Pexels The topic of Santa Claus is one that is so rife with parenting dilemmas that it seemed like a second newsletter might be necessary. In last week’s newsletter, I discussed the research on encouraging belief in Santa and addressed the following hot-button topics:

La verdad es que no me imagino cómo esas respuestas sean satisfactorias para mis pequeños. Creo que acabaré hablándoles del índice de Gini.

Coca-Cola no inventó a Santa Claus

Muchas personas piensan que Coca-Cola inventó a Santa Claus. Y no están del todo errados: la empresa no creó la idea de Santa, pero si popularizó la idea que tenemos hoy de él: un gordito excesivamente feliz.

La idea de que Coca-Cola lo inventó es tan prevalente, que la compañía tiene una página en sus preguntas frecuentes donde hace las aclaraciones pertinentes.

San Nicolás

La marca Coca-Cola se lanzó en 1892, pero la idea de “Santa” tiene ya varios siglos. El original muchos lo conocen: San Nicolás, un santo del siglo 4. Hacía milagros y traía regalos. Era santo patrono de navegantes, mercaderes, niños, solteros y estudiantes, entre otros.

Generalmente se representaba a San Nicolás como una figura alta y delgada. Casi como un elfo.

En los años 30, la marca encargó al artista Haddon Sundblom crear un anuncio navideño especial para Coca-Cola. Sundblom se inspiró en un poema clásico de 1822 para crear sus propuestas: Twas the Night Before Christmas.

En el poema hace mención a algunas características que son las del Santa que todos reconocemos: mejillas rosadas, nariz como una cereza, una barba blanca como la nieve y una gran panza redonda. El resultado fue esta, la primera ilustración del Santa que hoy conocemos, hecho por Coca-Cola.

Coca-Cola le pagó a Sundbom mil dólares por su ilustración. En aquel entonces era posible comprarse un automóvil con 700 dólares, por lo que no fue un mal trato. Además, Sundblom siguió haciendo comerciales para la marca por las siguientes tres décadas.

Una imagen tan carismática fue merecedora de un gran esfuerzo de marketing por la compañía. La imagen de Santa se aceptó rápidamente en el mundo, siendo hoy la viva imagen de la Navidad y un gran promotor del refresco que m̶a̶t̶a̶ alegra a millones todos los años.

El modelo de resultados potenciales

El modelo de resultados potenciales

La econometría moderna sufrió un cambio de paradigma a partir del modelo de resultados potenciales. Es este modelo el que permite pensar en términos de experimentos aún cuando los datos son observacionales para obtener inferencia causal.

El truco está en pensar en términos de universos paralelos, para identificar los efectos que tiene algún tratamiento.

Cómo se hacen los experimentos en la vida real

Desde que soy un niño siempre quise ser científico. Crecí con shows que mostraban personas ingeniosas haciendo experimentos interesantes para resolver sus problemas.

No fue sino hasta que fui un adolescente que me di cuenta de que mi papá era un científico de la vida real. Él me pedía que le ayudara a revisar el inglés de sus artículos, que son la forma en que se comunican los resultados científicos.

Lo interesante es que es precisamente en los estudios agrícolas donde nace la tradición de hacer experimentos para identificar los efectos que tiene un tratamiento sobre un campo.

El procedimiento es el siguiente: supón que deseas conocer si un insecticida es efectivo, i.e. logra matar muchos insectos. Tu objetivo no es realmente matar insectos, lo que tú deseas en realidad es aumentar tu producción de tomates, o lo que sea que estás sembrando.

Algo de notación

Para este ejercicio la variable resultado es el nivel de producción del campo, que denotamos con $Y$.

Llamamos tratamiento al insecticida y lo denotamos con $D$, que es una variable dummy, es decir, sus valores pueden ser $1$ o $0$, según si se aplica o no el tratamiento.

Las variables $Y$ y $D$ son vectores que contienen diferentes unidades de medición $Y_i$ y $D_i$, respectivamente. La $i$ es un indicador que nos ayuda a identificar a un invernadero específico. Puedes imaginar que tenemos un campo con $N$ invernaderos (si tienes problemas para imaginar $N$ piensa en 100 hasta que alguien te diga lo contrario) y que todos están numerados del $1$ al $N=100$. Entonces $i$ puede ser el invernadero $1$ o el $100$, o cualquier otro número intermedio.

Puede ser que algunos invernaderos reciban tratamiento. Esto lo denotamos con $D_i = 1$. Por lo tanto, cuando el invernadero $i$ no recibe tratamiento escribimos $D_i = 0$.

Entonces tenemos dos tipos de valores para la producción del invernadero $i$.

Si nunca habías visto una fórmula con llaves así, no te preocupes. Del lado derecho estamos planteando dos escenarios para $Y_i$ que dependen del valor de $D_i$. Estos dos valores no pueden darse al mismo tiempo: no puedes ponerle y a la vez no ponerle insecticida a un invernadero.

Para distinguir cada uno de estos dos escenarios le incluimos un número adicional en el superíndice. Este no es un exponente, es una forma de indicar si la producción proviene de un invernadero con tratamiento o sin él. Entonces $Y_{i}^1$ nos dice el nivel de producción del invernadero $i$ si se aplica el insecticida y $Y_{i}^0$ es el nivel de producción del mismo invernadero si no se le aplicara este tratamiento.

Como puedes imaginar, no podemos observar $Y_{i}^1$ y $Y_{i}^0$ al mismo tiempo, pues están en diferentes universos. Pero esto es justo lo que necesitamos medir si deseamos medir el efecto que tiene el insecticida en nuestro invernadero. Si pudiéramos acceder a los dos universos al mismo tiempo, la medición del efecto sería tan fácil como tomar la diferencia del rendimiento con insecticida y sin insecticida.

Para este caso, idealmente estaríamos esperando un número positivo, que nos indica que el insecticida incrementa nuestro rendimiento. Denotamos entonces al efecto del tratamiento con $\delta_i$.

No hagas una diferencia de medias simple

¿Has seguido el hilo hasta el momento? Que bueno, porque aquí es la parte en la que la mayoría se equivoca.

No podemos ir a visitar universos alternos para revisar el efecto de nuestro tratamiento, pero sí podemos observar lo que sucede en los invernaderos que aplican el insecticida y compararlos con lo que no lo aplican.

Considera que tenemos $N^0$ invernaderos a los que no se les ha aplicado el insecticida y $N^1$ a los que sí. Lo que muchos hacen en este punto es tomar una diferencia de medias para comparar.

A la ecuación anterior se le conoce como el efecto promedio del tratamiento y se denota por $E[\delta_i]$.

Falso. Tomar una diferencia de medias significa asumir que los dos invernaderos son iguales en todos los demás aspectos además del tratamiento que se les aplicó. Todo lo demás igual: ceteris paribus.

Pero la realidad normalmente es más compleja. Si tú observas dos invernaderos y notas que el que aplicó insecticida tiene mayor rendimiento que el que no, no puedes asumir inmediatamente que el efecto que estás midiendo viene del insecticida. Podría ser que en el invernadero sin insecticida la semilla es de mala calidad. Ambas cosas se deben a que el agricultor está invirtiendo menor presupuesto al invernadero.

Universos Paralelos

Intenta generalizar el ejemplo anterior a otros problemas. Si quieres conocer por ejemplo si la educación (tratamiento) representa un aumento en los ingresos (resultado), no es posible tomar la diferencia de los valores esperados. Hacer esto nos dejaría con un sesgo que conocemos como el sesgo de selección. Veamos cómo funciona.

Consideremos el siguiente caso hipotético para notar cómo la diferencia de medias puede ser engañosa. Alicia y Bob quieren decidir si asistir a una fiesta la noche antes a un examen muy importante de la clase de Econometría. Todo en economía se mide en términos de su costo de oportunidad y asistir a esa fiesta puede afectar sus calificaciones, por lo que en teoría, el efecto de asistir ($D_i = 1$) debería ser negativo.

Sin embargo, podemos encontrar cosas curiosas si no somos atentos. Alicia es una alumna que tiene un excelente promedio, habilidades matemáticas excepcionales y puso mucha atención en clase. Digamos que Alicia decidió asistir a la fiesta y aún así se sacó un 10. Lo podemos expresar en la ecuación

Donde el subíndice A nos sirve para indicar que se trata de Alicia. En este caso, si Alicia se hubiera quedado en casa para estudiar, también se hubiera sacado un 10 (Y_A^0 = 10), por lo que el efecto habría sido cero:

Naturalmente, $Y_A^0$ se refiere a algo que no existe y que no podemos ver. A estos casos que no podemos ver los vamos a llamaar contrafactuales. Para el caso de Alicia es fácil ver que se hubiera también sacado 10 porque es la máxima calificación, pero no siempre tenemos tanta suerte.

Por ejemplo, consideremos a Bob. Bob se perdió algunas clases y no tiene tantas ventajas en Econometría como las tiene Alicia, por lo que decide mejor quedarse en casa y estudiar para el examen. Imaginemos que llega el día del examen y Bob se sacó un 9.

Bob está contento con su resultado, porque si no hubiera estudiado para ese examen, seguro se habría sacado un 8 (Y_B^1 = 8). Ese 8 no existe en nuestra realidad, pero si lo pudiéramos observar, nos indicaría exactamente cuál es el efecto que asistir a la fiesta hubiera tenido para Bob:

Pero este es el efecto que encontramos si pudiéramos observar el universo paralelo en el que Bob si asistió a la fiesta. En la realidad sólo tenemos los datos de la calificación de Alicia, que si asistió a la fiesta, y Bob, que no lo hizo.

Sesgo de selección

¿Qué sucede cuando hacemos una diferencia simple de los datos que observamos? Veamos lo que sucede en la siguiente ecuación.

Esta diferencia la podemos interpretar como si asistir a la fiesta hubiera ayudado a subir las calificaciones. Nosotros sabemos que esto no es verdad, pero es lo que nos indican los datos. ¿Cuál es el error?

La ecuación anterior está contaminada con el sesgo de selección. Para verlo, podemos introducir a $Y_B^1$ en la ecuación. Hacer esto requiere que lo cancelemos para no afectar la igualdad. Manipulando un poco la ecuación, el resultado se vería así:

Esta última parte la escribí separando en dos paréntesis. El primer paréntesis muestra el efecto $\delta_B$, que mide la diferencia de lo que pasó y un contrafactual. Pero, ¿qué es lo que quedó en el segundo paréntesis? Ese es el que conocemos como el sesgo de selección, y es lo que no nos permite determinar el efecto real.

Nota que el primer paréntesis suma $-1$ mientras que el segundo deja un resultado de $+2$, que sumados nos dan el $1$ observado. Pero este no es el efecto de la fiesta, lo que pasa es que el sesgo de selección es suficientemente fuerte para cambiar el signo.

¡Genial! Te has registrado exitosamente.

¡Bienvenido de vuelta! Has iniciado sesión correctamente.

Te has suscrito correctamente a Escribe tu primer paper de Economía.

¡Éxito! Revisa tu correo electrónico para obtener el enlace mágico para iniciar sesión.

¡Éxito! Se ha actualizado la información de facturación.

No se actualizó tu información de facturación.

Sígueme en Mastodon