Escribe tu primer paper de economía

Guías de 5 minutos para economistas ocupados para escribir (y publicar) su primer paper de economía usando datos y modelos de econometría.

Marionomics: Escribe tu paper de economía

Cómo ganar un campeonato con poco presupuesto

Cómo ganar un campeonato con poco presupuesto

El béisbol es uno de los deportes en los que más disparidad hay entre equipos. Mientras que el equipo más rico —los Yankees de Nueva York —gastaba cerca de 120 millones de dólares en una temporada para la contratación de sus estrellas, los equipos más pobres como el Atlético de Oakland tenía que manejarse con sólamente 40 millones de dólares. A pesar de eso, los Oakland A's fueron uno de los equipos más efectivos, con resultados mejores a los de la mayoría de la liga y poniendo en varias ocasiones en jaque al gigante de Nueva York. ¿Cuál era su secreto?

El secreto fue que comenzaron a usar economía y estadística. De verdad.
La economía entra en juego cuando comienzas a evaluar los resultados del juego en base en un análisis de costo-beneficio, poniendo en la balanza el número de juegos ganados contra los montos que se invirtieron en cada juego. Durante los años previos al 2002, los Yankees de Nueva York eran el equipo que más gastaba y también era el equipo campeón en la época.
La fórmula parecía sencilla: más dinero significa mejores jugadores y estos jugadores traían mayores posibilidades al equipo de ganar. Los equipos de ciudades ricas no eran tímidos al usar esta fórmula: cuando la puja de los jugadores estrella llegaba a ofertas de salarios exhorbitantes.
El problema se volvía más complejo si ponemos atención a la segunda parte de la fórmula: los mejores jugadores. En particular surge la pregunta ¿Que significa que un jugador sea mejor? ¿Son los home runs? ¿Que tan importante es la velocidad? ¿La fuerza de bateo se debe considerar? (no se nada de baseball, así que dejaré al lector hacer las preguntas que podrían ser relevantes).
Aquí es cuando entra en escena Peter Brandt, un economista egresado de Yale que decidió unirse al equipo de los Oakland A's como analista, algo no muy común para la época.
En aquel entonces, la selección de los jugadores se daba con factores subjetivos de tradición, popularidad y el juicio que la mesa directiva de los equipos tenía sobre los jugadores. Este estilo de selección daba como resultado equipos que gastaban cantidades enormes de dinero contratando a jugadores mediocres.
Peter Brandt notó en esto la oportunidad de hacer un modelo de análisis que tomara factores objetivos para la selección de los jugadores. Esto permitió a los Oakland A's ganar de una manera que fue incluso descrita como una _aberración_.
El secreto de Brandt fue el registro cuidadoso de todos los aspectos que era posible registrar de los jugadores. También hizo uso de modelos de inferencia muy claros y un genial balance de estas características con el presupuesto disponible. Esto es, tomó los conocimientos principales que hacen a un economista y los aplicó de una manera totalmente innovadora.
Los datos son el nuevo petróleo
Podríamos caer en la tentación de sentirnos superiores ahora que sabemos que la estadística es una herramienta muy útil para la selección de los jugadores en el beisbol, pero esto es una trampa. Recordemos que aún en la actualidad, con la cantidad de datos y de información a la mano, muchas de las decisiones en el mundo se realizan a _ojo de buen cubero_.
La gran disponibilidad de datos que hay sobre el comportamiento de un cliente potencial nos harían pensar que las campañas publicitarias son en la actualidad un proceso basado en datos. Sin embargo, aún muchas de las decisiones de márketing en las empresas se generan en cuartos por _creativos_ sin la consulta de datos.
También existe aún un amplio camino por recorrer en ámbitos como la política. En Latinoamérica, los procesos de selección de los candidatos a puestos políticos poco tiene que ver con un conocimiento profundo de las necesidades y gustos del público objetivo e incluyen muchos juicios personales y cuotas de poder.
Todos estos ámbitos tienen el potencial de ganar y ganar en grande si logran adoptar la estadística y el uso de datos en el corazón de sus procesos. Como los A's de Oakland, son aquellos que tienen realmente el hambre de ganar, a pesar de su presupuesto, los que aprovecharán esta gran mina de oro que está a su alcance.

Cómo KitKat conquistó el mercado Japonés

Cómo KitKat conquistó el mercado Japonés

Entrar a un Mercado internacional implica riesgos y complicaciones que son imposibles de resolver con datos. Esta es la historia de un Mercado casi imposible de conquistar por una de las marcas más populares en el planeta y de cómo los métodos de la antropología y etnografía nos dan respuestas a cosas que el Big Data jamás pudo resolver.

Lo que los datos no cuentan

En los años 1970s, la compañía Rowntree's, basada en Reino Unido decidió expander las ventas de su popular chocolate Kit Kat a diferentes lugares del mundo. Kit Kat era ya entonces una marca reconocida en diferentes mercados y su famoso slogan take a break, take a Kit Kat (tómate un break, tómate un Kit Kat en México) era una pieza fundamental de su éxito y un ejemplo de mercadotecnia a nivel mundial.

Cuando Nestlé compró a la compañía en 1988, el objetivo de expander el consumo de esta barra de chocolate a todo el mundo ya estaba claro y el éxito se veía casi garantizado. En Japón fue un total fracaso.

Las oficinas centrales de Nestlé en Suiza llevaban años tratando de entender por qué el producto no lograba despegar en ventas en el país asiático. Estuvieron a punto de decidir quitar el chocolate de circulación de Japón hasta que descubrieron algo extraño. En Kumamoto, una isla al Sur del país se encuentra Kyushu (九州), y en esta ciudad la universidad Kyushu (九州大学). Analizando los datos, los investigadores de la compañía notaron que en algunas fechas especiales del año, los Kit Kats desaparecían de los estantes, para luego volver a sus deprimentes ventas regulares.

Los datos por si mismos eran imposibles de interpretar. ¿Qué pasaba en esa universidad un par de veces al año que disparaban las ventas?. Los ejecutivos de Nestlé en Japón decidieron indagar. Lo primero que hicieron fue una técnica que viene de la etnografía para identificar por qué las promesas de la marca, tan exitosas a nivel global, no estaban dando resultado en este país. Tomaron a un grupo de adolescentes y les pidieron que tomaran de un conjunto de fotografías aquellas que para ellos representaran tomar un descanso.

Para su sorpresa, ninguna de las imágenes que los jovenes usó para este ejercicio tenía nada que ver con el chocolate. El origen de la popularidad de Kit Kat en el Reino Unido era el descanso que los trabajadores tomaban entre las fábricas. En ese descanso, un aperitivo era siempre bienvenido y Kit Kat se convertía en la solución ideal para esta situación. Pero en aquel estudio los chicos japoneses no incluyeron imágenes de chocolate. En su lugar tomaron imágenes de personas escuchando música o simplemente durmiendo para representar su descanso. En Japón el descanso no tenía nada que ver con snacks. Entonces ¿qué motivaba las ventas de Kit Kat en Japón?

Seguro vencerás

Resulta que a los chicos de esa región particular de Japón el nombre de Kit Kat les recordaba a la expresión きっと勝つとぅ (Kitto katsutou o “seguro que vencerás”). Era una expresión común que se decían entre ellos para darse ánimos antes de un examen.

Las ventas de Kit Kat en Kyushu se debían a que los chicos se obsequiaban las barras de chocolate entre ellos antes de cada examen para desearse buena suerte.

Los ejecutivos de Nestlé en Japón hicieron notar esto a sus superiores en Suiza y, si estabas pensando que decidieron cambiar el nombre del chocolate a Kitto Katsu, las ventas se dispararon y todos fueron felices, te has equivocado.

En las oficinas centrales en Suiza las reglas eran muy claras y muy estrictas y la estrategia global debía seguirse al pie de la letra. Los ejecutivos en Japón no lograron cambiar el nombre de la barra de Chocolate, pero decidieron hacer un pequeño experimento sin el consentimiento expreso de las oficinas en Suiza.

Omamori

A este punto estaba claro que el slogan “tómate un descanso” jamás funcionaría en Japón. En su lugar el empaque recibió un cambio radical de imagen y usaron きっと、サクラサクよ (Kitto Sakura Saku yo, o "seguro los cerezos florecerán") como slogan. En Japón la Sakura es la flor del árbol de cerezo: una flor muy representativa y la frase era una evocación a la buena suerte. Para los ejecutivos de Nestlé en Suiza, el cambio de imagen no representaba algo tan radical: sólo una imagen bonita que se ve "más japonesa". Pero para los japoneses este cambio modificó por completo el sentido de la marca.

El diseño de Kit Kat en Japón después de los estudios de mercado.

La campaña comenzó obsequiando chocolates a los estudiantes en época de examenes. El objetivo fue aprovechar que algunos estudiantes usaban la barra como amuleto para la buena suerte. Tal vez podrían convertir a Kit Kat en alguna especie de símbolo de los buenos deseos entre estudiantes. No estaban preparados para el nivel de éxito que esta campaña tuvo.

Amuleto japonés. Fotografía: Rama

Los japoneses tienen reglas muy estrictas para muchas cosas, pero a la vez son muy prácticos. No resultó para ellos nada extraño usar un chocolate como amuleto de la buena suerte y la campaña que hicieron para Kit Kat le dio un nivel similar al de los omamori (御守) o amuletos japoneses, comunmente vendidos en templos Shinto o Budistas. En 2003, una encuesta de consumo encontró que 35 por ciento de los adolescentes japoneses estaban usando los Kit Kats como omamori, sólo seguidos del 45 por ciento de ellos que usaban los amuletos Shinto con la bendición de un sacerdote. Para 2008, la mitad de todos los estudiantes japoneses estaban usando los Kit Kat como omamori.


Los economistas nos especializamos en el uso de los datos y en ocasiones somos criticados por no ver más allá de ello. Este es un ejemplo de cómo podemos indagar y triunfar usando técnicas de investigación cualitativa. Estas técnicas tienen una larga historia y tradición y pueden aprenderse, pero no son muy comunes en los programas tradicionales de economía.

Esta historia la tomé del libro Anthrovision, que habla de cómo las técnicas de la Antropología pueden ser lo que a veces necesitamos para entender cómo solucionar muchos de los problemas que los datos no nos pueden ayudar a resolver. Estoy disfrutando mucho este libro y creo que da una genial perspectiva de muchos problemas actuales. Lo recomiendo ampliamente.

Redes Sociales en México: 7 gráficos que debes saber sobre ellas

Redes Sociales en México: 7 gráficos que debes saber sobre ellas

Esto es un extracto de la investigación que hice con mi alumna Mariana Saravia sobre el uso de las redes sociales en México tomando los datos de la ENDUTIH de INEGI 2020. En esta encuesta se concentra la información del uso de tecnologías de la información en el país y es una encuesta sumamente importante si quieres tomar cualquier tipo de decisión que involucre el uso de estas.

El primer paso es determinar el número de usuarios de internet en el país. De acuerdo a nuestras estimaciones, hay cerca de 84 millones de usuarios de internet en el país, lo cual representa cerca de un 66% de la población Mexicana con acceso a internet. De aquellos con acceso a internet, encontramos que 74.85 millones de mexicanos usa redes sociales: un 89% de los usuarios de internet y un 58.7% de la población total del país.

Los números que vas a leer a continuación vienen de ese 58.7% de los mexicanos. En el siguiente gráfico lo que observas es el número de usuarios de redes sociales en total. El alto de cada barra representa el número de usuarios estimados en millones de cada red social. No es sorpresa que las redes dominantes sean WhatsApp y Facebook, junto a su servicio de mensajería Messenger. En tercer lugar está Instagram que también es operado por Facebook, Inc.

Pero como podemos inferir, este comportamiento no es el mismo en diferentes grupos generacionales. La siguiente gráfica muestra lo que muchos sospechábamos: Facebook y WhatsApp se convirtió lentamente en el dominio de la Generación X y los Millenials, mientras que las generaciones Boomer y Z no ocupan tanto esta red social. La principal diferencia que podemos observar entre X y Millenials es en el uso de Instagram, donde el segundo grupo tiene más cuentas activas. Algo similar se observa en Twitter, que otra de las redes sociales más importantes.

Esto nos responde a la pregunta de a quién podemos encontrar en cada red social, pero también nos interesa verlo desde el punto de vista del usuario. ¿Cuáles son las redes más importantes que usa un miembro de la generación Z? por ejemplo. Por eso también graficamos el uso de las redes por generación en términos porcentuales. Esto nos da un rápido vistazo al comportamiento de cada tipo de usuario. Por ejemplo, a pesar de que en la gráfica anterior no parecía tan importante el uso de Instagram por la generación Z, esto sólo se debe a que sólo estamos considerando a los chicos de 17 años o menores como miembros de este grupo generacional y no todos son aún usuarios de redes sociales. Esto significa que, si este patrón de consumo de contenidos se mantuviera similar, la Generación Z representaría un grupo especialmente importante para esta Red Social.

Esto es, claro, si otra red no les gana el mercado. ¿Observas esa línea negra abajo de todas? Esta es la que indica otras redes sociales. Si bien de los 58 mil respondientes de la encuesta, sólo 1400 indicaron algo en esta casilla, si observamos las respuestas que estos dan, podemos encontrar algunas cosas interesantes.

En primer lugar, lo que podemos observar es que TikTok fue de las principales respuestas que se dio cuando se preguntaba por otra red social. Y muchas de esas respuestas vienen de la generación Z y un poco de Millenials. Esta encuesta se hizo en 2020, donde el número de usuarios de esta red social a nivel mundial creció de 35 millones a casi 66 con respecto a 2019. Como buenos millenials, Mariana y yo estábamos muy emocionados por usar los resultados de esta encuesta para ver el crecimiento de usuarios de esta red en México, sólo para descubrir que cuando la respuesta está en la sección de otros, no aparece tanto como habríamos esperado.

La primera recomendación aquí para el INEGI es que incluya esta red en las siguientes encuestas. La segunda es que ahora es necesario incluir una sección relativa a las herramientas de enseñanza-aprendizaje que los alumnos usan para trabajar con las clases en línea. Analizando las respuestas que dan en la sección de “otros”, encontramos frecuentemente mencionadas plataformas como Zoom y Google Meet, pero la información obtenida no es suficiente para generar inferencias respecto al uso de las Tecnologías de la Información en el aula.

Algo que tal vez resulte sorprendente es que no existe diferencia significativa en las proporciones de uso de las redes sociales por tamaño de localidad. Tratamos de ver si en las ciudades grandes alguna red era más popular que otras en comparación de las localidades pequeñas, pero aparentemente, el comportamiento es más o menos el mismo.

Hay algunas variaciones en los patrones de consumo entre estados, pero no son tan significativos. Lo que sí presenta una variación tremenda es el acceso a internet y su consecuente proporcionalidad en el uso de redes sociales. El caso que mas salta a la vista en la gráfica es el de Chiapas, donde sólo un 46% de la población tiene acceso a este servicio. También estados como Guerrero, Oaxaca y Veracruz tienen problemas similares, donde el acceso a internet es limitado y no hay mucho que decir sobre el uso de redes sociales.

Las diferencias por estrato socioeconómico también son muy ligeras y en muchos casos no son significativas estadísticamente. El gráfico arriba muestra el uso de las redes por estrato socioeconómico como lo clasifica el mismo INEGI. Aquí vemos que parece haber un ligero aumento de redes como Instagram o Twitter en los estratos Medio Alto o Alto en términos porcentuales. Esta proporción viene del uso de WhatsApp y Facebook, más común en los estratos bajos.

Mientras que los estratos socioeconómicos mostraron dificultades para encontrar diferencias de uso estadísticamente significativos, hay suficiente variación en el nivel educativo para encontrar patrones relevantes. El siguiente gráfico muestra más claramente cómo el uso de plataformas como Twitter e Instagram tienen mayor prevalencia entre las personas con educación universitaria o superior y cómo cambian los comportamiento de uso de las tecnologías que nos pone a disposición la encuesta para estudiar.

Un detalle importante de las redes sociales es que nadie usa solamente una. Quisimos encontrar si existía correlación en el uso de una red con el uso de otra, con el fin de identificar patrones de consumo consistentes. De acuerdo a la información que estuvimos presentando, por ejemplo, podríamos pensar que una persona que usa Instagram casi seguramente usa Twitter, pero no encontramos ninguna evidencia al respecto. El siguiente gráfico muestra que, si bien algunas redes están más relacionadas con otras, no parece haber un patrón definido que nos permita decir con certeza en cuál otra red está una persona una vez que sabemos que está en una.

El poder de la diversidad

El poder de la diversidad

Acabo de mandar un artículo a revisión. Me puse como reto terminarlo antes de que acabara Junio, con motivo del mes del orgullo y con una temática que está relacionada. Se trata de un análisis de los costos que las empresas tienen al discriminar en el mercado laboral.

Normalmente, la discriminación laboral se trabaja desde el punto de vista de la persona discriminada. Nos enfocamos en los costos que a estas personas les conlleva tener menores oportunidades laborales o el hecho de que reciben menores sueldos por trabajos iguales. Todo esto está muy bien, pero creo que si de verdad queremos que las empresas se involucren en la creación de un mundo mejor, es necesario hacer patentes los costos que estos tienen al discriminar.

¿Por qué las empresas discriminan?

Las teorías básicas que los economistas consideramos al momento de hablar de discrminación son la discriminación por gustos (Becker, 1971) y la discriminación estadística (Arrow, 1971 y Phelps, 1971). En la primera, las personas discriminadas tienen que compensar su condición que los hace discriminados para poder alcanzar un sueldo similar al de sus pares de un grupo social que no es discriminado. Por ejemplo, las mujeres requieren de mostrar mayor compromiso en el trabajo del que se requiere a los hombres para obtener el mismo nivel salarial y las mismas oportunidades.

En la discriminación por gustos, el parámetro del gusto es exógeno y puede ser muy arbitrario. Esto ocasionó como respuesta la discriminación estadística. En ella, los agentes discriminan por algo que han observado y son racionales al tomar la decisión de discriminar. Por ejemplo, si se decide contratar a un guardia de seguridad, una empresa puede argumentar que prefiere a una persona que no tiene antecedentes penales, pues estos suelen estar correlacionados con que la persona que contraten recaiga.

Esta última postura ha sido, naturalmente, criticada por poder usarse como excusa para ser abiertamente discriminante. Después de todo, la imposibilidad de una persona de encontrar un trabajo formal puede ser en si un factor importante para hacer que recaiga en actividades criminales.

Para entender mejor por qué la discriminación implica un costo para la empresa es necesario entender de donde viene la diversidad.

La tecnología promueve la diversidad

En el siglo XIV la navegación a través del atlántico virtualmente no existía. Es más, ni se imaginaba por la mayoría de las personas. En la actualidad, todos los días miles de personas cruzan el oceano atlántico por mar o por aire.

Este avance tecnológico hace que tengamos a nuestra disposición bienes, servicios, ideas y capital del otro lado del oceano para nuestro disfrute, Pero también es esta la tecnología que permite que personas de diferentes culturas puedan llegar a un lugar nuevo, para bien o para mal.

Desde que la guerra civil en Siria dio sus inicios en 2011, más de seis millones de personas han tenido que dejar sus hogares (OCHA, 2021) atravesando condiciones muy extremas para llegar a diferentes regiones de Europa. Si bien fue una crisis humanitaria la que los ha orillado a dejar sus hogares, fue la tecnología la que los permitió llegar a salvo a sus destinos. El uso de los teléfonos celulares resultó crucial para orientarse usando GPS y para comunicarse para obtener apoyo para llegar a sus destinos (Göransson, Hultin & Mähring, 2020).

No solo es a través de la migración que la tecnología promueve la diversidad. También son avances legales aunados a la tecnología que permiten que más personas se incorporen en el mercado laboral. En los años setenta, tras la aprobación de la píldora anticonceptiva, las mujeres en Estados Unidos empezaron a retrasar más el nacimiento de su primer hijo y dedicaron más tiempo a estudiar y cultivar una carrera (Goldin & Katz, 2002). Esto ha llevado a un incremento de mujeres en puestos que antes habrían sido imposibles.

Puede sonarnos ahora increíble, pero antes ver una mujer médico o abogada sonaba implausible. Antes de la llegada de la píldora, una mujer tenía que pensarlo antes de invertir el dinero y el tiempo necesario en perseguir una carrera, solo para terminar embarazada y acabar absorta en las tareas de cuidado.

Así también podemos rastrear el origen de la inclusión de diferentes grupos sociales al campo laboral en las tecnologías que le dieron pie. En ocasiones, veremos que la tecnología es de carácter legal (como las reformas a las leyes antidiscriminatorias) o de avances científicos (cómo los tratamientos hormonales, que permiten que una persona trans logre cambiar al sexo con el que se identifica). En todos los casos, la inclusión representa un reto de algún modo y en algún nivel.

Los costos de la no inclusión

Los economistas procuramos ver el mundo a través de los ojos del homo economicus: ese ser ultra racional que, al estilo del señor Spock en Viaje a las Estrellas, busca siempre la respuesta racional. La respuesta que satisfaga un modelo de optimización utilitarista.

La razón por la que este modo de pensar es valioso es porque no esperamos que las empresas se vuelvan inclusivas por mero altruismo, sino que buscamos cuáles podrían ser las razones egoístas por las que ellas querrían abrazar la diversidad.

En este sentido, cuando me refiero a los costos de la no inclusión, estoy hablando de aquellos que consideraría una empresa aunque no tuviera ningún interés en participar de manera genuina en la inclusión de otras comunidades.

En particular los que consideré en el artículo son los costos de oportunidad por innovación y por la captación de nuevos mercados dentro de las comunidades que estos empleados representan. El primer costo de oportunidad asume que las empresas contratan con una idea desactualizada de los niveles de productividad de la comunidad discriminada. Por ejemplo, es posible que la empresa considere que una persona con discapacidad visual no tiene posibilidad de hacer trabajo de oficina, sin considerar que los lectores de pantalla le dan la capacidad de leer, escribir y hacer muchas de las tareas de oficina sin mayor problema. En este caso los niveles de productividad entre una persona con discapacidad visual y una que no lo tiene podrían ser los mismos, pero la empresa no lo sabe y se está perdiendo de la productividad que esta persona le daría a la empresa.

El segundo tipo de costo viene por la captación de nuevos mercados. En How I Built This, Guy Raz muestra cómo empresas como The Lip Bar o FUBU lograron abrirse paso en un mercado que no consideraba sus comunidades y crearon productos únicos que cambiaron el mercado, generando millones de dólares en ganancias. Por ejemplo, Melissa Butler fundó The Lip Bar como resultado de su frustración de no encontrar cosméticos que se adaptaran bien a su piel oscura.

¿Que se puede hacer? ¿Que siguiente pasos existen?

Es importante hacer más investigación sobre las políticas que se pueden usar en una empresa que esté interesada en ser más incluyente. Existe poca investigación empírica sobre lo que funciona y lo que no de manera general. Hay una importante oportunidad para investigar sobre los posibles efectos adversos que nos generarían las soluciones más obvias para mejorar la inclusión y algo más en demostraciones empíricas del funcionamiento de otras.

Por ejemplo, a mi me sorprende ver que, en una evaluación del permiso parental de Suecia, este no parece tener mucho impacto en el cierre de brechas laborales o de salarios (Ekberg, Eriksson & Friebel, 2013). Para mi es sorprendente, pues pensaría que este cambio abriría mucho las puertas para permitir que las mujeres se abrieran camino en sus carreras, repartiendo los cuidados de manera más igualitaria.

¿Qué me faltó?

Admito que mi visión puede estar un tanto sesgada. Podría no estar notando algunos aspectos importantes o costos relevantes ¿Que me faltó? Pónmelo en los comentarios.


Referencias

Cómo poner un VAR

Cómo poner un VAR

Curiosamente, si podría haber hecho un post sobre cómo poner un BAR. No muchos saben esto, pero tuve esa experiencia cuando era joven. Eso lo contaré en otra ocasión, porque no quiero dejar este tutorial a medias.

Lo que verás en este boletín:

  • Como implementar el modelo VAR para series de tiempo.
  • Cómo hacer proyecciones a futuro con el modelo VAR.
  • La decisión de Banxico de subir la tasa de interés y que significa

En esta ocasión quisiera terminar el tutorial que hicimos la semana pasada, usando los mismos datos y las mismas pruebas. A este punto ya nos aseguramos que las variables tienen una relación entre sí y que habrá un modelo interesante que podremos trabajar entre ellas. También hicimos una prueba para verificar que la serie fuera estacionaria y tuvimos que usar la segunda diferencia al sistema para poder trabajar con ella. La serie ya diferenciada se ve así:

Usaremos la función VAR de la librería vars para hacer este modelo. La función VAR acepta como argumento el número de rezagos que usaremos en el modelo. Recuerda que puedes ver el tutorial pasado para descargar los datos y hacer los diagnósticos requeridos.

Para hacer una serie de modelos VAR y evaluarlos por medio de su AIC, usa el siguiente código:

for (rezago in 1:11) {
  modelo <- vars::VAR(diff_train, p = rezago)
  print(paste("Rezagos:", rezago," AIC:",round(AIC(modelo),0)))
}

Esto te debe de mostrar los resultados de la prueba de Akaike. Recuerda que Akaike es una prueba que se hace comparando los resultados. En este caso, nos muestra que 11 rezagos son los que dan mejor resultado. Podemos corroborar este resultado usando

vars::VARselect(diff_train, lag.max = 11)

que nos muestra además otros criterios de selección. En todos los criterios nos aparece 11 como nuestra mejor opción, así que es la que usaremos para nuestro modelo de proyección.

El código para hacer proyecciones una vez que ya tenemos el modelo listo y mostrar un gráfico con todas las variables es simplemente

prediccion <- predict(modelo, n.ahead = 4)
plot(predict(modelo, n.ahead = 4))

Más sobre la inflación

Las preocupaciones por la inflación siguen creciendo. Ante esto, Banxico decidió incrementar en 25 puntos base el objetivo de la tasa de interés interbancaria a 4.25%. Esto ante la inflación del primer trimestre de 2021, que se revela en 0.34% (más de 6% anual). Esto contrasta con la decisión de la Fed de mantener las tasas y sólo anunciar que subirán en algún momento en el futuro.

Recordemos que parte de esta subida de precios puede sólo ser el rebote de la baja en los precios del año pasado, pero no está de más ser cuidadosos. El problema de la endogeneidad es que jamás podremos saber si la medida fue la adecuada en el momento correcto. Sólo podemos ser precavidos.

Pero el anuncio de Banxico si sorprendió mucho a muchos expertos y analistas. La razón no es sólo que fuera en una dirección distinta a la de la Fed. También los motivos que Banxico expresó fueron un tanto desconcertantes, en el sentido de que están todos enfocados en la oferta pero no hay mucho sobre los efectos del lado de la demanda.

En un contexto en el que México no ha tenido la misma recuperación económica que Estados Unidos, a muchos inversionistas les pareció un poco apresuradas las medidas que se tomaron.

Pero probablemente esa sea la idea. Había especulaciones sobre el tipo de cambio en reacción a las noticias, pero no parecieron ser realmente tan fuertes como algunos presagiaron.

La Guía Definitiva para hacer modelos VAR de Series de Tiempo

La Guía Definitiva para hacer modelos VAR de Series de Tiempo

Otra vez toca un post técnico. En esta ocasión veremos uno de los modelos más utilizados en los trabajos de series de tiempo. Desde que Sims (1990) presentó su trabajo seminal, su uso se ha popularizado por ser una forma intuitiva de pensar en las relaciones causales entre variables. Sólo ese artículo de Sims tiene más de 16 mil citas en Google Académico. Sin embargo, su uso ha caído considerablemente en los últimos años. En la siguiente imagen podemos ver que la técnica tuvo dos auges: uno pocos años después de su lanzamiento por Sims y otro algunos años más adelante en los años 2000.

No obstante, es innegable que sigue siendo una técnica extremadamente popular, con mayor número de menciones en Ngram incluso de Diferencias en Diferencias, una técnica relativamente nueva de modelos en Panel que s motivo de discusión común hoy en día entre los expertos en econometría.

Este post tiene un poco más de técnica que los de las semanas pasadas. Así que, si quieres seguir el tutorial, te recomiendo que guardes este correo, lo pongas en favoritos o que compartas el link del post en Twitter (así le hago a veces para poder encontrar mas fácil mis tutoriales).

Intuición del modelo

El modelo VAR se llama así porque en inglés significa Vector Autorregression Models. La traducción literal sería autorregresión de vectores, pero se elige llamarle vectores autorregresivos porque mantiene las siglas sin perder mucho el significado. Vale la pena rescatar que el VAR de los econometristas vino muchísimo primero que el videoarbitraje que se usa en los partidos de futbol. Tenemos preferencia.

Pero, ¿que significa que un modelo sea autoregresivo? el nombre implica que cada variable se modela como una función de valores pasados. Es decir, los predictores son rezagos de la serie.

Esto debe de hacerte pensar en los modelos ARIMA. En este caso la serie de tiempo se modela como una combinación lineal de sus propios rezagos. Los valores pasados de la serie se usan para proyectar al futuro los valores. Un modelo típico de tipo AR(p) se ve algo así

En comparación, un modelo VAR hace que cada variable sea la combinación lineal de los valores pasados de sí misma y de los valores pasados de otras variables en el sistema. Un modelo de tipo VAR(2) que tiene tres variable se ve como un sistema de ecuaciones así

El proceso que usaremos en este tutorial es que haremos un análisis de la serie de tiempo, y encontraremos el orden óptimo del modelo. Usaremos este modelo para crear predicciones y probaremos las predicciones en un subconjunto de la serie.

Importando la base de datos

Para estos ejemplos usaremos las siguientes librerías. Recuerda que si no las tienes es necesario descargarlas usando install.packages().

library(tidyverse) library(xts) library(reshape) library(urca) library(tseries) 

Los datos se alojan en un repositorio en Github. Para extraer la información que usaremos para este proyecto usamos.

path <- '<https://raw.githubusercontent.com/selva86/datasets/master/Raotbl6.csv>'  
df <- read.csv(path) head(df) 

Esta base de datos se basa en este artículo de Mehra (1994) sobre el proceso de la inflación y el crecimiento de salarios. Se compone por 8 series de tiempo: el Producto Nacional Bruto (GNP) en términos reales rgnp. También tiene el GNP potencial en términos reales pgnp, el costo unitario por el trabajo ulc, el deflactor de los gastos de consumo personal excluyendo alimentación y energía gdfco, el deflactor del GNP gdf, el deflactor de importaciones gdfim, el deflactor de alimentación en los gastos de consumo personal gdfcf y el de energía, también dentro de los gastos de consumo personal gdfce. Todos los deflactores son de ponderación fija.

Hagamos primero un análisis visual de los datos generando una gráfica de líneas para cada una de las variables. Usaremos ggplot para esto

df %>%    
reshape2::melt(id = "date") %>%   ggplot(aes(x = as.Date(date), y = value, group = variable))+   geom_line()+   facet_wrap(~variable, scales = 'free_y')+
labs(x = 'Date', y = 'Value') 

Hagamos un objeto de tipo xts con la base de datos. En la sintaxis que uso estoy asumiendo que tal vez olvidaste cargar la librería xts. Es también una buena práctica en ocasiones para liberar espacio RAM en la computadora y para ser muy claro si alguien más está viendo el código.

df_ts <- xts::xts(df[,-1],                    order.by = as.Date(df[,1])) 

Análisis de Causalidad de Granger

La base detrás del modelo VAR es que cada una de las series de tiempo en el sistema tienen influencia en las demás. Es decir, podemos predecir la serie de tiempo para una serie utilizando los rezagos de la otra. Podemos probar esta primera hipótesis usando el test de causalidad de Granger incluso antes de comenzar a construir nuestro modelos.

En el test de causalidad de Granger, la hipótesis nula es que los coeficientes de los valores pasados en la ecuación de regresión es cero. Por lo tanto, si el valor p que nos arroje la prueba es menor al nivel de significancia de 0.5, entonces podremos rechazar la hipótesis nula.

En el siguiente código, hacemos un ciclo en el que probamos el modelo para todas las variables. Al final de cada iteración, R nos muestra únicamente los resultados del valor p para cada prueba que hacemos.

for (variable in names(df[,-1])) {   
granger <- vars::causality(vars::VAR(df_ts, p = 2,                                        type = "const",                                         season = NULL,                                        exogen = NULL),                              cause = variable)   

print(paste(variable, ": ", granger$Granger$p.value)) }

 # [1] "rgnp :  9.60699087370065e-05"
 # [1] "pgnp :  1.2863997738144e-06" 
# [1] "ulc :  5.20911812224023e-05" # [1] "gdfco :  0.00164865926316504" # [1] "gdf :  0.00648726819878298"
 # [1] "gdfim :  0.0442774724624662"
 # [1] "gdfcf :  0.0173597595666217"
 # [1] "gdfce :  0.00868421111725359" 

Podemos hacer pruebas con diferentes niveles de rezago. En este caso, encontramos que dos rezagos nos dan un nivel bastante bueno de causalidad en el sentido de Granger. Esto nos indica que es posible hacer un modelo con este sistema, pues todas las variables en la misma parecen tener causalidad en las demás. El siguiente paso es hacer una prueba de cointegración.

Cointegración

La prueba de cointegración ayuda a establecer la presencia de una conexión estadísticamente significativa entre dos o más series de tiempo. Cuando se tienen dos o más series de tiempo y existe una combinación lineal de ellas que tiene un orden de integración (d) menor al de la serie individual, se dice que la serie está cointegrada.

¿Y esto que significa? Cuando dos o más series de tiempo están cointegradas, significa que tienen una relación estadística significativa en el largo plazo. Esta condición es necesaria para cumplir con la premisa de los modelos VAR. Por eso es una buena idea implementar la prueba de cointegración antes de empezar a construir los modelos VAR.

Afortunadamente, Johansen (1991) nos muestra un método para implementar esta prueba. En la prueba de cointegración de Johansen, la hipótesis alternativa para el eigenvalor de la prueba es que hay $r + 1$ relaciones de cointegración. Por lo tanto es una prueba secuencial: primero pruebas para $r= 0$, después para $r = 1$, y así hasta encontrar la prueba en la que $H_0$ se rechaza por primera vez.

Podemos implementar esta prueba con el uso de la siguiente función dentro de la librería urca.

johansen <- ca.jo(df[,-1],  type = 'trace', ecdet = 'trend', spec = 'transitory') summary(johansen) 

¡Este método nos muestra cointegración en nuestro sistema!

Alternativamente, también se puede usar la prueba Dickey Fuller para obtener el mismo tipo de resultado.

for (var in names(df[,-1])) {   df_test <- ur.df(df_ts[,var],                     lags = 6, selectlags = "AIC",                     type = "drift")   print(var)   print(df_test) } 

Comencemos con el modelo

Una vez con luz verde de los diagnósticos, podemos enfocarnos al modelo. Para eso primero partiremos nuestra serie en una serie de prueba y otra de entrenamiento, que nos permita generar un modelo a partir del cual haremos predicciones sobre la prueba.

Usaremos el modelo para predecir las siguientes 4 observaciones de los datos:

train <- df_ts[-((n-4):n),] test <- df_ts[(n-4):n,] 

El siguiente paso es verificar estacionariedad. Para eso haremos nuestra prueba de Dickey-Fuller aumentada para revisar la existencia de raíces unitarias.

La prueba de Dickey Fuller Aumentada permite los procesos autorregresivos de alto orden, incluyendo $\Delta_{x_{t-p}}$ en el modelo.

for (var in names(train)) {   adf <- tseries::adf.test(train[,var],                            alternative = 'stationary',                            k = trunc((length(train)-1)^(1/3)))   print(var)   print(adf) } 

El resultado de esta prueba nos muestra que ninguna serie es estacionaria. Haremos por lo tanto diferenciación de todas las variables al mismo tiempo. Afortunadamente, R hace muy fácil esto usando únicamente diff(train). Al correr el modelo encontramos que algunas de las variables aún no son estacionarias. Esto lo podemos también observar de manera gráfica usando plot de la variable diferenciada.

Por lo tanto, usaremos la segunda diferencia para llevar a cabo este modelo

diff_train <- diff(train, na.pad = F, lag = 2) 

Y esto es todo por hoy en este proyecto. En la siguiente semana ya haremos el modelo y haremos pruebas con él para lograr hacer predicciones. También haremos algunos comentarios respecto a su implementación y algunos aspectos prácticos al respecto.


Referencias

  • Sims, C. (1980). Macroeconomics and Reality. Econometrica, 48(1), 1-48. doi:10.2307/1912017
  • Mehra Y.P. (1994) Wage Growth and the Inflation Process: An Empirical Approach. In: Rao B.B. (eds) Cointegration. Palgrave Macmillan, London. https://doi.org/10.1007/978-1-349-23529-2_5
  • Johansen, S. (1991). Estimation and Hypothesis Testing of Cointegration Vectors in Gaussian Vector Autoregressive Models. Econometrica, 59(6), 1551-1580. doi:10.2307/2938278

Los mercados

Hoy es un día muy importante para los mercados. Hoy es el anuncio de política monetaria de Jerome Powell. En este, Jerome nos dará la pauta de lo que vendrá para los próximos meses.

Este anuncio es particularmente importante porque la FED ha estado inyectando dinero a la economía de una manera nunca antes vista de manera contínua. Hasta el momento lo había hecho sin preocupaciones de la inflación, pero esta vez los indicadores de inflación sugieren que probablemente los estímulos paren y que la tasa de interés podría subir.

Es una situación muy estresante para un documento tan aburrido y críptico en su lectura (eso es por diseño). Particularmente porque ya ha pasado que el mercado haga un berrinche cuando los estímulos paran. Esperemos que el anuncio de Powell sea lo suficientemente sutil para que la reacción de los mercados sea favorable.

Cómo volverte millonario contando historias

Cómo volverte millonario contando historias

Hace unos 70,000 años, una especie de homínido comenzó a abrirse paso entre las especies existentes por medio de su inteligencia. El Homo Sapiens pasó en muy poco tiempo de ser una especie sin mucha relevancia a prácticamente dominar el planeta.

Pero no fue su capacidad de hacer herramientas, como muchos consideran. No es la capacidad de crear fuego o de construir casas, ropa y armas lo que nos dió la ventaja definitiva sobre otras especies: fue nuestra capacidad de crear historias.

Las historias son algo tan ubicuo que no notamos lo mucho que las usamos, lo mucho que dependemos de ellas y lo poderosas que pueden llegar a ser.

Considera el caso de John Law, un economista escocés del siglo XVII que básicamente inventó el papel moneda y vio la creación y destrucción de una economía muy parecida a la que tenemos hoy en día. Después de ser sentenciado a muerte en 1694, escapó de noche de la cárcel y logró subirse a un bote para escapar a Ámsterdam.

Law tenía una gran habilidad matemática y le interesaba mucho la recién creada teoría de la probabilidad. Tenía relativamente poco tiempo de que Pierre de Fermat y Blaise Pascal trajeran los principios de la probabilidad a la luz. John Law se interesó mucho en ellos y aprendió todo lo que pudo al respecto para hacerse su nombre como un gran apostador en Francia y Países Bajos.

En 1705, Law publicó un libro en el que lanza una propuesta revolucionaria para dejar los metales como medio de cambio y adoptar un sistema basado únicamente en el papel moneda. Algo muy parecido a lo que hacemos en la actualidad. El libro no logró convencer en su momento, pero como dijo James Buchan en Frozen Desire:

(...) contenía el germen (...) del sistema.

Este germen fue creciendo conforme la necesidad de su uso se incrementó en Europa. Particularmente Francia, donde Law vio una oportunidad de llevar su planteamiento.

La deuda del gobierno Francés en este momento era tanta que la corona francesa estaba llevando a fundir sus cubiertos para obtener el oro necesario para pagar sus deudas. John Law les hizo la propuesta: "¿Por qué no imprimes más dinero?".

Resulta que la oportunidad de oro (de papel moneda no suena tan bien) para Law era que el regente era amigo suyo. Un viejo conocido de las apuestas a las que Law era tan aficionado. El Rey, Luis XV estaba en ese entonces ocupado con otros asuntos (tenía 5 años).

El papel moneda requiere de una red muy compleja de confianza en cosas que, si lo pensamos, no existen en la realidad. Un chimpancé puede alertar a sus compañeros chimpancés que viene un león, pero no puede transmitir conceptos complejos como monarquía o dinero. De hecho, se identifica que los humanos no tenemos la capacidad de organizarnos en grupos mayores a 150 personas de manera natural.

Lo que logra que seamos capaces de incrementar ese número es nuestra capacidad de contar historias. Uno de los papeles centrales de la religión es la identificación de grupos comunes mayores a las personas que podemos conocer. Podemos viajar de México a Alemania y de regreso porque confiamos en las historias que hay detrás de nuestro pasaporte; del dinero que usamos para comprar nuestra habitación en el hotel, nuestro boleto de viaje y nuestros alimentos; del tipo de cambio y de un largo etcétera de historias que si las analizamos, son solo eso, historias.

Al final, John Law creó un sistema monetario moderno prácticamente él solo. Pero fue precisamente la falta de confianza en el sistema (causada por errores que podremos ver más adelante) lo que causó que en poco tiempo, este sistema cayera y quedara nuevamente en el olvido casi hasta las épocas modernas.

Antes de John Law, la palabra millonario no existía. Fueron sus acciones las que hicieron que esta palabra naciera. Así, día con día, nuestras acciones van creando redes de conceptos e ideas que, aunque no sean tan reales como un león en la sabana, tienen efectos gigantescos en las vidas de millones de personas. Así como John Law, puedes volverte millonario si hay una buena historia que lo respalde.

Si piensas que esto es una exageración, piensa que hoy mismo puedes abrir una cuenta de Instagram y comenzar a crear una marca. Esta marca podría ser, por ejemplo, sobre productos sustentables. Una marca es una historia. Si la historia es buena, puede llevar a suficientes personas a confiar en tu producto. Puedes usar la marca para promocionar bienes y servicios. Puedes llegar muy lejos.


El lunes 14 de Junio tendremos el Taller de Exploración de la ENIGH: Un enfoque de cuidados. Es un ejercicio que estamos haciendo con el GIECAE para comprender mejor la demanda de cuidados en México. Aún hay tiempo de registrarse para ser parte del evento.

También quiero aprovechar para agradecer a quienes comparten estos textos. Gracias a ustedes esta comunidad crece cada semana.

No se si sabías, pero puedes contestar a este texto desde el correo si estás suscrito (si no, ¿que esperas?). Me puedes hacer preguntas y decirme sobre lo que te interesaría que escribiera.

Cómo votar sin aprender nada de los candidatos

Cómo votar sin aprender nada de los candidatos

Durante toda la campaña estuvimos escuchando sobre diferentes alternativas para el voto. Lo normal es escuchar que cada uno de los partidos nos pidan el voto directamente, pero en esta ocasión hubo una coalición un tanto extraña en la que PRI, PAN y PRD unieron fuerzas para intentar vencer a MORENA en las elecciones. Como parte de su estrategia, promovieron mucho el "voto útil" contra MORENA, bajo el argumento de que este ayudaría a desconcentrar el poder.

Pero si la intención es una distribución más equitativa del poder, la mejor opción probablemente no sea elegir. Probablemente lo mejor que se pueda hacer sin mayor información es votar de manera aleatoria.

Me explico. De acuerdo a la Poll of Polls de oraculus.mx, MORENA mantendrá un 41% del aparato legislativo. Menor al 50% mas uno que necesitaría si se busca la mayoría absoluta que se necesita para reformar las leyes y aprobar el presupuesto anual. Esto sería menos de lo que en Morena querrían, pero probablemente a los demás partidos les parecerá demasiado. Nadie va a quedar contento en esta elección.

Proyecciones para elecciones 2021 en México. Fuente: oraculus.mx

Esta es en teoría la justificación para hacer voto útil: desconcentrar el poder del legislativo para que no quede en las manos del presidente. Esto puede sonar razonable: de acuerdo a un análisis realizado por Rafael Prieto, la mayoría de las propuestas de los candidatos se concentran únicamente en dar continuidad con el proyecto de la cuarta transformación (lo que sea que eso signifique) y "votar lo que el presidente diga".

Sin embargo, un argumento en contra del voto útil es que este implica una regresión a "los de antes", al régimen anterior. En esta columna, Viridiana Ríos identifica entre los votantes de MORENA a los que llama "votantes verdugos", cuyo voto es aún un castigo al PRI y al PAN, a quienes identifica como los causantes de la corrupción, violencia y desigualdad, entre otros problemas que actualmente vivimos.

Mi solución: Vota aleatorio

Si todo esto te parece abrumador y confuso, pero aún consideras que es necesario expresar tu voto, puedes tomar una solución relativamente sencilla: vota de manera aleatoria. Mis motivos son tres: ayuda a distribuir el poder, sirve como un voto de castigo más efectivo y no requiere que aprendas tanto de los candidatos para que tu voto se parezca más a un voto informado.
Si tu intención es que el poder quede mejor distribuido, un voto aleatorio es mucho más poderoso que tratar de elegir el que le va a causar más peso al ganador. Si toda persona indecisa hiciera eso, los lugares del legislativo quedarían más distribuidos entre partidos.
Sería un voto de castigo más efectivo que el voto en blanco o cancelar el voto porque beneficiaría a los partidos más chicos más que a los grandes. Si todos los partidos son igual de malos, entonces no importa a quién elijas, pero muy probablemente no estarás eligiendo a quien está ya en el poder. En cambio, cancelar el voto beneficia efectivamente al puntero de la elección.
Lo más importante es que no necesita que aprendas nada de los candidatos en absoluto. Si la única comunicación que hicieron llegar durante las campañas fueron chistes, chismes y ocurrencias, probablemente eso no es un excelente indicador del rendimiento como gobernante o legislador.

Las ocurrencias de esta campaña hicieron muchos memes, pero no informan mucho al votante sobre política pública.

Mundo real y posibles incentivos

Con algo de suerte, la última condición podría tener dos efectos secundarios: que con menos carga cognitiva, más personas salgan a votar y que los candidatos en el largo plazo tengan mejores estrategias de comunicación de las políticas públicas que respaldan, para evitar ese voto aleatorio. Después de todo, un voto aleatorio tiene más probabilidad que sea por cualquiera de los demás partidos y no al mío.

Está bien, admito que esto es sólo un ejercicio de imaginación con un planteamiento que tiene sus propias complicaciones en la vida real. En particular, a menos de que el voto aleatorio fuera masivo, los beneficios del mismo no se disfrutan. Pero eso ya sucede: nuestro voto de manera individual no tiene gran efecto en comparación al voto que se moviliza por otros medios como las estructuras de partidos o los líderes sociales.

Cómo hacer un voto aleatorio

La primera opción es con un método que puede tener algo de sesgo, pero creo que muchos estarían más conformes con el resultado si ya tienen algo de información previa. El primer paso es recortar las opciones a seis, quitando aquellas opciones por las que nunca votarías. Por ejemplo, yo estoy seguro de que jamás votaría por un partido ultra religioso como el PES, así que lo podría quitar sin ninguna culpa. El segundo paso sería hacer una lista que asigne a cada partido restante un número del uno al seis. El tercer paso es lanzar un dado y dar mi voto al partido que me salga.

La segunda forma puede incluir todos los partidos que desees. La página de random.org tiene una opción para hacer listas aleatorias. Selecciona Lists and More y luego List Randomizer. Luego por las opciones en la caja de texto, una por cada línea en la caja. Cuando presionas Randomize! la página te regresa la lista ordenada en un orden aleatorio de preferencias. Elige la primera y vota.

Hay una tercera forma, pero esta requiere de R. Sólo corre la siguiente línea en la consola:

sample(c("Morena", "PRI", "PAN"),1) 

Sólo completa la lista con todos los partidos y presiona enter y tendrás tu respuesta.


Pues ya salimos del COVID. Mi esposa tuvo un poco más de síntomas, pero nunca fue algo de preocupación. Yo estuve un tanto mejor, pero me tocó cuidar a todos y eso en las condiciones que tenía era totalmente extenuante. Afortunadamente todo sigue bien. El Taller de Exploración de la ENIGH con enfoque de cuidados sigue en pie, cambiando la fecha al lunes 14 de Junio a las 13 horas (hora de CDMX). Si te interesa asistir me puedes contestar a este correo para recibir la información. También puedes ponerlo en los comentarios, si lo estás leyendo en la página. ¡Nos vemos ahí!

¡Genial! Te has registrado exitosamente.

¡Bienvenido de vuelta! Has iniciado sesión correctamente.

Te has suscrito correctamente a Marionomics: Escribe tu paper de economía.

¡Éxito! Revisa tu correo electrónico para obtener el enlace mágico para iniciar sesión.

¡Éxito! Se ha actualizado la información de facturación.

No se actualizó tu información de facturación.