Escribe tu primer paper de economía

La mayoría de los economistas tienen problemas para escribir textos académicos. Explorar sobre econometría es complejo y es difícil estar al corriente con las tendencias de investigación. Aquí encontrarás tutoriales de econometría en R y Python, deep dives en literatura reciente y modelos de trabajo para hacer tu escritura más fácil y publicar con éxito. Publica un paper que te posicione en tu área y te permita obtener un trabajo de investigador.

Escribe tu primer paper de Economía

El verdadero costo de una reunión

El verdadero costo de una reunión

¿Cuánto cuesta una reunión?

Hay una forma sencilla de calcular el costo de una reunión: suma el total de los ingresos de los asistentes por hora y multiplícalo por el número de horas de la reunión.

Por ejemplo, digamos que Alicia convoca a una junta en su empresa para definir la estrategia de marketing. En la reunión estará Bob, el jefe del departamento de Mercadotecnia, Carlos de Finanzas y Diana, de ventas.

La siguiente tabla muestra los ingresos, calculados con un promedio de 24 días laborales en el mes y ocho horas al día. El costo está expresado en dólares:

Esto nos da un costo de 110.36 dólares por hora de la reunión. Si la reunión durara 3 horas, el costo sería de $331.08 dólares (unos 6,621.6 pesos mexicanos).

Pero ese no es el único costo que debemos considerar. Además de los ingresos de los asistentes, podrían haber costos de transporte y tal vez los viáticos de quienes asisten, si es que tienen que viajar. Estos gastos se deben agregar al costo total de la reunión para obtener el verdadero costo de la reunión.

Esto nos da un costo de 110.36 dólares por hora de la reunión. Si la reunión durara 3 horas, el costo sería de $331.08 dólares (unos 6,621.6 pesos mexicanos).

Pero ese no es el único costo que debemos considerar. Además de los ingresos de los asistentes, podrían haber costos de transporte y tal vez los viáticos de quienes asisten, si es que tienen que viajar. Estos gastos se deben agregar al costo total de la reunión para obtener el verdadero costo de la reunión.

También se debe considerar el costo de oportunidad de la reunión: ¿Qué otra cosa podrían estar haciendo los asistentes? Tal vez sean más productivos trabajando en otra cosa que atendiendo la reunión.

Por otro lado, las reuniones pueden ser agotadoras. Puede ser que saliendo de la reunión tu equipo necesite de un descanso para recuperar su ritmo de trabajo. Esto se puede corregir en parte si se proporcionan snacks y la reunión está bien planeada.

En defensa de las reuniones

Quiero ser claro: no estoy en contra de las reuniones. Hay muchas tareas que solamente se logran conjuntando ideas. También hay muchos casos en los que es más eficiente que las personas responsables estén presentes al momento de que se toman las decisiones.

Sin embargo, en muchos casos es posible cumplir con los mismos objetivos sin la necesidad de una reunión. En ocasiones, basta con que algunos de los miembros comuniquen al equipo de los avances por medio de mensajes o correo electrónico.

Las reuniones pueden servir para:

  • Generar compromiso entre los miembros del equipo.
  • Fomentar la colaboración para lograr un objetivo común.
  • Mejorar la comunicación entre los miembros del equipo.
  • Clarificar dudas, asuntos o discusiones.
  • Motivar a los miembros del equipo para lograr resultados.

Lo principal es que nuestra reunión aporte un valor suficiente para justificar el costo que le estamos asignando.

Checklist antes de agendar una reunión

¿Cómo asegurarnos de que nuestra reunión está aportando valor? Aquí una lista de consejos para aumentar el valor de nuestras reuniones:

  • Prepárate bien antes. Identifica bien el objetivo que deseas alcanzar en la reunión y las áreas de la organización que están involucradas.
  • Invita a los invitados correctos. Asegúrate de que los asistentes sean los que tienen la información y los recursos necesarios para alcanzar el objetivo de la reunión.
  • Establece un límite de tiempo. Establece una fecha límite para que la reunión termine, para evitar que se extienda demasiado.
  • Organiza la agenda. Establece el orden de los temas de la reunión y asigna un tiempo para cada uno de ellos.

Listo. Mucha suerte en tu próxima reunión (y manda esto a tu jefe: tal vez le interese hacer más eficiente a su organización).

El techo de deuda y la moneda de un billón

El techo de deuda y la moneda de un billón

La crisis política por el techo de deuda en Estados Unidos sigue dando que hablar. Si hoy no hay un acuerdo, el gobierno puede cerrar y la calificación crediticia del país se podría ver afectada. Con el clima en el escenario mundial, todos los países están volteando a ver al Tio Sam.

Lo que pase hoy podría afectar muy fuerte a la economía. Y no estoy exagerando.

La política del techo de deuda en Estados Unidos

El techo de deuda es una ley extraña en los Estados Unidos, que limita la cantidad de deuda que el gobierno federal puede tener. Cada año o casi cada año, el congreso y el gobierno federal se pelean sobre si deben subir este techo o no.

No es por diseño que se deba decidir cada año, el problema es que la deuda del país ha seguido aumentando más allá del límite que establece la ley.

El congreso tiene con esto prácticamente secuestrado al gobierno. Con la amenaza de cerrar sus funciones principales si el gobierno no accede a hacer lo que el congreso le está solicitando, los republicanos están solicitando que se reduzca el gasto de gobierno como condición para subir el techo.

Si no se logra un acuerdo, se desatará el caos.

El desastre que se viene (probablemente)

Si Estados Unidos no paga su deuda, el problema puede ser gigantesco. Recordemos que el país es la economía más grande por órdenes de magnitud, por lo que si a él le da un catarro, a nosotros nos puede dar una pulmonía.

Hay dos formas en las que el impago de Estados Unidos puede causar problemas:

  • El efecto multiplicador del gasto de gobierno. Muchos negocios tienen como cliente al gobierno. Si, por ejemplo, tú tienes un negocio de banquetes y le sirves cenas a los diferentes eventos que hace el gobierno, no te van a pagar y tú no le podrás pagar a tus proveedores. Tus proveedores te pueden perdonar un par de días sin que les pagues, pero si el problema se extiende, algunos podrían incluso cerrar.

  • Crisis financiera. La deuda del Estados Unidos son los cimientos de la estabilidad del sistema financiero. Nuevamente, no estoy exagerando: cuando las cosas se ponen complicadas con otros activos, los inversionistas siempre tienen como opción regresar su dinero a los confiables bonos del tesoro. Sin esa opción, nadie sabe de qué tamaño podría ser el desastre, pero yo si se que no quiero averiguarlo.

¿Qué podemos hacer?

Es evidente que necesitamos una solución. Algunos economistas sugieren aumentar los impuestos, pero esto no es una opción que resulte muy atractiva para los políticos.

Otra idea es reducir el gasto, pero esto no es sencillo y podría generar mucha resistencia.

Una tercera opción es una medida más radical: abolir el techo de deuda. Esto significaría que el gobierno podría emitir la cantidad de deuda que necesite para cubrir sus gastos, sin la necesidad de la aprobación del congreso.

Esta propuesta ha generado mucha controversia, pero incluso algunos republicanos están abiertos a la idea. En realidad, si ponemos en la balanza el tamaño de los riesgos que representa el techo de deuda con los costos que generaría eliminarlo, probablemente sea buena idea finalmente deshacerse de este techo.

Hay una cuarta opción, pero es poco ortodoxa. ¿Qué tal si el departamento de tesoro imprime una moneda de un billón de dólares (one trillion dollars) y paga su deuda con eso? ¿Sería realmente muy dramático?

La moneda de un billón de dólares

La teoría monetaria moderna ha propuesto una solución para el techo de deuda que es realmente inusual. Ellos proponen que el gobierno debería imprimir o lanzar al mercado una moneda de platino de 1 billón de dólares (1 trillion dollars).

La propuesta se basa en una ley de 1996 que permite al gobierno emitir monedas de platino de cualquier denominación, con la idea de generar una opción para los inversionistas. La idea es que el gobierno emitiría sus propias monedas y la Reserva Federal tendría que aceptarlas a cambio de la deuda.

¿Es una solución viable?

Técnicamente, la propuesta no generaría inflación, ya que el gobierno no estaría haciendo gastos adicionales. Sin embargo, existen varios problemas con esta propuesta.

En primer lugar, no existe ninguna garantía de que la Reserva Federal acepte la moneda de platino emitida por el departamento del tesoro. La Reserva Federal es un ente autónomo y podría no querer involucrarse en la pelea entre el congreso y el gobierno. Jerome Powell ha dejado muy claro que no desea involucrar a la FED en los dramas del gobierno.

En segundo lugar, no está claro cómo los mercados de bonos reaccionarían ante esta acción. La estabilidad del mercado de deuda de los Estados Unidos se basa en la confianza en su manejo de la deuda.

Finalmente, esta propuesta podría representar un mal precedente para otros países y sus acciones para cubrir su deuda pública. Aunque en la práctica los Estados Unidos podría pagar su deuda de esta manera

¿En dónde estamos parados hoy?

Hoy fue la reunión de Biden con McCarthy (el portavoz del congreso) para discutir el techo de deuda. La reunión duró más de una hora y salieron sin acuerdos. Los mercados estarán un tanto nerviosos estos días hasta que se logre un acuerdo.

chatGPT en el aula

chatGPT en el aula

chatGPT representa un avance importante en los modelos de inteligencia artificial y su uso por los estudiantes es ya inevitable. Esto ha generado mucho nerviosismo en el sector, que rápidamente busca soluciones para detectar y regular su uso en las aulas.

Pero yo no creo que se deba parar esta tecnología. Lo que en realidad me extraña es que no se hable más sobre cómo usar estas tecnologías en el aula.

Este post es una guía para aquellos profesores que están dispuestos a probar este semestre esta nueva tecnología.

chatGPT: Soy Inevitable

Escribir es difícil. La comunicación escrita tiene un ritmo y una estructura que no estamos obligados a seguir. Sobra decir que escribir es muy diferente a leer y qué hay muchos alumnos que lo tiene. Más fácil que otros.

Ponte en el lugar de un alumno que por diferentes circunstancias jamás se ha visto en la necesidad de escribir un texto más largo que un mensaje de felicitación en redes sociales. Nadie le ha enseñado a escribir, de pronto tiene que entregar un ensayo con un mínimo de páginas y nadie se toma el tiempo de enseñarle a redactar.

Naturalmente van a querer usar esa tecnología que les permite hacer sus ensayos en minutos y no pasar horas torturándose en crear algo inferior.

Por eso la solución no es prohibirlo. La solución es usarlo, aprender a usarlo y enseñarles a hacerlo de la manera correcta. Aquí algunas ideas. La mayor parte de las robé a Ethan Mollick en este post.

All my classes suddenly became AI classes
Last semester I lived through one of the most profound and sudden changes to education in modern history - the release of ChatGPT at the end of November. When I introduced my students to the new technology a week later, there was an extraordinary amount of excitement and creativity

Los requisitos de los ensayos acaban de subir

La ventaja es que ahora no hay excusas para entregar ensayos de calidad mediocre. Ese alumno que jamás aprendió a redactar ahora tiene a su disposición un asistente de escritura que le puede ayudar a crear un texto decente.

Ahora su tarea no está en la creación de los textos en sí. Ahora puede enfocarse en otros aspectos igual de importantes, cómo la edición y la búsqueda que información pertinente.

¿chatGPT alucina y no es confiable?… ¡genial!

La mayor fortaleza de chatGPT cómo una herramienta para el aprendizaje es justamente su mayor debilidad.

Como los textos que genera son una especie de remix de los textos de internet que usaron para entrenarlo, el resultado puede estar lleno de información falsa y desactualizada (eso si, dicha con mucha confianza).

Pero eso es justamente lo que necesitamos. Podemos solicitar a nuestros estudiantes un ensayo hecho con chatGPT y pedirles que lo editen y lo corrijan hasta que quede un producto ideal.

En otras palabras, los alumnos le van a enseñar a chatGPT a crear el ensayo.

Aprender enseñando

Como muchos saben, se aprende más enseñando (o intentándolo al menos) que solo siendo receptor de información. El proceso de enseñarle a la inteligencia artificial, proporcionarle fuentes y corregirlo hasta generar un buen producto es una habilidad para sobrevivir en el futuro.

Y a ti, ¿qué estrategias se te ocurren para usar chatGPT en tus clases?

¿Qué debería de incluir una tarea hecha por inteligencia artificial?

Lo que el alumno debe reportar en esta tarea es

  • El reporte completo.
  • Los prompts que usó para crear la tarea.
  • Las fuentes que usó para alimentar a la inteligencia artificial, enseñar a chatGPT y corregirlo con la innformación correcta
  • Las fuentes que usó para corregirlo.

El resultado debería ser un ensayo con muy buena calidad y con la información correcta.

¿Habilidades del futuro?

La caja de pandora ya se abrió. No podemos evitarlo ya: si no les enseñamos a los alumnos a usar las herramientas a su disposición, ellos saldrán y competirán con alumnos en otros lugares a los que sí les enseñaron a usarlas.

En lo personal, saber escribir bien me parece una habilidad indispensable para el futuro. Es algo que me ayuda a pensar mejor, entre otras cosas. También soy del tipo de persona que hace cuentas en su cabeza más rápido de lo que a la mayoría le toma sacar la calculadora.

Pero reconozco que lo de la calculadora en la actualidad no es más que un truco para presumir. A mi hijo le estoy enseñando a usar la calculadora y para la mayoría de las personas liberarse de esa tarea es buena idea.

Así también, habrá algunos cuantos para los que aprender a escribir bien será valioso. Para los demás, es bueno que usen estas herramientas. Al menos de esta forma los lectores nos liberamos del tedio de tener que corregir algo que las computadoras pueden ya hacer mejor.

La huella organizacional

La huella organizacional

Si eres emprendedor y planeas hacer crecer tu negocio esto te interesa. Y es que no todos los negocios desean crecer, pero aquellos que si, necesitan pensar desde el inicio en las primeras contrataciones, pues las huellas que estás dejan en la organización puede durar por años, décadas e incluso siglos.

La huella organizacional

El concepto de "impronta organizacional" (o huella organizacional, que es mi traducción libre) ha sido conocido por los teóricos de la organización desde hace décadas.

La idea fue propuesta por Stinchcombe en 1965, y sugiere que las organizaciones adoptan elementos de su entorno en el proceso de su creación.

¿Por qué los departamentos en las empresas se estancan?

Por ejemplo, imagina que eres una empresa pequeña y estás por comenzar a contratar y encuentras a un contador que te ayuda a manejar la nómina y hacer contrataciones y la contabilidad general de la empresa.

Este contador ya usa un software específico para hacer la contabilidad. De momento este parece un detalle irrelevante, pero conforme empieza a crecer la empresa y necesitas contratar más empleados, la habilidad particular para el manejo de ese software se convierte en un requisito.

El departamento de contabilidad crece en función de las operaciones que se requiere en el uso de ese software particular, lo que implica que si sale al mercado otro software que se usa de una forma distinta, tu equipo de contabilidad simplemente lo va a rechazar.

Puede ser que la estructura de tu organización se vuelva anticuada, pero sin un manejo consciente de tu parte, lo más probable es que perdure, aún cuando una gran parte de sus miembros ya no sean productivos.

Por ejemplo, podría ser que salga un nuevo software que permita al departamento de marketing tener información en tiempo real de contabilidad que pueda cruzar con las campañas que realiza. De esta manera pueden evaluar rápidamente si su campaña fue exitosa (o no). ¿Puedes notar el problema? tu organización se quedó con la huella de las generaciones pasadas. Lo peor es que este tipo de huella puede durar generaciones, o incluso siglos.

La huella que duró siglos

En un estudio de la Universidad de Michigan, Victoria Johnson utiliza las herramientas de la sociología para subrayar el papel de los emprendedores en la selección de características de la organización que persisten durante décadas o incluso siglos.

Como ejemplo, Johnson se basa en la fundación de la Opera de París bajo el reinado de Luis XIV para teorizar sobre la huella organizacional en la fundación como un resultado del emprendimiento cultural.

La historia de la fundación del Opera de París es un ejemplo perfecto de cómo los líderes culturales y empresariales pueden influir en la forma en que una organización se desarrolla.

Se menciona a Pierre Perrin, un poeta y emprendedor cultural, como un ejemplo de cómo su visión para un género de ópera francés se alineó con las ambiciones de Luis XIV y cómo utilizó modelos existentes de teatros comerciales y compañías de ópera italianas para crear un contexto organizacional para su visión.

Además, se menciona cómo la situación en el mundo del arte de la época y el anti-italianismo ayudaron a impulsar su emprendimiento.

Cómo enfrentar la huella organizacional

Como en todo, no hay recetas mágicas para enfrentar esta situación. Hay casos incluso en los que me temo que es algo inevitable, pero estos tips podrían ayudar en el caso de que te enfrentes con un caso de huella organizacional.

  • Contrata lento. Sobre todo si eres una startup y tu intención es crecer, es buena idea aguantar lo más posible la tentación de empezar a contratar cuanto antes. Si contratas en una etapa demasiado temprana de tu organización, te estás arriesgando a atraer perfiles que no tienen mucho interés en que la organización crezca. Los empleados de más alto rendimiento son mas fácil de encontrar cuando tu empresa ya ha mostrado ser de rápido crecimiento y una ruta viable para personas con gran ambición.
  • Fomentar una cultura de innovación. Es más fácil decirlo que hacerlo: genera los incentivos y apoya la innovación dentro de la organización. Esto a veces se ve como permisos para asistir a congresos, pero a veces lo puedes ver como sesiones en la empresa donde se comprometen a cambios.
  • Planea con anticipación los cambios en la estructura que va a requerir el crecimiento. No siempre es fácil visualizar cómo se verá tu empresa cuando logras alcanzar metas más grandes, pero si puedes determinar cómo quienes en este momento te acompañan pueden participar (o no) en visiones futuras.

No temas en buscar asesoría externa para entender y manejar este proceso, cuando llegue el momento de crecer.

Mínimos Cuadrados Ordinarios (parte 2)

Mínimos Cuadrados Ordinarios (parte 2)

El objetivo: minimizar los errores al cuadrado

Asumimos que el error es una variable aleatoria con distribución normal

La ecuación de arriba se lee como que $\varepsilon$ se distribuye normalmente con una media $0$ y desviación estándar constante. Si esto es verdad, entonces el valor esperado de $\varepsilon$ es $0$ y los valores por encima de la línea cancelan a los valores por abajo de ella. Por este motivo, no podemos tener como objetivo minimizar la suma de los errores.

Un truco es elevar los errores al cuadrado y así buscar la línea que los minimice. Si tomamos la ecuación inicial y despejamos $\varepsilon_i$ tenemos

Entonces nuestro objetivo es minimizar la suma de todos los errores al cuadrado, o bien

Este es un problema clásico de optimización. Hay varios métodos para resolverlo, pero el más ilustrativo es usar las condiciones de primer orden. Para esto, el primer paso es combinar las dos ecuaciones de arriba para obtener

Ahora sólo tenemos que igualar la primera derivada con respecto a cada uno de los parámetros con cero. Haciendo esto, obtenemos dos ecuaciones, una para $\beta_0$ y otra para $\beta_1$, que son las ecuaciones normales.

Estas ecuaciones son sistemas lineales de ecuaciones que se pueden resolver mediante diversos métodos, como la eliminación gaussiana o la inversión de matrices. Una vez resueltas estas ecuaciones, obtendremos los valores óptimos de los parámetros $\beta_0$ y $\beta_1$ que minimizan la suma de los errores al cuadrado.

y

Donde $\bar x$ y $\bar y$ representan la media de las respectivas columnas.

¿Es verdad que este es el cálculo? Veamos con un ejemplo de una simulación en python. En primer lugar generamos una base de datos en pandas con los parámetros que nosotros deseamos y generamos el numerador y el denominador que usaremos para calcular $\hat\beta_1$.

import pandas as pd
import numpy as np

n = 1000

np.random.seed()

df = pd.DataFrame({'x': np.random.normal(0,1,n)})
df['y'] = 1.5 + 2 * df['x'] + np.random.normal(0,1,n)

df['xi - barx'] = df['x'] - df['x'].mean()
df['yi - bary'] = df['y'] - df['y'].mean()
df['(xi-barx)(yi-bary)'] = df['xi - barx'] * df['yi - bary']
df['(xi - barx)^2'] = df['xi - barx']**2
print(df)

Ahora sólo queda calcular los parámetros

beta1 = df['(xi-barx)(yi-bary)'].sum()/df['(xi - barx)^2'].sum()
beta0 = df['y'].mean() - beta1 * df['x'].mean()
print(beta1)
# 2.0321031515496335
print(beta0)
# 1.4751020302599238

Las estimaciones que nos generan estos cálculos son muy cercanos al número real que generamos por métodos de simulación. Puedes jugar con los números que se generan al definir df['y'] y generar nuevos valores de la regresión.

Cómo se usa la regresión para cerrar puertas traseras

Una de las razones que hacen más atractiva a la regresión es lo fácil que hace enfrentar a los problemas de selección. Siempre que nos enfrentamos a la situación en que una variable $X$ causa tanto $D$ como $Y$, basta incluir la variable en la regresión para solucionar el problema.

A este proceso se le llama controlar y las variables que se incluyen con esta intención se llaman variables de control. Entonces una regresión de

ya registra el efecto de $D$ en $Y$ considerando a $X$. También se puede decir que se deja a $X$ constante y que la regresión controla $X$.

Un ejemplo podría ser el estudio del impacto del ingreso familiar y la educación de los padres en el rendimiento académico de los estudiantes. Supongamos que queremos medir el impacto del ingreso familiar en el rendimiento académico de los estudiantes y controlar el efecto de la educación de sus padres. Podemos utilizar la regresión lineal para modelar el rendimiento académico (Y) en función del ingreso familiar (X) y la educación de los padres(D).

import pandas as pd
import statsmodels.formula.api as smf

# Crear un ejemplo de datos
df = pd.DataFrame({'Rendimiento': [80, 85, 90, 95, 100],
                   'Ingreso': [50000, 60000, 70000, 80000, 90000],
                   'Educacion': ['Primaria', 'Secundaria', 'Bachillerato', 'Licenciatura', 'Maestria']})

# Crear la regresión
model1 = smf.ols(formula='Rendimiento ~ Ingreso + Educacion', data=df)
model2 = smf.ols(formula='Rendimiento ~ Ingreso', data=df)

# Ajustar el modelo y ver los resultados
results1 = model1.fit()
results2 = model2.fit()

print(results1.summary())
print(results2.summary())

Los resultados de estas dos regresiones son muy reveladores. En primer lugar, nota que la variable educación genera muchos coeficientes. Este aspecto lo vamos a tocar más a fondo más adelante, pero de momento observa cómo el coeficiente de los ingresos cambia cuando se incluye la educación. ¿Por qué sucede esto?

Read Marionomics: Economía y Ciencia de Datos in the Substack appAvailable for iOS and AndroidGet the app

En este modelo la educación nos sirve como una variable de control. La regresión que no la incluye podría estar mostrando un efecto interesante, pero incompleto. Es sólo cuando incluimos a la educación de los padres cuando podemos identificar el efecto real que genera el ingreso. Libre de sesgos.

En el siguiente post veremos una guía para hacer regresiones, para verificas sus supuestos y para interpretar el resultado que nos arrojan la mayoría de los softwares estadísticos.

Introducción al Modelo de Mínimos Cuadrados (Parte 1)

Introducción al Modelo de Mínimos Cuadrados (Parte 1)

Tenemos una variable dicotómica D, que puede tomar valores de 0 y 1 y proponemos la hipótesis de que esta variable afecta de alguna manera a nuestra variable de interés Y. Digamos que D_i es la exposición que tuvieron o no las personas a una campaña de marketing. Por lo tanto

La variable $Y_i$ es un indicador de las ventas que se generaron en la empresa en una observación.

Cuando decimos “una observación” es lo mismo a indicar una fila en la tabla. Por eso cuando tenemos $n$ observaciones, se dice que $i = {1,2,…, n}$, puede tomar cualquier valor del 1 a $n$.

Entonces, si deseamos conocer el efecto de nuestra campaña en las ventas, buscamos

Es decir, ¿cuál es el valor promedio de las ventas ceteris paribus, dada la exposición a nuestro anuncio?

El ceteris paribus (dejar todo lo demás constante) lo logramos incluyendo un vector de variables de control, representadas por $X$. Más adelante explicaremos cómo funciona.

También hemos incluido una variable que captura la aleatoriedad.

El modelo lineal

Nuestra mejor opción es comenzar con un modelo lineal como el siguiente:

En esta ecuación incluimos tres letras griegas. Por tradición, las letras griegas suelen representar parámetros, que son lo que deseamos calcular y son las que nos darán la respuesta a nuestras interrogantes.

Los parámetros en este modelo son $\beta_0$ (beta cero) y $\beta_1$ (beta uno). Nuestro objetivo es usar estos dos números para dibujar una línea en el plano cartesiano. Aquí, $\beta_0$ es el intercepto en el origen y $\beta_1$ la pendiente. La línea que dibujemos debería de ser la que mejor describe el comportamiento de nuestros datos.

Pero nuestros datos no vienen de una función matemática. No podemos esperar que se comporten como nuestro modelo dicta. Entonces cualquier línea que tracemos no cae directamente en los puntos. Para solventar este detalle definimos $\varepsilon$ (epsilon), que es un elemento estocástico o aleatorio. También se le conoce como término de error, y ayuda a explicar esa diferencia entre el punto de nuestros datos y la línea de regresión.

Haciendo regresión sobre una muestra

Normalmente los datos que tenemos a nuestra disposición son una muestra de la información existente. Por consecuencia, nuestra estimación no será exactamente aquella que obtendríamos si tuviéramos acceso a todos los datos. Esto es algo que tenemos que aceptar.

Este detalle genera un poco de notación adicional. Usamos el circunflejo para denotar cuando un parámetro viene de una estimación hecha sobre una muestra. Los parámetros de una muestra son entonces $\hat\beta_0$ y $\hat\beta_1$. Otro detalle es que usamos letras minúsculas para denotar cuando una variable es una muestra, por lo que usamos $x$ en lugar de $X$.

El siguiente código genera una base de datos con 10,000 observaciones y corre una regresión sobre ella. Luego genera 1000 simulaciones que toman una muestra de un 5% de los datos, corren una regresión y registran los parámetros. Por el momento no te preocupes por el código y solo correo completo. Más adelante haremos ejercicios de regresión paso a paso.

import numpy as np
import pandas as pd
import statsmodels.api as sm

# Número de simulaciones
num_simulaciones = 1000

# Crear el conjunto de datos completo
n = 10000
X = np.random.normal(0,1,n)
df = pd.DataFrame({"X": X})
df['Y'] = 1 + 2.5 * df['X'] + np.random.normal(0,1.5,n)

# Realizar la regresión en el conjunto de datos completo
X = sm.add_constant(df[['X']])
reg = sm.OLS(df['Y'], X).fit()
params_completo = reg.params

# Crear listas vacías para almacenar los parámetros simulados
params_sim = []

# Realizar las simulaciones
for i in range(num_simulaciones):
    # Tomar una muestra de los datos
    df_muestra = df.sample(frac=0.05, replace=True)
    # Realizar la regresión en la muestra
    X_muestra = sm.add_constant(df_muestra[['X']])
    reg_muestra = sm.OLS(df_muestra['Y'], X_muestra).fit()
    params_sim.append(reg_muestra.params)

# Calcular el promedio de los parámetros simulados
params_promedio = np.mean(params_sim, axis=0)

# Comparar con la regresión del conjunto de datos completo
print("Parámetros del conjunto de datos completo: ", params_completo)
print("Parámetros promedio simulados: ", params_promedio)

Si tomas esta simulación y la corres en python (puedes usar Google colab) observarás que los parámetros que se generan en la regresión con todos los datos son muy similares a la media de las muestras.

Tal vez la simulación individual de una muestra podría acabar un poco alejada de la que generan los datos completos, pero cuando las líneas de regresión se promedian, los parámetros se acercan a la línea de regresión “verdadera”, o bien

La ecuación de arriba se lee como “el valor esperado de los parámetros muestrales se aproxima a los parámetros poblacionales”. Esta afirmación se vuelve verdadera conforme aumenta el número de simulaciones aumenta el tamaño de muestra de las mismas.

De manera más concreta

Es decir, nuestro estimador $\hat\beta$ es una variable aleatoria con distribución normal. Su media es $\beta$ y su desviación estándar es una fracción que depende de la desviación estándar de la población y del tamaño de la muestra.

Entre más grande sea el tamaño de la muestra en comparación con la varianza de la población (que no conocemos, en realidad) más pequeña será la variación de nuestra muestra. Esta recibe el nombre especial de error estándar.

Para comprobarlo puedes jugar con el número de simulaciones (num_simulaciones) y el tamaño de la muestra df.sample(frac=0.05. Cambia el valor de las simulaciones a 1 o a 10 y revisa si el resultado de las simulaciones cambia.

Read Marionomics: Economía y Ciencia de Datos in the Substack appAvailable for iOS and AndroidGet the app

Esta simulación particular requiere un número muy bajo de simulaciones o un tamaño muy pequeño demuestra para tener el resultado correcto, pero por lo general se requiere de tamaño de muestra más grande para comenzar a tener confianza en que los resultados sean significativos.

Por qué chatGPT no acabará con Google

Por qué chatGPT no acabará con Google

Para competir con Google se necesita una herramienta que pueda superarlo en los resultados de búsqueda. Y aunque chatGPT es impresionante, su tendencia a generar contenido poco preciso lo hace (aún) poco fiable para muchas aplicaciones.

Además, hasta el momento, el desarrollo y mantenimiento de chatGPT está costando a OpenAI cerca de 100 mil dólares diarios, o 3 millones al mes.

A pesar de los costos, sacar chatGPT al mundo resultó una buena movida por parte de la empresa. El entusiasmo que despertó por los modelos de lenguaje grandes (LLM por las siglas de Large Language Models) hizo que Microsoft decidiera unir OpenAI a su plataforma Azure.

Pero más allá de sus usos posibles dentro de Microsoft y las aplicaciones que generen con la API de GPT-3, chatGPT no tiene un modelo de monetización propio. Podrían incluir publicidad similar a como lo hace Google, pero este modelo de monetización tiene grandes desafíos.

Googlenomics: el negocio de Google

El internet antes de Google era muy diferente. Google no fue el primer buscador. Ni el segundo ni el tercero. Cuando Google entró al mercado ya habían otros 17 buscadores.

Pero su producto era tan superior que arrasó con la competencia. El secreto de su éxito fue encontrar una solución eficiente a un problema económico mediante el uso de un método que los investigadores académicos usaban ya desde años atrás.

El problema es económico ya que el espacio en la primera página de resultados de búsqueda es limitado y es importante que sólo aparezcan los resultados más relevantes. Los buscadores de antes solucionaban esto buscando dentro de la página referencias a los términos de búsqueda.

El problema es que esto fue muy fácil de falsear por los creadores de páginas web. Simplemente tenían que escribir mucho el término de búsqueda en la página para aparecer en primeros lugares. Un truco viejo fue poner letras blancas en fondo blanco para esconder algunas menciones adicionales y subir la página en el ranking.

El resultado era que no se obtenían los resultados más relevantes, sino los de aquellos que habían saboteado el algoritmo de los buscadores.

El método de Google

Google abordó el problema de manera diferente. Utilizó la estructura de enlaces de la web para asegurar que los resultados de búsqueda más relevantes aparecieran en la primera página.

Cuando una página crea un enlace, le está dando su voto de confianza. Entre más páginas le dan su voto de confianza a la tuya, más sube en los resultado de búsqueda.

Por eso el link building es importante para la optimización de motores búsqueda (SEO). El link building se hace con participaciones en otras páginas y colaboraciones. También se logra usando las redes sociales: cada post que tenga un enlace a tu página le da un poco más de relevancia.

El link building también se puede hackear. En un poco más caro, pero no imposible. Por eso actualmente google implementa modelos de Machine Learning para determinar la importancia de una página.

No sólo se trata de hacer buenos títulos y generar etiquetas apropiadas. Actualmente es importante poner atención al contenido de la página para disminuir la tasa de rebote. Cuando entras a una página y te sales de inmediato porque no era lo que buscabas, Google lo registra y penaliza la página: la baja en los resultados de búsqueda.

Todas estas técnicas hicieron de google un producto muy superior. Pero ¿cómo monetizan?

El negocio de Google es muy diferente

Cada vez qué haces una búsqueda se abre una subasta. Digamos que tú vendes arena para gatos y deseas aparecer al principio de google cuando busquen el término.

Google ofrece la opción de pagar por aparecer al inicio de la página. Dependiendo del término de búsqueda es el precio que debes pagar. Los términos de nicho son más baratos que los genéricos, pues hay menos empresas compitiendo por el primer lugar.

Por ejemplo, términos como seguro de vida tienen en sus primeros resultados a empresas grandes. Eso es un indicador de que si quieres ganarles y llevarlos con ese término a tu página tendrás que pagar mucho (mi consejo es que seas más específico: seguros de vida en Durango es un término que probablemente sea más barato y te ayude de entrada a filtrar a clientes potenciales.

La publicidad es un negocio complicado

Monetizar por publicidad no fue la única opción que Google contempló para obtener ganancias. También contempló ofrecer una versión premium, limitar el número de búsquedas o cobrar por cada búsqueda directamente.

En el mundo de las startups las métricas de crecimiento suelen vencer a las de ventas. Por eso era más importante incrementar el número de usuarios y después pensar en monetizar con ellos. Esta estrategia les funcionó: hoy Google es una de las empresas mejore valuadas en el mundo con un Máximo de casi 2 billones de dólares (trillion).

¿Cómo monetizará OpenAI?

Pero ese modelo no es replicable a chatGPT. La razón por la que tantas personas adoptaron el servicio de inteligencia artificial es porque genera un solo resultado que (normalmente) es más útil que estar revisando. Sobre todo cuando se trata de código.

Pero se vuelve un poco raro, o incluso intrusivo si dentro de tu resultado hay una opción que viene de publicidad pagada.

La solución que hasta el momento tienen es una versión de paga del servicio. Por 42 dólares al mes tienes acceso prioritario, incluso cuando hay alta demanda, con mayor velocidad de respuesta y acceso prioritario a nuevos servicios.

¿Pagarías tú por ese servicio?

Los cuatro principios de la economía

Los cuatro principios de la economía

La economía es la ciencia del comportamiento humano. A diferencia de la psicología o la sociología, acá son importantes los recursos y los incentivos.

Contrario a lo que muchas personas piensan, la economía no se trata únicamente de dinero y de mercados. Hay economistas en todo el mundo trabajando temas relacionados a la salud, la seguridad, la educación, la tecnología, los cuidados y casi todo lo que te puedas imaginar. Entonces ¿Qué es lo que hace diferente a la economía de otros campos de estudio?

Si lo que queremos saber es lo que hace un campo de estudio de otro, nos tenemos que remontar a sus principios.

13 mil economistas, una pregunta

En Enero de 2020 hubo la última reunión de los economistas antes de la pandemia en la ciudad de San Diego, California. Los investigadores de todo el mundo se reúnen cada año para presentar los resultados de su trabajo, platicar y discutir sobre lo que han aprendido. A esa reunión asisten premios Nobel, ex-presidentes de la FED y rockstars de la economía. Es el Coachella de los economistas.

En esa reunión acudieron los conductores de Planet Money, el programa de Economía de NPR y le hicieron una sola pregunta a algunos de los asistentes más prominentes. Les preguntaron ¿cuál es la idea más útil de la economía?

En el show dieron cuatro respuestas diferentes, que desde entonces he usado para mis clases como los cuatro principios de la economía. Esta lista la hice pública por primera vez en mi curso de Economía del Comportamiento de Platzi.

Principio 1: Costo de Oportunidad

Toda decisión que tomamos tiene un costo de oportunidad. Leer este texto implica tiempo y esfuerzo que podrías estar ocupando en cualquier otra cosa (por eso me esmero en que sea ultra valioso para ti).

El costo de oportunidad representa lo que estás sacrificando cuando tomas una decisión. Entrar a la universidad significa que estás renunciando a los ingresos que podrías obtener con un trabajo durante el tiempo que estudias.

El costo de oportunidad es extremadamente útil para entender decisiones de inversión. Jamás deberías de tomar una opción de inversión riesgosa si los retornos esperados son menores a la tasa segura (CETES, Bonos del Tesoro, etc). En otras palabras: los bonos con tasa libre de riesgo son el costo de oportunidad de cualquier inversión.

Lo mismo pasa para tomar decisiones más cotidianas. Cuando buscas trabajo, cuando se busca pareja, cuando se busca una casa lo que hacemos es comparar con otras opciones. Tomar una decisión es dejar las otras opciones de lado y esperar que lo que elegimos haya sido lo mejor.

Principio 2: Ventaja Comparativa

No todos tenemos los mismos costos de oportunidad. Para algunos es más fácil preparar el desayuno que para otros: tienen menor costo de oportunidad, pues lo preparan más rápido y con menos esfuerzo. Para otras personas les es más fácil lavar los trastes.

Le llamamos ventajas absolutas cuando uno se dedica a hacer el desayuno y la otra persona se dedica a lavar los trastes. Y así todos felices. Pero ¿qué sucede cuando una sola persona es mejor para hacer el desayuno y también para lavar los trastes.

Cuando esto sucede, aún existen incentivos para que las personas hagan intercambio y se especialicen: que uno de los dos se dedique a preparar el desayuno mientras que el otro lava los trastes.

Para decidir quién hace qué basta identificar en qué es menos mala aquella persona que no tiene las dos habilidades. Digamos que A es la persona con gran habilidad en ambas cosas y B es malo para hacer el desayuno pero medianamente bueno para lavar los trastes. La siguiente tabla es un resumen de sus habilidades.

Aquí la mejor opción sería que A hiciera el desayuno y B lave los trastes. Esta opción es evidentemente superior a que A lave los trastes y acaben con un mal desayuno.

Principio 3: Pensar en el Margen

Hay muchas métricas que los economistas solemos medir en el margen. La utilidad, los costos, los ingresos, todo es sujeto a medirse en términos marginales.

Por ejemplo, cuando tomamos un vaso de agua, este nos genera una utilidad: una sensación placentera y positiva. Pero la utilidad que nos genera el segundo vaso de agua es menor.

Imaginemos que esa sensación de placer que nos da tomar un vaso de agua se puede medir.

Nota que la utilidad total es la suma acumulada de las utilidades marginales. El segundo vaso de agua puede que te de algo de valor, pero ya es menos que el primero. Para cuando llegamos al cuarto vaso de agua, ya no te satisface.

Lo mismo sucede con los costos. Cuando hay costos fijos, el costo promedio tiende a disminuir en el margen con el tamaño de la empresa. Este es el principio detrás de las economías de escala

.Las economías de escala son lo que hacen que empresas como Amazon o Walmart tengan costos tan bajos que competir contra ellos es prácticamente imposible para empresas pequeñas. Es la razón de que las tienditas de la esquina la tienen complicada siempre que aparece cerca un Oxxo.

Los principios económicos son muy poderosos: pueden ayudar a explicar muchos fenómenos sociales. Pero en ocasiones la lógica económica requiere apoyarse de la evidencia para llegar a las conclusiones correctas.

Principio 4: Inferencia Causal

Los modelos de la economía neoclásica llevan a conclusiones extrañas. En ocasiones esas conclusiones, aunque extrañas, pueden ser valiosas.

Por ejemplo, cuando usamos el modelo de oferta y demanda para determinar el valor del tipo de cambio, nos permite tomar decisiones macro que funcionan y pueden salvar a economías enteras de una crisis.

Pero cuando aplicamos este mismo modelo al mercado de trabajo, las conclusiones pueden generar políticas públicas poco deseables. En los 80s era común modelar al mercado de trabajo con curvas de oferta y demanda, donde la oferta son los trabajadores buscando empleo y la demanda son las empresas buscando quién trabaje para ellos.

Todo bien. Pero cuando deseaban explicar los efectos de los aumentos en el salario mínimo en la economía, la evidencia no siempre se alinea con la teoría.

En un estudio muy famoso, David Card y Alan Krueger aprovecharon un aumento en el salario mínimo de Nueva Jersey para medir los efectos de la medida en el desempleo. La idea que generan los modelos neoclásicos de la economía tradicional indican que si este aumento es superior al salario de equilibrio, entonces habrá una diferencia entre el nivel de trabajo ofertado y el demandado. Esa diferencia es el desempleo que generaría el aumento.

Pero esto no fue lo que encontraron Card y Krueger. Midieron los salarios y los niveles de empleo en las empresas de comida rápida de Nueva Jersey y del estado vecino Pennsylvania (que mantuvo su mismo nivel de salario mínimo) antes y después de que se aplicara el aumento.

¿Qué encontraron?, nada. No hubo ningún efecto del aumento del salario mínimo en los niveles de empleo en Nueva Jersey.

¿Por qué no hubo ningún efecto? El modelo tradicional considera a los salarios sólo como un costo de la empresa, pero cuando las personas tienen mayores ingresos también gastan más y generan más empleo para otras personas en la economía.

La inferencia causal se apoya de múltiples técnicas estadísticas, pero es parte de lo que convierte a la economía en una ciencia diferente de las otras. La búsqueda de las causas y efectos por medio de la evidencia son lo que guían a esta ciencia.

¡Genial! Te has registrado exitosamente.

¡Bienvenido de vuelta! Has iniciado sesión correctamente.

Te has suscrito correctamente a Escribe tu primer paper de Economía.

¡Éxito! Revisa tu correo electrónico para obtener el enlace mágico para iniciar sesión.

¡Éxito! Se ha actualizado la información de facturación.

No se actualizó tu información de facturación.

Sígueme en Mastodon