Demasiados economistas jóvenes cometen el mismo error.
Pasan 6 meses limpiando datos. Construyen un modelo econométrico ELEGANTÍSIMO. Corren la regresión...
Y obtienen un p-value de 0.2.
¿La conclusión? "No encontramos un efecto significativo".
FALSO.
La conclusión REAL es que probablemente NUNCA TUVISTE EL PODER para encontrar un efecto, incluso si existía.
Acabas de quemar 6 meses de trabajo. Felicitaciones.
Esto se llama "Análisis de Poder" o "Estimación del Tamaño de Muestra". Y es la habilidad MÁS infravalorada en la econometría.
No es sexy. No es "big data". Pero es lo que separa a los amateurs de los profesionales.
Es crucial porque ODIO desperdiciar tiempo y DINERO
Y tú también deberías.
Calcular tu tamaño de muestra no es un ejercicio académico. Es un ejercicio de GESTIÓN DE RIESGO.
- Muestra muy pequeña: Es como comprar un boleto de lotería. Estás apostando a la suerte. Si no encuentras nada, no sabes si es porque no hay nada o porque tu "red" era demasiado pequeña. INÚTIL.
- Muestra muy grande: Es como quemar dinero para calentar tu casa. Ineficiente. Gastaste recursos (tiempo, dinero de la encuesta, poder computacional) que no necesitabas.
Tu objetivo es la EFICIENCIA. El tamaño de muestra MÍNIMO VIABLE para obtener una respuesta CONFIABLE.
Esto es marionomics. Un newsletter para aprender a convertirse en un economista de verdad.
Explora la estadística y la econometría de una forma como nunca te lo habían explicado: con peras y manzanas, pero con todo el rigor que se merece un verdadero Pro.
Con tu suscripción a marionomics pro, tendrás:
- Acceso ilimitado a todo lo que he escrito.
- Acceso a todo lo que escribo directo a tu correo mientras dura la suscripción.
- 14 días gratis como bono.
- Material bonus.
Pruébalo gratis.
Los 5 errores que estás cometiendo
Veo estos errores todos los días. Están matando tus resultados.
- El error de "ya veremos" (Hacerlo al final). Este es el más tonto. Corres tu análisis, obtienes p=0.15 y luegocorres un "análisis de poder post-hoc" para justificar tu fracaso. NO. El poder se calcula ANTES. Es un plan, no una autopsia.
- Paralizarse con las fórmulas. Te pones a ver esto: $n_i = \frac{2\sigma^2 \cdot (Z_{\alpha/2} + Z_{1-\beta})^2}{(\mu_1 - \mu_2)^2}$. Y tu cerebro se apaga. BASURA. No necesitas la fórmula. Necesitas el CONCEPTO. La computadora hace la matemática. Tú tomas las decisiones.
- Adivinar mal el "Tamaño del Efecto". Este es el error más común. El "tamaño del efecto" (effect size) es simplemente la diferencia mínima que te importa detectar. Si copias "d=0.5" de un paper sin pensar, estás jugando. ¿Una política que aumenta el ingreso en $1 te importa? No. ¿Y en $100? Sí. ESA es tu decisión.
- Seguir ciegamente el "80% de poder". Todos usan 80% de poder ($\beta = 0.2$) porque "es la convención". Piénsalo. ¿Estás cómodo con una probabilidad de 1 en 5 de FRACASAR en encontrar un efecto que SÍ existe? Yo no. A veces necesitas 90% o 95%. Deja de seguir a la manada.
- Creer que "más datos" siempre es la solución. "Solo necesito más datos". Falso. 'Más datos' puede ser más caro e igual de inútil si no sabes lo que buscas. Un plan mediocre con 1 millón de observaciones sigue siendo un plan mediocre.
Cómo hacerlo en R (El método anti-matemáticas)
Basta de teoría. Vamos a la acción.
No necesitas 50 paquetes. Necesitas UNO. Se llama pwr.
Tu trabajo no es ser una calculadora. Tu trabajo es tomar 4 DECISIONES.
- Decisión 1: ¿Qué tipo de test usarás? (La función)
- ¿Comparas dos promedios (ej. ingreso grupo A vs B)? Usa
pwr.t.test(). - ¿Comparas dos porcentajes (ej. % conversión A vs B)? Usa
pwr.2p.test(). - ¿Comparas ANTES y DESPUÉS (ej. ingreso pre vs post)? Usa
pwr.t.test(type = "paired").
- ¿Comparas dos promedios (ej. ingreso grupo A vs B)? Usa
- Decisión 2: ¿Qué tan seguro quieres estar de no cometer un 'falso positivo'? (Alpha /
sig.level)- Es tu p-value. Casi siempre es 0.05. Listo. Siguiente.
- Decisión 3: ¿Qué tan seguro quieres estar de ENCONTRAR un efecto real? (Poder /
power)- Es tu probabilidad de éxito. El estándar es 0.8 (80%). Si eres serio, usa 0.9.
- Decisión 4: ¿Cuál es la diferencia MÁS PEQUEÑA que te importa? (Tamaño del Efecto /
doh)- Este es el NÚMERO MÁS IMPORTANTE. Es tu "suposición educada".
EJEMPLO PRÁCTICO: El Test A/B de Ingresos
Quieres probar si un nuevo programa de capacitación (Grupo 1) aumenta el ingreso promedio más que el programa viejo (Grupo 2).
Tus 4 Decisiones:
- Test: Comparamos dos promedios. Usaremos
pwr.t.test. - Alpha:
sig.level = 0.05. - Poder:
power = 0.8(vamos a usar el estándar por ahora). - Tamaño del Efecto (
d): Aquí es donde piensas.- Revisas un paper viejo. Dice que la desviación estándar ($\sigma$) del ingreso en este grupo es $5,000.
- Tú decides (como jefe) que si el programa nuevo no aumenta el ingreso en al menos $500 (la diferencia, $\mu_1 - \mu_2$), NO VALE LA PENA implementarlo.
- Tu 'd' de Cohen es: (Diferencia que te importa) / (Desviación estándar).
- $d = 500 / 5000 = 0.1$
d = 0.1(Esto es un efecto "pequeño". Es difícil de encontrar. Perfecto).
El Código (La parte fácil):
Deja de ver las fórmulas raras. Solo escribe esto en R.
# Instala el paquete (solo una vez)
# install.packages("pwr")
library(pwr)
# Tus 4 decisiones puestas en el código
mi_diferencia_minima <- 0.1 # El 'd' que calculamos
mi_poder_deseado <- 0.8
mi_alpha <- 0.05
# La magia. Pon 'n = NULL' porque es lo que queremos averiguar
calculo <- pwr.t.test(d = mi_diferencia_minima,
power = mi_poder_deseado,
sig.level = mi_alpha,
n = NULL, # Déjalo nulo
type = "two.sample") # Comparando dos grupos
# El resultado
print(calculo)
Los resultados
R te dará algo así:
Two-sample t test power calculation
n = 1570.733 <---- ESTE ES TU NÚMERO
d = 0.1
sig.level = 0.05
power = 0.8
alternative = two.sided
NOTE: n is number in *each* group
BOOM. ¿Ves? n = 1570.7. Redondea a 1571.
Tu respuesta final (la que le das a tu jefe):
"Necesitamos 1,571 personas en el Grupo 1 y 1,571 personas en el Grupo 2 para tener un 80% de probabilidad de detectar un aumento de $500 en el ingreso."
Ahora tienes un PLAN. No una esperanza.
Deja de quemar tiempo y dinero en estudios sin poder. Deja de adivinar.
Haz el trabajo difícil AL PRINCIPIO. Te toma 10 minutos.
Esos 10 minutos te pueden salvar 6 meses de trabajo inútil.