La economía y la estadística van juntos de la mano. Sería casi imposible analizar la actividad económica sin los indicadores que se construyen a partir de las estadísticas, mientras que sin teorías o problemáticas económicas la estadística caería casi en desuso. Si no fuera por las ciencias sociales, ¿para qué utilizaríamos las estadísticas?
Sin embargo, también es fundamental señalar que son dos carreras muy distintas. La mayoría de las carreras de economía llevan algunos cursos de estadísticas (típicamente estadística descriptiva, inferencial, probabilidad, econometría y series de tiempo), para que esté familiarizado de las estadísticas y para que las pueda interpretar. Lleva econometría para realizar pruebas de hipótesis de distintas teorías, que ayudarán en el análisis. No obstante, si quiere profundizar y hacer un uso más allá (levantar muestras, construir indicadores más complejos y armar cuentas nacionales), realmente necesita un posgrado.
Igualmente sucede con los estadísticos. Llevan cursos muy avanzados en su materia, pero no toman demasiados cursos en economía. Tienen una base muy sólida en matemáticas, actuaría, inferencia, muestreo y econometría, pero sin haber cursado muchas materias en economía y las demás ciencias sociales. Claramente existen opciones de carrera que buscan una combinación óptima de ambos (como matemáticas o estadísticas aplicadas), pero en general he encontrado que los economistas no saben lo suficiente de estadística, mientras que los estadísticos no conocen al fondo la economía.
Esta aclaración proviene del hecho de que muchas veces se culpa a los economistas de las confusiones generadas por las estadísticas, de las fallas metodológicas inherentes y de lo ambiguo que pueden ser. Pero en muchos de estos casos, los problemas surgen de la dificultad estadística para medir correctamente un fenómeno económico y no necesariamente de la teoría económica. Incluso, en la mayoría de los casos los economistas toman prestado instrumentos de otras ciencias (matemáticas, estadísticas, sociología, psicología, antropología, etc.). Uno de los casos más notorios es el análisis de series de tiempo.
La gran mayoría de los indicadores económicos son series de tiempo, es decir, se calcula un valor para cierto fenómeno en un momento dado y se analiza cómo cambia en momentos sucesivos del tiempo. Sin embargo, la medición no es nada fácil. Primero, porque se construyen mediante una inferencia, que implica realizar muchos supuestos acerca de la distribución estadística y del tamaño de la muestra que se utiliza para inferir el dato. Segundo, hay muchos factores externos que influyen en la medición, como pueden ser los efectos de calendario y la estacionalidad, que si no toman en cuenta adecuadamente, pueden llevar a conclusiones inexactas o incluso erróneas.
En el cálculo de un indicador, típicamente el INEGI utiliza algún censo para construir una muestra representativa. Mediante probabilidades, asume que refleja la realidad y enseguida levanta la muestra cada mes (o trimestre) para “inferir” el dato. Lo primero que sale a relucir es que ningún indicador que se construye así va dar una cifra exacta, sino que debemos tomar el número a sabiendas de que con una probabilidad de 95 por ciento (u otro valor) se aproxima a la realidad. Lo segundo, es que seguramente el indicador tiene un comportamiento estacional definido, que debemos aislar para analizarlo mejor. Sin embargo, no existe un método infalible para medirlo, sino solo formas de aproximarlo. De nuevo, el cálculo del ajuste estacional le va restar exactitud, es decir, aumenta el rango probabilístico del error de medición.
Un ejemplo claro es la forma en que el INEGI aplica el ajuste estacional a sus indicadores: tomemos el caso del IGAE. La Dirección General de Estadísticas construye el indicador mediante estimaciones distintas de los componentes (actividades primarias, secundarias y terciarias), que después mediante ponderaciones se llega al total. Estos datos (que se conocen como las series originales) se entregan a otra Dirección General, que aplica los ajustes estacionales a cada componente y al total por separado. Esto significa que ya no hay consistencia entre el total y sus componentes. En el caso de abril, las actividades crecieron 0.00, 0.64 y 1.09 por ciento respectivamente, mientras que el total creció 1.25 por ciento, más que la suma de los partes. Ya que sabemos que es imposible que el total crezca más que todos sus componentes, ¿cómo debemos interpretar el dato? ¿Qué grado de confianza podemos tener en las cifras?