La Confianza del INEGI

El titulo original de este artículo era “está mal la confianza del INEGI”. No dice que está mal la confianza en el INEGI, que sería otra cosa. Me refiero a específicamente al índice de confianza del consumidor que calcula mensualmente el INEGI mediante su Encuesta Nacional sobre Confianza del Consumidor (ENCO). De entrada, es importante saber que la ENCO está bien diseñada y se levanta cada mes en tiempo y forma. Incluso, abarca más preguntas de los que divulga el INEGI, algunas de sumo interés y valor analítico. El problema específico tiene que ver con la manera de calcular el indicador de difusión, que es el índice de confianza al consumidor.

Los indicadores de difusión se construyen mediante una encuesta que contiene preguntas cualitativas y cuyas respuestas son también de naturaleza cualitativa. Se convierte en un índice, es decir, se cuantifica al sacar un promedio ponderado de las respuestas. Típicamente, el índice va de cero a 100 (aunque se puede construir con rangos distintos), de tal forma que si el 100% de las respuestas son las más optimistas tomaría un valor de 100, y si el 100% de las respuestas son las más pesimistas registraría cero. Dado que es similar a un promedio ponderado, el valor mediano (50) es un umbral entre el balance de respuestas optimistas y pesimistas. Usualmente se incorporan cinco preguntas, de las cuales se obtienen cinco índices (referido como subíndices). Finalmente, se saca un promedio (simple o ponderado) de los cinco subíndices para obtener el índice total o final. Si analizan el índice de confianza del productor que publica el INEGI, encontrarán que así tal cual es como se presenta.

El problema proviene del hecho que en el caso de la confianza del consumidor, se iguala cada subíndice a 100 en el mes de enero de 2003, antes de sacar el promedio final del índice. En principio, se puede dividir una serie de tiempo (un vector) por una constante sin perder las propiedades de la serie. Esto significa que las tasas de crecimiento de un mes respecto de cualquier otro mes serán iguales partiendo de la serie original que si partimos de la serie dividido por la constante. Lo único que se obtiene al incorporar una base igual a 100 es que desaparece la referencia al rango de cero a 100, es decir, ya no se puede saber dónde se ubica dentro del rango el número de cualquier mes.

¿Por qué hace esto el INEGI? En principio, el índice de confianza del consumidor siempre se ha ubicado en la zona pesimista, es decir, por debajo del umbral de 50. Esto significa que el consumidor promedio siempre es pesimista, aunque a veces menos y a veces más. Analíticamente, esto realmente no importa ya que no es necesario ubicarse en la zona de optimismo para que el consumidor aumente sus compras. Más bien, se podría realizar estudios econométricos para determinar los rangos en que el consumidor se retrae o expande sus compras. Pero el problema de aplicar la base y quitar la referencia del rango trae varios problemas y al final resulta en un error matemático que puede distorsionar la información que prevé el indicador.

El primer problema que surge es de interpretación y posible confusión. Vamos a ilustrar con una encuesta de preferencias electorales entre AMLO y EPN que se hubiera levantado entre enero 2011 y junio 2012. La encuesta señalaría una ventaja significativa para EPN desde el comienzo y una tendencia a través del tiempo de que la diferencia se acortaría, aunque al final EPN mantendría la ventaja. La interpretación analítica es muy simple: EPN tenía una ventaja muy grande, que se fue acortando con el tiempo, pero al final terminó ganando. Ahora dividimos las respuestas de cada mes por una constante de tal forma que las preferencias de cada candidato fueran iguales a 100 en enero 2011. En principio, no sabríamos quién tiene la ventaja en un momento dado, sino sólo como cambian a través del tiempo. Una gráfica mostraría preferencias iguales a 100 en enero 2011 y después un incremento continuo para AMLO y una disminución para EPN. Sería sumamente fácil mal interpretar la gráfica y pensar que AMLO ganaría.

El problema se complica aún más cuando queremos comparar los resultados de un subíndice con otro, ya que al igualarlos a 100 no son comparables. Tampoco podemos comparar los subíndices (y menos el índice total) de la confianza del consumidor con el productor (a pesar de que son preguntas prácticamente iguales). En otras palabras, no pueden poner juntos en una gráfica con fines comparativos los distintos subíndices e índices, ya que generaría confusión y una mala interpretación de los resultados.

El problema final es matemático. Se puede dividir un índice entre una constante sin cambiar sus propiedades, pero si dividimos los componentes (subíndices) entre constantes y después sacamos el promedio, cambia el índice total. En otras palabras:

P1/X1 + P2/X2 no es igual a (P1+P2)/(X1+X2)

En el caso específico del índice de confianza del consumidor, los cambios mes a mes que presenta el INEGI con subíndices igualados a 100 son diferentes a si el índice se presentara en su forma original (como el del productor). Por ejemplo, el INEGI reportó una disminución de 0.07 puntos porcentuales en el índice de marzo respecto de febrero. Sin embargo, en la versión original no hubo una disminución sino un aumento de 0.62 puntos porcentuales.

Si comparamos la versión manipulada del INEGI versus el cálculo original desde abril de 2001 (cuando empezó) a la fecha (144 observaciones), encontramos diferencias de signo en 13 ocasiones. Lo irónico es que 10 fueron ocasiones en que el INEGI reportó una disminución en la confianza en vez de un aumento, mientras que sólo 3 fueron al revés. Pero los errores no se limitan a signos equivocados, ya que el error de subestimación ya llegado a ser 2.3 puntos porcentuales en un momento dado; en enero 2003 el INEGI reportó una disminución de 7.03 puntos porcentuales respecto del mes anterior, cuando en la versión original el cambio sólo fue de -4.73. En enero de 2012 el INEGI nos dijo que la confianza del consumidor había aumentado 5.02 puntos porcentuales (entre los aumentos más pronunciados en su historia), cuando en realidad el incremento fue tan sólo de 3.0 puntos porcentuales.

El INEGI debería eliminar la referencia de base 100 en sus cinco subíndices de la confianza del consumidor y calcular éste en la misma forma que el del productor. Ganaríamos con mayor interpretación analítica, menos posibilidad de mal interpretar los resultados e información más precisa mes con mes. La referencia de base 100 quita todo lo anterior sin agregar absolutamente nada. No sólo mejoraría la confianza del INEGI, sino también aumentaría la confianza en el INEGI.

Deja un comentario Cancelar respuesta