Power & Market

Cómo no usar porcentajes en una historia periodística

Usar números para describir el mundo está lleno de peligros. El problema no es que se pueda probar nada con estadísticas (no puedes) o con la ocurrencia de Mark Twain de equiparar las estadísticas con mentiras, sino más bien que los números no acompañados de puntos de referencia correctos tienden a ser muy engañosos. La famosa cita de Hayek donde los agregados ocultan es simplemente una subsección de este error mayor; reportar un número (un promedio, un porcentaje, una estadística de crecimiento) cuando la historia correcta o más elaborada incluye ese número en combinación con otros números, es la mayor preocupación.

En la política (y en los medios de comunicación encargados de cubrirla), lo que está en juego en la representación de los números a favor de uno mismo es muy alto, por lo que vemos este error todo el tiempo. Permítanme abordar lo que puede ser el más común: no dividir por el denominador correcto, disfrazado por el uso frecuente y descuidado de porcentajes.

Normalmente, las afirmaciones expresadas en porcentaje, como «87,2% de los hogares estadounidenses tienen una computadora», tienen un significado directo; la palabra «por ciento» significa literalmente «por cien». Si hubiera 100 hogares estadounidenses, sabríamos que alrededor de 87 de ellos tienen una computadora. Nuestros cerebros leen correctamente «casi todos los hogares americanos», ya que 87,2 es la gran mayoría de los 100. Si tenemos alguna información adicional sobre el número de hogares (119 millones) podemos establecer rápidamente que unos 104 millones de hogares tienen un ordenador; el 12,8% restante (alrededor de 15 millones o más) no lo tienen, lo que sabemos ya que los grupos son mutuamente excluyentes (o bien su hogar tiene un ordenador o no lo tiene) y que los porcentajes suman cien (87,2+12,8=100). Fácil.

Tratar con números no negativos como propietarios de automóviles, votos, ingresos o rentas como ésta rara vez es un problema, y los porcentajes son ideales para realizar esa tarea; no requieren que el lector tenga información detallada sobre el número de hogares para poder medir el significado del dígito del 87,2%. Los números reportados en porcentaje nos dan un punto de referencia natural: los hogares con computadoras divididos por todos los hogares.

Esto cambia rápidamente cuando el subconjunto de números que está describiendo puede incluir números negativos, como la creación neta de empleo o el crecimiento de los ingresos. Dado que estas cifras pueden llegar a ser negativas incluso para grandes subsecciones de una población, el significado de «porcentaje» se pierde por completo. La intuición es la siguiente: cuando se incluyen números negativos en una muestra y se toma un porcentaje basado en algún número (positivo) restante, los porcentajes individuales se suman fácilmente a más de cien.

He aquí un ejemplo de una economía hipotética de tres personas (A, B y C), cuyos ingresos combinados en el primer año son de $300 (distribuidos en $50 para A, $100 para B y $150 para C). En el segundo año, A aumentó sus ingresos a $70 (un aumento del 40%), B sólo ganó $80 (una reducción del 20%) y el ingreso de C pasó de $150 a $180 (un aumento del 20%). El crecimiento total de los ingresos en nuestra economía fue del 10% (A+B+C igualó $300 en el primer año, A+B+C igualó $330 en el segundo año), para una ganancia total de ingresos de $30. Si dividimos la ganancia de ingresos de A ($20) con la ganancia total de ingresos ($30) encontramos que dos tercios, o el 66,7% de la ganancia de ingresos fue a A. Si dividimos de manera similar la ganancia de ingresos de C ($30) entre la ganancia total de ingresos ($30) encontramos que el 100% de la ganancia de ingresos del año fue a C. ¿Cómo en el mundo puede ser que C haya obtenido toda la ganancia de ingresos cuando acabamos de decir que A recibió dos tercios de la misma?

 

Year 1

Year 2

Income gain
(%)

Income gain
(dollars)

Income gain
% of total

A

50

70

40%

+20

+66.7%

B

100

80

-20%

-20

-66.7%

C

150

180

20%

+30

+100%

Sum

$300

$330

10%

+30

100%

 

Cualquier dato presentado de esta manera rápidamente suscitaría preguntas: claramente, hay algo mal en la afirmación de que A y C juntos recibieron el 166,7% de la ganancia total de ingresos. Debido a que la ganancia negativa de ingresos de B distorsiona el panorama, los porcentajes que reflejan la participación de A y C en las ganancias de ingresos ya no significan lo que normalmente significan.

¿Qué ha pasado aquí?

Como se evidencia en la tabla, podemos ver rápidamente que debido a que las ganancias de ingresos de «A» en números absolutos cancelan las ganancias de ingresos de «B», cualquier discusión que incluya la participación de alguien en el crecimiento de los ingresos es seriamente engañosa. La participación en el crecimiento de los ingresos sólo asciende a cien cuando se incluye la ganancia negativa de ingresos de B, pero si sólo nos preocupamos por los que tienen más ingresos –en este caso C– podríamos fácilmente (y erróneamente) concluir que toda la ganancia de ingresos fue capturada por los ricos.

Usemos otro ejemplo para hacer el error aún más obvio. Si recuerda el debate sobre la creación de empleo de Mitt Romney en el período previo a las elecciones de 2012, este es un buen ejemplo de cómo utilizar denominadores incorrectos. La RNC y la Campaña Romney calcularon que la pérdida neta de empleo entre enero de 2009 y marzo de 2012 fue de 740.000, pero que la pérdida neta de empleo para las mujeres durante el mismo período fue de 683.000. Los cálculos rápidos muestran que las mujeres representan el 92,3% (683.000/740.000=0,923). Por supuesto, podemos hacer esto aún más absurdo comparando febrero de 2009 con marzo de 2012, donde la pérdida neta de empleo fue de 16.000 puestos de trabajo. En términos netos, las mujeres perdieron casi medio millón de puestos de trabajo durante ese período, lo que arroja un resultado de alrededor del 3100% de todas las pérdidas de puestos de trabajo. El significado directo de «porcentaje» como fracción de cien ha desaparecido por completo.

Dado que las «pérdidas netas de puestos de trabajo» implican la creación de puestos de trabajo menos la pérdida de puestos de trabajo, dividir el número de puestos de trabajo perdidos por las mujeres entre las pérdidas netas de puestos de trabajo es un denominador totalmente erróneo. El»porcentaje» ya no tiene los significados directos que suele tener, pero sigue transmitiendo ese mensaje al lector desinformado.

Abundan los deflectores de porcentajes

Claro, cualquiera que tenga un conocimiento incluso rudimentario de las estadísticas sabe que no debe usar porcentajes seleccionados cuando el conjunto de números subyacente puede ser negativo. Pero el engañador hábil o el tonto descuidado todavía pueden decir cosas como «el 100% de la ganancia de ingresos entre el año uno y el año dos fue para el asalariado C», y el lector interpretará «el 100%» con su significado habitual («todo»). Pero cuando el conjunto completo incluye números negativos, el denominador relevante ya no es 100.

Ya sea por malicia o por ignorancia, los economistas y los expertos en medios de comunicación caen en esta trampa todo el tiempo. CNBC informó el año pasado que «en nueve estados, el crecimiento de los ingresos del 1 por ciento superior fue la mitad o más de todo el crecimiento de los ingresos en ese período de tiempo». Hace unos años, la desigualdad de Joseph Stiglitz escribía que «todo el crecimiento de las últimas décadas –y más– ha ido a parar a los de arriba». Un reciente documento de trabajo de Emmanuel Saez –un economista de la Universidad de California en Berkeley que realmente debería saberlo mejor– resumió sus hallazgos de que «las principales familias del 1% captaron el 49% del crecimiento del ingreso real total por familia entre 2009 y 2017». Saliendo de la Gran Recesión, la revista británica The Economist destacó que «alrededor del 95% del aumento de los ingresos estadounidenses desde 2009 ha pasado al 1% superior». Por supuesto, los políticos de izquierda hacen este tipo de afirmaciones de forma regular, pero son estadísticamente poco sólidos.

En su exitoso libro How To Not To Be Wrong, el profesor de matemáticas Jordan Ellenberg concluyó que «la combinación de lo positivo y lo negativo te permite, si no tienes cuidado, contar una historia falsa, en la que todo el trabajo de creación de empleo en el sector comercializable fue hecho por [una sola] industria».

Los porcentajes de informes cuando el conjunto de datos subyacente incluye números negativos eliminan el significado estándar de porcentaje. El 90% de algo que incluye números negativos ya no significa «casi todo» o «una gran mayoría».

Los números presentados por sí solos ocultan o engañan al lector; «Compara siempre tu número» debería ser un mandamiento estadístico. Mientras que los números reportados en porcentajes proporcionan una referencia útil para el lector, dividir por el denominador incorrecto o involucrar números negativos, distorsiona seriamente la historia. Tenga en cuenta cuando los engañadores estadísticos o los tontos descuidados arrojan porcentajes. A veces no deberían.

All Rights Reserved ©
Image Source: Getty
What is the Mises Institute?

The Mises Institute is a non-profit organization that exists to promote teaching and research in the Austrian School of economics, individual freedom, honest history, and international peace, in the tradition of Ludwig von Mises and Murray N. Rothbard. 

Non-political, non-partisan, and non-PC, we advocate a radical shift in the intellectual climate, away from statism and toward a private property order. We believe that our foundational ideas are of permanent value, and oppose all efforts at compromise, sellout, and amalgamation of these ideas with fashionable political, cultural, and social doctrines inimical to their spirit.

Become a Member
Mises Institute