7 de diciembre de 2013

Desigualdad de Jensen: cuando más significa menos y viceversa

Johan Ludwig William Valdemar Jensen (1859-1925) más conocido como Johan Jensen, fue un ingeniero danés apasionado de las matemáticas que ha pasado a la historia por ser el primero en interesarse por un fenómeno característico de las funciones continuas no lineales (convexas o cóncavas), conocido hoy como “Desigualdad de Jensen”, una propiedad que aparece en múltiples contextos y que de pocos años para acá ha comenzado a encontrar aplicaciones interesantes, desde el ámbito financiero al campo sanitario y otros por descubrir. En lo que sigue me he basado en el excelente libro “Antifrágil” de Nassim Nicholas Taleb y otros documentos disponibles en la red para realizar una aproximación didáctica y a la vez divertida de esta interesante propiedad de las funciones no lineales.

Se suele decir que de niños aprendimos fácilmente lo que es una función lineal: cuando existe proporcionalidad entre “algo” (p.ej. la fuerza con la que lanzamos a ras de suelo una bola de billar o de bowling) y la “función de ese algo” (p.ej. la distancia que alcanza la bola), funciones que aprendimos a calcular y a representar como una recta en el sistema de coordenadas inventado por un señor francés llamado René Descartes y que en un esfuerzo de reduccionismo creímos o nos hicieron creer que todo lo que sucedía en el mundo podría entenderse aplicando linealidades escolares, o haciendo algo más sofisticado como simplificar las ecuaciones hasta hacerlas lineales. Toda una generación, la de nuestros padres, que como mucho inferían las cosas aplicando la simple regla de tres, todo un paradigma de la linealidad.

Tal vez por esa razón nos cuesta mucho más aprender las funciones no lineales, ya sabe, aquellas donde no hay proporcionalidad y la representación en el sistema de coordenadas de ese señor francés tan simpático no sea una línea recta sino algo más difícil de dibujar, una parábola, esto es cuando, siguiendo el ejemplo del balón, no existe proporcionalidad entre “algo” (p.ej. la fuerza con la que pegamos un puntapié a una pelota hacia arriba) y la “función de ese algo” (p.ej. la distancia que alcanza la pelota, sometida entonces a otras consideraciones como el ángulo de la trayectoria vertical u otras más sutiles como la resistencia del viento, etc.), es decir, puede ser suficiente incorporar una dimensión adicional (en este caso la inclinación o la altura) para que el mismo esfuerzo (el impulso a la pelota) tenga un resultado (en este caso la distancia) distinto.

La cosa se complica aún más cuando hablamos de cosas más reales y cotidianas como, por ejemplo, la recientemente comentada relación no proporcional (no lineal) entre la inversión en educación y el ranking del Informe PISA 2012 revelan algo inquietante para una mente lineal: “Los resultados de España son inferiores a los que se esperarían en función de su PIB per cápita”. Es decir, a igualdad de “algo” (PIB per cápita) otros países obtienen mejor rendimiento en las pruebas de PISA, es decir, España obtiene menos de la “función de ese algo” que cabría esperar. ¿Por qué?. Pues porque la realidad es no lineal por naturaleza. Así, en el caso concreto del Informe PISA 2012 se nos recuerda algo obvio desde el punto de vista no lineal: “Es importante cómo se gasta y no cuánto se gasta”. Otra vez nos encontramos con una limitación de la mente lineal, que no suele entender estas “sutilezas” de la realidad.

Otro ejemplo: A los portavoces del gobierno español últimamente les ha dado por repetir hasta la saciedad que hay que “redoblar esfuerzos” para salir de la crisis: todo un canto a la política de austeridad, un tópico de los últimos discursos políticos (más de 600.000 referencias en Google). En lenguaje matemático: si sustituimos la variable independiente (x) por “esfuerzo” y la variable dependiente f(x) por “resultado”, así x = esfuerzo y f(x) = resultado, es decir, cuando nos dicen “hay que redoblar el esfuerzo” están diciendo que hay que “hacer más esfuerzo, doblarlo, insistir en ello (en la misma dirección, en la misma política)”... o sea, “más de x”... ¿para qué?... eso no lo dicen pero es de suponer que es para “alcanzar un mayor y mejor resultado”... o sea, “más de f(x)”... pues (siguiendo con su lógica lineal) dado que los resultados todavía son pobres, si aumentamos los esfuerzos (la política de recortes) los resultados mejorarán (habrá más crecimiento y empleo)... y ahí es donde tropieza la falacia de una mente lineal... y es lo que estoy criticando, que la realidad no se comporta de manera lineal.

En un sistema lineal tiene su lógica, dado que a “+ de x” = “+ de f(x)”. Sin embargo, en un sistema no lineal (los que abundan en la realidad y en la Economía: curva de demanda, curva de oferta, curva de Laffer, curva de Phillips, curva de Engel, trampa de liquidez, ley de los rendimientos decrecientes, etc.) es incierto, porque “+ de x” no siempre significa “+ de f(x)”, como veremos a continuación. Y es que confundir las propiedades de la variable dependiente con las de la variable independiente es típico de políticos de mentalidad lineal. He aquí una simple pregunta para desenmascarar a los políticos que no ven más allá de la regla de tres: ¿doblar el esfuerzo implica doblar el resultado?... para los políticos que no lo entienden espero que cuando su médico les diga que se tomen una pastilla para dormir bien o una dosis de antibiótico para combatir una infección no se tomen doble ración por su cuenta esperando con ese proceder “el doble del resultado”... a lo mejor por ahí sí que entienden el mensaje de la no linealidad [1].

La Desigualdad de Jensen viene a ser la clave de bóveda que nos permite entender mejor las propiedades no lineales de la naturaleza. De manera informal, podemos definir esta desigualdad así: cuando la relación que liga una variable dependiente “y” (o variable efecto) con una variable independiente “x” (o variable causa) no es lineal, se cumple siempre que el valor esperado de “y” correspondiente al promedio de “x” es diferente (mayor o menor, según la forma de la función: cóncava o convexa) del promedio de los valores observados de “y”. Digámoslo de manera más informal: cuando no existe una relación de proporcionalidad entre dos variables, el promedio de la que se comporta como efecto resultará subestimado o sobreestimado si lo obtenemos a partir del promedio de la variable que funciona como causa. En otras palabras, es casi seguro que nos equivocaremos cuando estimemos el valor de la variable dependiente a partir de la variable independiente.

¿Y de dónde proviene esa subestimación o sobreestimación?. Pues proviene de nuestra habitual mente lineal, acostumbrada a la fácil extrapolación de la regla de tres (un poco de más aquí, es un poco de más allá; un poco de menos aquí, es un poco de menos allá), donde damos por supuesto que el comportamiento de la función va a ser equivalente, independientemente de que se trate de una función lineal o no lineal.

Veamos gráficamente las diferencias entre una función lineal y otras funciones no lineales para encontrar el fallo de nuestra forma de pensar. Comenzamos pues con una sencilla función lineal, donde veremos que en ellas si es cierto que la función del promedio de la variable (x) es igual a la media de la función (y), como muestra por ejemplo y=f(x)=2x


En este caso, la función del promedio de la variable (5,5) es 11, que es igual a la media de la función (11), como se puede ver en el ejemplo de la Excel que acompaña este post. Sin embargo cuando la función no es lineal, la cosa ya no es tan trivial, pues en una función no lineal (cóncava o convexa) la función de la media de una variable no es igual a la media de la función.

Así, si la función no lineal es convexa (forma de sonrisa), la función de la media de la variable será menor a la media de la función, o al revés, la media de la función será mayor que la función de la media de esa variable, como muestra por ejemplo y=f(x)=x2


En este caso, la función del promedio de la variable (5,5) es 30,25 mientras que la media de la función es 38,5. Es decir, si hubiéramos estimado el resultado promedio de la función a partir de la función del promedio de la variable nos habríamos equivocado en más de un 27% de error como se puede ver en el ejemplo de la Excel que acompaña este post. Mientras que si la función no lineal es cóncava (forma de puchero), la función de la media de la variable será mayor a la media de la función, o viceversa, como muestra por ejemplo y= f(x)=√(x) si bien esta es una función sólo ligeramente cóncava.


En este caso, la función del promedio de la variable (5,5) es 2,35 mientras que la media de la función es 2,25. Es decir, si hubiéramos estimado el resultado promedio de la función a partir de la función del promedio de la variable nos habríamos equivocado en más de un 4% de error como se puede ver en el ejemplo de la Excel que acompaña este post.

¿Qué implicaciones tiene la Desigualdad de Jensen?. Me atrevería decir que muchas y variadas. Tal vez la más importante sea aprender a reconocer dos sesgos típicos de convexidad (o concavidad): confundir la media de algo (p.ej. la fuerza con la que empujamos algo, el esfuerzo en perseguir un resultado, etc.), con la función de ese algo (p.ej. la distancia a la que se desplaza ese algo, el resultado de un esfuerzo), o también, el sesgo más sutil: confundir la función de la media con la media de una función... pues, como hemos visto, ante una función convexa nos podemos encontrar con la sorpresa de que al intentar estimar el resultado promedio a partir de la función de la media estemos subestimando el resultado y, viceversa, cuando estamos ante una función cóncava (convexidad negativa) nos encontraremos con la sorpresa de estar sobreestimando el resultado promedio a partir de la función de la media.

Otra implicación importante es la consideración estratégica, es decir, preguntarse por ¿qué pasará con la variable efecto si aumenta la variable causa (la variable que hasta cierto punto podemos controlar)?: si la respuesta es una aceleración positiva, entonces estamos ante una función convexa (suponiendo una función monótona en el intervalo estudiado), lo que implica un cierto “efecto palanca”, esto es, que podemos conseguir más de f(x) con menos esfuerzo de (x) y para ello deberíamos buscar los puntos de apalancamiento donde con menos esfuerzo se alcance un mayor resultado; mientras que si la respuesta es una aceleración negativa, entonces estamos ante una función cóncava (suponiendo monotonía) y en consecuencia deberíamos plantearnos un cambio, bien minimizando la variable causa (x) o bien, si esto no es posible por ser (x) una variable que escapa a nuestro control (exógena), entonces reducir o evitar nuestra exposición a los estados no deseables de f(x).

En conclusión, y volviendo al Informe PISA o al mantra del “redoble de esfuerzos” de nuestros políticos, la Desigualdad de Jensen nos recuerda que cuando el más de lo mismo no conduce a un mejor resultado (en lo personal, en lo empresarial, en lo político) es porque estamos ante una realidad no lineal y por tanto es el momento de realizar cambios cualitativos, pasando del cuánto (hacer más) al cómo (hacer diferente).

Como ya hice anteriormente con la ecuación logística, el modelo Lotka-Volterra y la inecuación de Gott para realizar simulaciones y observar el comportamiento del modelo nada mejor que un ejemplo basado en Excel. A practicar pues: Desigualdad de Jensen en Excel


[1] Desde un punto de vista sistémico, una relación lineal entre dos variables es una “rara avis” en la naturaleza, algo posiblemente único que sólo puede darse en un ambiente artificial, en un entorno controlado o aislado, es decir, en un sistema cerrado, sea real o por lo general abstracto. Sin embargo, en un sistema abierto como en la naturaleza o en la economía, lo habitual es encontrarse con relaciones no lineales, donde la intervención de más variables adicionales que interactúan con las variables estudiadas y/o de fenómenos de retroalimentación entre la (mal) llamada “variable causa” y la (mal) llamada “variable efecto” (en la retroalimentación, causa y efecto son indistinguibles, véase por ejemplo Ecuación Lotka-Volterra), generan esa percepción de no proporcionalidad entre la variable causa y la variable efecto escogidas de entre las muchas posibles. En otras palabras, es nuestro afán reduccionista, simplista, el que al abordar la complejidad del mundo escogiendo dos únicas variables observadas en lugar de todas las posibles y su calificación de causa (variable independiente) y efecto (variable dependiente) el que propicia la percepción de “extrañeza” por la no linealidad.

Para saber más: Johan Jensen en Wikipedia (inglés)

Biografía de Johan Jensen (inglés)

Desigualdad de Jensen en Wikipedia

Desigualdad de Jensen en Encyclopedia of Math (inglés)

Desigualdad de Jensen en Math World (inglés)

Función no Lineal en Wikipedia

No Linealidad en Wikipedia

Función convexa en Wikipedia

Función cóncava en Wikipedia

Esperanza Matemática en Wikipedia

El problema de la media, el problema con la media

Desigualdades


5 comentarios:

David dijo...

Me importa enterarme de pensamientos diversos que cuenten distintas cosas. Igualmente ahora le estoy dedicando a un examen que rindo la semana que viene para aprobar de una vez por todas funcion lineal

Vicente Bou Ayllón dijo...

Esta información la he relacionado con otras dos en esta entrada: http://nuevosistemaeducativo.blogspot.com.es/2013/12/los-mitos-ratio-inversion-horas-y.html

César Leonardo Patiño Burgos dijo...

Un post muy bueno en todo su contenido, de principio a fin. Lo he compartido y encontrado inspirador.
http://inscienceblog.com

DianaCif dijo...

Muchas gracias! Fantástica explicación.

Anónimo dijo...

Muy buena explicación