lunes, 11 de marzo de 2019

¿Ketchup o Catsup? (I)

Cuando el señor Burns se ve obligado a valerse por sí mismo no le queda otra opción que ir al supermercado a hacer la compra. Allí, cual asno de Buridan, se queda petrificado en un pasillo incapaz de decidirse por una de las dos opciones que sostiene en sus manos, un bote de ketchup y un bote de catsup.

The Simpsons 4F17

Supongamos que la información nutricional de los productos entre los que duda el señor Burns es la siguiente (por cada cien gramos):

CarbohidratosSal
Ketchup33,3 gramos907 mg
Catsup27 gramos1067 mg

El señor Burns es una persona de edad provecta así que debería vigilar su consumo de sal, por lo que vamos a considerar que lo más adecuado para él es la salsa con menos cantidad de sodio. En este caso la elección es obvia: ketchup.

No me consta que Burns tenga problemas de diabetes pero, en cualquier caso, consumir la menor cantidad de azúcar es un consejo de salud habitual. La mejor opción en este caso también es evidente: catsup.

Ahora bien, ¿cuál es la mejor opción teniendo en cuenta los dos criterios anteriores? Si son lectores habituales del blog recordarán que hemos estudiado con cierto detalle una posible solución a este tipo de problemas. Me gustaría presentarles un par de métodos alternativos. Antes de describirlos ampliemos nuestro abanico de opciones de ejemplo:

CarbohidratosSal
Ketchup33,3 gramos907 mg
Ketchup sin azúcar3,4 gramos2000 mg
Catsup27 gramos1067 mg
Catsup Light16,6 gramos1800 mg


TOPSIS son las siglas de Technique for Order Preference by Similarity to Ideal Solution. Suena sofisticado ¡así que debe de ser bueno! Fue desarrollado por Yoon y Hwang en 1980 bajo una premisa sencilla: la mejor opción es aquella que está más cerca de la solución ideal y, a la vez, más alejada de la peor alternativa posible.

¿Qué entendemos por «cerca» y «lejos» en este contexto? Lo mismo que en nuestra vida diaria: «cerca» es la distancia en línea recta o la trayectoria más corta posible entre dos puntos (es lo que se conoce como distancia euclidiana, por el célebre matemático Euclídes). Es un concepto muy fácil de entender con una imagen:


En una línea recta que va desde 0 a 2.500 hemos situado nuestras opciones según su cantidad de sal. La peor elección sería el ketchup sin azúcar; la mejor, el ketchup normal. Es de suyo evidente que dicho producto es el que más cerca está de la mejor opción y más lejos se sitúa de la peor.

Antes de continuar reflexionemos brevemente sobre el significado de la imagen anterior. Hemos dibujado una línea recta que empieza en 0. Sobre ella hemos situado nuestras opciones según el valor de uno de sus atributos (la sal). Con ello hemos creado un mundo unidimensional en el que la distancia viene marcada por la separación entre los puntos y es fácil de calcular con una simple resta.

Añadamos ahora nuestro segundo criterio, a saber, los carbohidratos. Tendremos, pues, dos atributos o características a considerar. Dicho de otra forma, ahora tenemos un mundo bidimensional. ¿Qué mejor forma de representarlo que con el plano cartesiano?


En nuestro plano la opción ideal, si existiera, se situaría en las coordenadas correspondientes a la menor cantidad de sal (900) y la menor cantidad de carbohidratos (16,6). Añadámosla al plano:

Ahora que tenemos dos dimensiones ¿cómo podemos calcular la distancia de una salsa en concreto a la solución ideal? La respuesta es fácil de ver con una imagen:


En efecto, la distancia hacia la mejor opción es la hipotenusa de un triángulo rectángulo. Calculando las hipotenusas del rectángulo correspondiente a cada alternativa podríamos clasificarlos según su distancia hacia la solución ideal y, a partir de ahí, ver qué elección es la mejor.

¿Qué ocurre si tenemos que tomar decisiones entre alternativas que tienen más de dos atributos a considerar? No hay ningún problema porque la distancia euclidiana se puede calcular para cualquier número de dimensiones.

Imagen de Wikimedia Commons

Ahora bien, antes de medir las distancias hay que normalizar los datos. En el problema que nos ocupa hoy la escala que mide la cantidad de sal es mucho mayor que la que mide la cantidad de carbohidratos. La primera va de 900 a 2000, mientras que la segunda se mueve entre 16 y 35. Si queremos que ambos factores tengan idéntica importancia es necesario, como vimos en su día, normalizar los valores.

En aquella ocasión estudiamos en su momento diferentes maneras de normalizar un conjunto de datos. TOPSIS utiliza la normalización vectorial. Sin entrar en detalles, lo que se logra con este tipo de normalización es que las hipotenusas tengan una distancia comprendida entre 0 y 1.

CarbohidratosSalCarbohidratos (normalizado)Sal (normalizado)
Ketchup33,3 907 0,720,3
Ketchup sin azúcar3,4 2000 0,740,66





Catsup27 1067 0,590,35





Catsup Light16,6 1800 0,360,59






Una vez hecha la normalización el siguiente paso es añadir pesos. Cada característica puede tener un peso distinto con la condición de que la suma de todos los factores sea uno. Así, si nos importan lo mismo el contenido de sal y el de carbohidratos, los pesos serán 0,5 y 0,5. Si, por ejemplo, la cantidad de sal nos importara cuatro veces más que la de carbohidratos los pesos serían 0,8 y 0,2.





Carbohidratos (normalizado, con peso 0,5)Sal (normalizado, con peso 0,5)



Ketchup



0,360,15



Ketchup sin azúcar



0,370,33



Catsup



0,30,18



Catsup Light



0,180,3





Después de aplicar los pesos a los valores normalizados se determinan las soluciones ideal y pésima. La solución ideal es aquella que, si existiera, tendría los mejores valores posibles. Recordemos que, en nuestro caso, esto corresponde a la menor cantidad de sal y de carbohidratos. La solución pésima es aquella que tiene los peores valores posibles.





Carbohidratos Sal



Opción ideal



0,180,15



Opción pésima



0,370,33

























Finalmente, se calculan las distancias para cada alternativa hacia la solución ideal y la opción pésima y se aplica una fórmula para calcular la cercanía relativa.

Imagen de Wikimedia Commons

El resultado será un valor entre 0 y 1. Cuanto mayor es este valor, mayor es la prioridad (mejor opción es).







Distancia hasta la mejor opciónDistancia hasta la peor opciónPuntuaciónClasificación
Ketchup





0,180,180,364
Ketchup sin azúcar





0,2400,641
Catsup





0,120,170,43
Catsup Light





0,120,190,472

En nuestro caso, concluimos que la mejor elección es el ketchup sin azúcar.

TOPSIS no es método perfecto. Su premisa es fácil de entender (¿qué opción se acerca más a la ideal?) pero laboriosa de calcular a mano, razón por la cual hemos omitido algunas ecuaciones. Afortunadamente, existen aplicaciones y herramientas web para ello.

Por otro lado, en TOPSIS se asume que cada criterio tienen una utilidad que crece o decrece de forma monótona, lo que traducido a lenguaje llano quiere decir que tiene la misma importancia un gramo de carbohidratos independientemente de si es el único presente o el centésimo primero. Por tanto, no presenta el efecto de saturación que sí mostraba nuestro método multiplicativo con lo que no refleja fielmente cómo los humanos satisfacemos nuestros apetitos.

Otro inconveniente de TOPSIS es que solo es válido con escalas ordinales (aquellas que tienen un cero natural), por lo que no sirve para lidiar con atributos subjetivos como el sabor o el aspecto. Finalmente, como trabaja con datos normalizados el orden de la clasificación puede cambiar y dar lugar a incongruencias cuando se añaden o se eliminan opciones.

Continuará.