Meditaciones: marzo 2019

lunes, 25 de marzo de 2019

¿Ketchup o Catsup? (y II)

Hablemos ahora de otro método con nombre rimbombante, el analytic hierarchy process o AHP. A diferencia de las que hemos visto hasta ahora esta técnica no se basa solo en matemáticas sino que también se apoya en la psicología. Fue desarrollado por Thomas L. Saaty en la década de los ochenta y revisado en las décadas siguientes. La versión que vamos a examinar es la original.

AHP funciona descomponiendo un problema complejo en un sistema de jerarquías que representan los aspectos más relevantes del mismo, tales como criterios a satisfacer, subcriterios que forman esos criterios, alternativas disponibles y atributos de estas. El objetivo se sitúa en el cénit de la jerarquía y el resto de aspectos en niveles por debajo del mismo. La imagen siguiente muestra un ejemplo de jerarquía para un problema que consiste en elegir al mejor dirigente de los tres candidatos posibles:

Imagen de Wikimedia Commons

Los números que aparecen en la imagen tienen dos significados. El objetivo (goal) siempre tiene valor 1. En el caso de los criterios los números indican la importancia relativa y tienen que sumar 1 (el valor del objetivo). Finalmente, en el nivel de las alternativas los números indican hasta qué punto una alternativa dada satisface los criterios de la jerarquía superior. Así pues, en este ejemplo concreto lo que más importa es que el candidato tenga experiencia y formación, y Dick es la mejor opción.

Para obtener las cifras que representan la importancia de cada criterio se evalúan estos entre sí tomados de dos en dos. Quien ha de tomar la decisión final utiliza su propio juicio para determinar, dado un par concreto, qué es más importante. Para convertir valoraciones lingüísticas en números Saaty propuso la siguiente escala:

Imagen de Wikimedia Commons

La razón de ser de esta escala es la ley del umbral de diferencia enunciada por el psicólogo experimental del siglo XIX Ernst Weber:

In 1846 Weber [...] stated his law regarding a stimulus of measurable magnitude. According to his psychological theory a change in sensation is noticed if the stimulus is increased by a constant percentage of the stimulus itself. That is, people are unable to make choices from an infinite set. For example, people cannot distinguish between two very close values of importance, say 3.00 and 3.02. Psychological experiments have also shown the intriguing fact that most individual cannot simultaneously compare more than seven objects (plus or minus two)[Miller, 1956]. This is the main reasoning used by Saaty to establish 9 as the upper limit of his scale, 1 as the lower limit and a unit difference between successive scale values.

Esta es, por lo tanto, la parte del método que se apoya en la psicología. Por un lado, la escala trata de reflejar cómo percibimos los estímulos y tiene en cuenta nuestras limitaciones al hacer comparaciones. Por otro, se abre la puerta para introducir nuestras preferencias y juicios en el proceso de decisión, lo que hace posible considerar factores subjetivos como el diseño, el sabor, características de personalidad, etcétera.

Ahora que ya conocemos por encima el AHP vamos a aplicarlo a nuestro dilema del ketchup. Recordemos nuestras alernativas:

Ketchup
Ketchup sin azúcar
Catsup
Catsup light

Estos serán los criterios que consideraremos para tomar nuestra decisión:

Precio
Sabor
Información nutricional

El primer paso es determinar la importancia que tiene para nosotros cada uno de los atributos anteriores. Para ello, como hemos dicho, debemos compararlos dos a dos y codificarlo según la escala de Saaty. Supongamos lo siguiente:

El sabor nos importa más que el precio, ya que el ketchup no es un producto demasiado caro, pero tampoco queremos gastar de más. Digamos que la importancia del sabor sobre el precio es de 7 (muy importante).
El sabor nos importa algo más que la información nutricional. Ponemos, por ejemplo, un dos.
La información nutricional (la cantidad de azúcar y sal) nos importa más que el precio y estamos dispuestos a pagar más por ello. Pongamos un 9.

	Precio	Sabor	Inf. nutricional
Precio	1	?	?
Sabor	7	1	2
Información nutricional	9	?	1

Las casillas marcadas con signo de interrogación son los valores recíprocos de las comparaciones ya hechas con lo que tabla completa queda así:

	Precio	Sabor	Inf. nutricional
Precio	1	0,143 (1/7)	0,111 (1/9)
Sabor	7	1	2
Inf. nutricional	9	0,5 (1/2)	1

Aplicando unos cálculos que vamos a obviar por razones de espacio (vectores eigen, para los interesados) obtenemos la siguiente jerarquía de prioridades:

El siguiente paso es, para cada criterio, comparar las alternativas de dos en dos según dicho criterio. Verbigracia:

**Comparación de sabor**
Ketchup	Ketchup sin azúcar	3	El ketchup normal es moderadamente más sabroso que la alternativa sin azúcar
Ketchup	Catsup	1	Ketchup y catsup nos saben igual
Ketchup	Catsup light	5	El ketchup nos sabe bastante mejor
Catsup	Catsup light	2	El catsup normal nos sabe algo mejor
Catsup	Ketchup sin azúcar	3	El catsup normal nos sabe moderadamente mejor
Catsup light	Ketchup sin azúcar	2	El catsup light nos sabe algo mejor

Con las premisas anteriores nos quedaría la siguiente matriz de valoraciones:

	Ketchup	Catsup	Ketchup sin azúcar	Catsup light
Ketchup	1	1	3	5
Catsup	1	1	3	2
Ketchup sin azúcar	0,33 (1/3)	0,33(1/3)	1	0,5 (1/2)
Catsup light	0,2 (1/5)	0,5 (1/2)	2	1

Con estos valores hacemos los mismos cálculos que antes con los criterios y nos queda la siguiente jerarquía:

Podemos ver que, en lo atinente al sabor, el ketchup normal es la mejor elección.

Nos queda repetir el mismo procedimiento para los otros dos criterios. Las comparaciones serán más fáciles de hacer ya que se trata de cantidades numéricas (para la información nutricional podemos, verbigracia, usar la calificación obtenedia mediante TOPSIS en el artículo anterior). Digamos que nuestra jerarquía final queda así:

Ahora que conocemos las prioridades de los criterios con respecto al objetivo, así como las prioridades de las alternativas con respecto a los criterios, podemos calcular las prioridades de las alternativas con respecto al objetivo. Para ello basta con multiplicar y sumar a lo largo de la jerarquía.

Criterio	Prioridad	Alternativa	Resultado
Sabor	0,554	Ketchup Ketchup sin azúcar Catsup Catsup Light	0,417 x 0,554 = 0,231 0,105 x 0,554 = 0,058 0,329 x 0,554 = 0,182 0,149 x 0,554 = 0,083
Precio	0,06	Ketchup Ketchup sin azúcar Catsup Catsup Light	0,383 x 0,06= 0,023 0,128 x 0,06= 0,008 0,347 x 0,06= 0,021 0,142 x 0,06= 0,009
Inf. nutricional	0,385	Ketchup Ketchup sin azúcar Catsup Catsup Light	0,072 x 0,385= 0,028 0,413 x 0,385= 0,159 0,102 x 0,385= 0,039 0,413 x 0,385= 0,159

Alternativa	Prioridad respecto al sabor	Prioridad respecto al precio	Prioridad respecto a la inf. nutricional	Respecto al objetivo
Ketchup	0,231	0,023	0,028	0,282
Ketchup sin azúcar	0,058	0,008	0,159	0,225
Catsup	0,182	0,021	0,039	0,242
Catsup light	0,083	0,009	0,159	0,251

Por lo que concluimos que la mejor alternativa según nuestras preferencias es el ketchup normal, seguido del catsup light.

No les recomiendo calcular el árbol de jerarquías a mano; es un proceso largo y tedioso. Para ello es mejor usar una de las muchas aplicaciones informáticas existentes que permiten introducir los criterios, registrar las alternativas y asistirnos en las comparaciones de forma ágil.

AHP no es tan intuitivo como el mero hecho de sumar o multiplicar valores de atributos pero nos permite considerar características subjetivas. Además, las decisiones se pueden tomar en conjunto. Por ejemplo, un grupo de personas encargado de tomar la decisión va acordando la importancia relativa de cada propiedad cuando se hacen las comparaciones dos a dos.

Respecto a los inconvenientes de AHP, puede darse el caso de que al añadir nuevas alternativas cambie el orden de clasificación de las mismas (problema conocido como rank reversal que afecta también a TOPSIS y el método basado en la suma que vimos en su día). Otro aspecto que cabe criticar son las escalas utilizadas para traducir un juicio del tipo «A es mucho mejor que B» en un número. La escala propuesta por Saaty que hemos visto es lineal mientras que otros autores abogan por escalas exponenciales.

AHP es uno de los métodos de decisión más usados y estudiados. Si quieren aprender más la página inglesa de Wikipedia desarrolla un par de ejemplos paso a paso. El primero, la elección de un directivo, es básico como el que hemos visto aquí. El otro, la elección de un coche para la familia, es más elaborado pues introduce conceptos que hemos obviado como las jerarquías múltiples.

lunes, 11 de marzo de 2019

¿Ketchup o Catsup? (I)

Cuando el señor Burns se ve obligado a valerse por sí mismo no le queda otra opción que ir al supermercado a hacer la compra. Allí, cual asno de Buridan, se queda petrificado en un pasillo incapaz de decidirse por una de las dos opciones que sostiene en sus manos, un bote de ketchup y un bote de catsup.

The Simpsons 4F17

Supongamos que la información nutricional de los productos entre los que duda el señor Burns es la siguiente (por cada cien gramos):

	Carbohidratos	Sal
Ketchup	33,3 gramos	907 mg
Catsup	27 gramos	1067 mg

El señor Burns es una persona de edad provecta así que debería vigilar su consumo de sal, por lo que vamos a considerar que lo más adecuado para él es la salsa con menos cantidad de sodio. En este caso la elección es obvia: ketchup.

No me consta que Burns tenga problemas de diabetes pero, en cualquier caso, consumir la menor cantidad de azúcar es un consejo de salud habitual. La mejor opción en este caso también es evidente: catsup.

Ahora bien, ¿cuál es la mejor opción teniendo en cuenta los dos criterios anteriores? Si son lectores habituales del blog recordarán que hemos estudiado con cierto detalle una posible solución a este tipo de problemas. Me gustaría presentarles un par de métodos alternativos. Antes de describirlos ampliemos nuestro abanico de opciones de ejemplo:

	Carbohidratos	Sal
Ketchup	33,3 gramos	907 mg
Ketchup sin azúcar	3,4 gramos	2000 mg
Catsup	27 gramos	1067 mg
Catsup Light	16,6 gramos	1800 mg

TOPSIS son las siglas de Technique for Order Preference by Similarity to Ideal Solution. Suena sofisticado ¡así que debe de ser bueno! Fue desarrollado por Yoon y Hwang en 1980 bajo una premisa sencilla: la mejor opción es aquella que está más cerca de la solución ideal y, a la vez, más alejada de la peor alternativa posible.

¿Qué entendemos por «cerca» y «lejos» en este contexto? Lo mismo que en nuestra vida diaria: «cerca» es la distancia en línea recta o la trayectoria más corta posible entre dos puntos (es lo que se conoce como distancia euclidiana, por el célebre matemático Euclídes). Es un concepto muy fácil de entender con una imagen:

En una línea recta que va desde 0 a 2.500 hemos situado nuestras opciones según su cantidad de sal. La peor elección sería el ketchup sin azúcar; la mejor, el ketchup normal. Es de suyo evidente que dicho producto es el que más cerca está de la mejor opción y más lejos se sitúa de la peor.

Antes de continuar reflexionemos brevemente sobre el significado de la imagen anterior. Hemos dibujado una línea recta que empieza en 0. Sobre ella hemos situado nuestras opciones según el valor de uno de sus atributos (la sal). Con ello hemos creado un mundo unidimensional en el que la distancia viene marcada por la separación entre los puntos y es fácil de calcular con una simple resta.

Añadamos ahora nuestro segundo criterio, a saber, los carbohidratos. Tendremos, pues, dos atributos o características a considerar. Dicho de otra forma, ahora tenemos un mundo bidimensional. ¿Qué mejor forma de representarlo que con el plano cartesiano?

En nuestro plano la opción ideal, si existiera, se situaría en las coordenadas correspondientes a la menor cantidad de sal (900) y la menor cantidad de carbohidratos (16,6). Añadámosla al plano:

Ahora que tenemos dos dimensiones ¿cómo podemos calcular la distancia de una salsa en concreto a la solución ideal? La respuesta es fácil de ver con una imagen:

En efecto, la distancia hacia la mejor opción es la hipotenusa de un triángulo rectángulo. Calculando las hipotenusas del rectángulo correspondiente a cada alternativa podríamos clasificarlos según su distancia hacia la solución ideal y, a partir de ahí, ver qué elección es la mejor.

¿Qué ocurre si tenemos que tomar decisiones entre alternativas que tienen más de dos atributos a considerar? No hay ningún problema porque la distancia euclidiana se puede calcular para cualquier número de dimensiones.

Imagen de Wikimedia Commons

Ahora bien, antes de medir las distancias hay que normalizar los datos. En el problema que nos ocupa hoy la escala que mide la cantidad de sal es mucho mayor que la que mide la cantidad de carbohidratos. La primera va de 900 a 2000, mientras que la segunda se mueve entre 16 y 35. Si queremos que ambos factores tengan idéntica importancia es necesario, como vimos en su día, normalizar los valores.

En aquella ocasión estudiamos en su momento diferentes maneras de normalizar un conjunto de datos. TOPSIS utiliza la normalización vectorial. Sin entrar en detalles, lo que se logra con este tipo de normalización es que las hipotenusas tengan una distancia comprendida entre 0 y 1.

	Carbohidratos	Sal	Carbohidratos (normalizado)	Sal (normalizado)
Ketchup	33,3	907	0,72	0,3
Ketchup sin azúcar	3,4	2000	0,74	0,66
Catsup	27	1067	0,59	0,35
Catsup Light	16,6	1800	0,36	0,59

Una vez hecha la normalización el siguiente paso es añadir pesos. Cada característica puede tener un peso distinto con la condición de que la suma de todos los factores sea uno. Así, si nos importan lo mismo el contenido de sal y el de carbohidratos, los pesos serán 0,5 y 0,5. Si, por ejemplo, la cantidad de sal nos importara cuatro veces más que la de carbohidratos los pesos serían 0,8 y 0,2.

	Carbohidratos (normalizado, con peso 0,5)	Sal (normalizado, con peso 0,5)
Ketchup	0,36	0,15
Ketchup sin azúcar	0,37	0,33
Catsup	0,3	0,18
Catsup Light	0,18	0,3

Después de aplicar los pesos a los valores normalizados se determinan las soluciones ideal y pésima. La solución ideal es aquella que, si existiera, tendría los mejores valores posibles. Recordemos que, en nuestro caso, esto corresponde a la menor cantidad de sal y de carbohidratos. La solución pésima es aquella que tiene los peores valores posibles.

	Carbohidratos	Sal
Opción ideal	0,18	0,15
Opción pésima	0,37	0,33

Finalmente, se calculan las distancias para cada alternativa hacia la solución ideal y la opción pésima y se aplica una fórmula para calcular la cercanía relativa.

Imagen de Wikimedia Commons

El resultado será un valor entre 0 y 1. Cuanto mayor es este valor, mayor es la prioridad (mejor opción es).

	Distancia hasta la mejor opción	Distancia hasta la peor opción	Puntuación	Clasificación
Ketchup	0,18	0,18	0,36	4
Ketchup sin azúcar	0,24	0	0,64	1
Catsup	0,12	0,17	0,4	3
Catsup Light	0,12	0,19	0,47	2

En nuestro caso, concluimos que la mejor elección es el ketchup sin azúcar.

TOPSIS no es método perfecto. Su premisa es fácil de entender (¿qué opción se acerca más a la ideal?) pero laboriosa de calcular a mano, razón por la cual hemos omitido algunas ecuaciones. Afortunadamente, existen aplicaciones y herramientas web para ello.

Por otro lado, en TOPSIS se asume que cada criterio tienen una utilidad que crece o decrece de forma monótona, lo que traducido a lenguaje llano quiere decir que tiene la misma importancia un gramo de carbohidratos independientemente de si es el único presente o el centésimo primero. Por tanto, no presenta el efecto de saturación que sí mostraba nuestro método multiplicativo con lo que no refleja fielmente cómo los humanos satisfacemos nuestros apetitos.

Otro inconveniente de TOPSIS es que solo es válido con escalas ordinales (aquellas que tienen un cero natural), por lo que no sirve para lidiar con atributos subjetivos como el sabor o el aspecto. Finalmente, como trabaja con datos normalizados el orden de la clasificación puede cambiar y dar lugar a incongruencias cuando se añaden o se eliminan opciones.

Continuará.