lunes, 17 de diciembre de 2018

En busca del coche perfecto (V)

Vamos a añadir más coches a nuestra tabla de clasificación usando el método de normalización z-score del que hemos hablado. Agreguemos estos:

Coche CV Consumo combinado Equipamiento Equipamiento de seguridad Precio
Audi A3 Sportback 150 5,1 35 9 28.950
Fiat Tipo Easy 120 6,0 14 4 18.777
Hyundai i30 Go 120 5,4 33 15 23.025
Kia Ceed Drive 100 6,2 18 13 20.350
Pegueot 308 GTLine 130 4,4 27 8 20.440
Volkswagen Golf Sport 5p 130 5,0 44 9 28.945


Anexándolos a los coches que ya teníamos, normalizando los datos y haciendo la suma la clasificación quedaría así:


Coche CV Consumo combinado Equipamiento Equipamiento seguridad Precio Puntuación final
Audi A3 Sportback 150 0.37 -0.53 0.46 -0.53 1.15 -0.32
Fiat Tipo Easy -0.6 1.06 -1.79 -1.99 -1.44 -4
Ford Focus Trend -1.24 -0.88 -1.01 0.34 -1.24 0.21
Honda Civic Prestige 1.41 0.71 1.43 1.21 1.121 2.22
Hyundai i30 Go -0.6 0.18 0.26 1.21 -0.36 1.06
Kia Ceed Drive 100 -1.24 1.42 -1.20 0.63 -1.04 -2.19
Mazda3 Evolution -0.6 -0.53 0.066 -0.24 -0.64 0.40
Opel Astra GSiLine 200 1.99 1.42 0.65 1.21 1.01 1.42
Peugeot 308 GTLine -0.27 -1.77 -0.03 -0.83 -0.61 1.25
Renault Megane GTLine 160 0.69 0.18 -0.72 -0.83 0.62 -1.64
Seat Leon Xcellence Edition Plus 0.37 -0.53 0.55 0.34 0.3 1.5
Volkswagen Golf Sport 5p 130 -0.27 -0.71 1.33 -0.53 1.14 0.09

Ordenemos por puntuación para ver el resultado más claramente:

Coche Puntuación final
Honda Civic Prestige 2.22
Seat Leon Xcellence Edition Plus 1.5
Opel Astra GSiLine 200 1.42
Peugeot 308 GTLine 1.25
Hyundai i30 Go 1.06
Mazda3 Evolution 0.40
Ford Focus Trend 0.21
Volkswagen Golf Sport 5p 130 0.09
Audi A3 Sportback 150 -0.32
Renault Megane GTLine 160 -1.64
Kia Ceed Drive 100 -2.19
Fiat Tipo Easy -4


El Honda Civic recibe la mejor puntuación, seguido del Seat León y del Opel Astra. En la cola de la tabla encontramos el Renault Megane, el Kia Ceed y el Fiat Tipo.

Un momento. Aquí falla algo. ¿No habíamos quedado en que el Seat León era el mejor? Recordemos la clasificación que teníamos antes de agregar más coches:

  1. Seat León Xcellence Plus
  2. Honda Civic Prestige
  3. Mazda 3 Evolution
  4. Ford Focus Trend
  5. Opel Astra GSILine
  6. Renault Megane GTLine
Sin embargo, en la nueva clasificación el orden de varios vehículos ha cambiado. Antes teníamos:

Seat León Xcellence Plus > Honda Civic Prestige
Mazda3 > Opel Astra GSILine 
Ford Focus Trend > Opel Astra GSILine

Pero ahora tenemos:

Honda Civic Prestige > Seat León Xcellence Plus
Opel Astra GSILine > Mazda3 Evolution
Opel Astra GSILine > Ford Focus Trend

¿Qué ha pasado? ¿Por qué la clasificación ha cambiado al agregar más vehículos?

En resumidas cuentas, porque hemos normalizado los datos. Ya se calculen usando mínimo-máximo o z-score, los valores normalizados se computan a partir de los existentes. Por consiguiente, cuando estos datos cambian (se agregan, eliminan o modifican observaciones) también lo hacen los valores normalizados. En nuestro caso esto significa que la clasificación no es absoluta ni inmutable ya que el orden puede variar según los automóviles que incluyamos en nuestro estudio. De nuevo, no parece una solución correcta.

Si la normalización es el problema ¿por qué no prescindir de ella? Podríamos, sencillamente, sumar y restar los valores en bruto. Si hiciéramos eso obtendríamos este resultado:


Coche CV Consumo combinado Equipamiento Equipamiento seguridad Precio Puntuación final
Audi A3 Sportback 150 150 5.1 35 9 28950 -2851,1
Fiat Tipo Easy 120 6 12 4 18777 -18647
Ford Focus Trend 100 4.9 20 12 19575 -19447,9
Honda Civic Prestige 182 5.8 45 15 28850 -28613,8
Hyundai i30 Go 120 5.5 33 15 23025 -22862,5
Kia Ceed Drive 100 100 6.2 18 13 20350 -20225,2
Mazda3 Evolution 120 5.1 31 10 21915 -21759,1
Opel Astra GSiLine 200 200 6.2 37 15 28418.24 -28172,44
Peugeot 308 GTLine 130 4.4 30 8 22050 -21886,4
Renault Megane GTLine 160 160 5.5 23 8 26889.62 -26704,12
Seat Leon Xcellence Edition (aka Plus) 150 5.1 36 12 25610 -25417,1
Volkswagen Golf Sport 5p 130 130 5 44 9 28945 -28767

Lo que resumido queda así:

Coche Puntuación final
Fiat Tipo Easy -18647
Ford Focus Trend -19447,9
Kia Ceed Drive 100 -20225,2
Peugeot 308 GTLine -21886,4
Mazda3 Evolution -21759,1
Hyundai i30 Go -22862,5
Seat Leon Xcellence Edition (aka Plus) -25417,1
Renault Megane GTLine 160 -26704,12
Opel Astra GSiLine 200 -28172,44
Honda Civic Prestige -28613,8
Audi A3 Sportback 150 -28761,1
Volkswagen Golf Sport 5p 130 -28767


La ventaja de hacer esto que el orden los coches no cambiará aunque se agreguen o se quiten otros modelos, es decir, el Ford Focus seguirá teniendo mejor puntuación que el Hyundai i30 aunque incluyamos modelos de Mercedes-Benz.

La desventaja de este sistema, sin embargo, es demasiado grande como para ignorarla y se ve reflejada en la puntuación final. Como vemos, todos los coches obtienen una puntuación negativa. Esto sucede porque el precio es una cantidad que se resta (cuanto más cuesta un coche, peor) y su magnitud es muy superior a la de los otros atributos. Por ejemplo, la potencia se sitúa entre cien y doscientos caballos mientras que el precio lo hace entre dieciocho mil y veinte mil euros lo cual significa que, si sumamos los datos en bruto, el coche más barato será siempre el primer clasificado. Empero, pocas personas considerarían que el Fiat Tipo en su acabado más básico es el mejor compacto del mercado o que el Volkswagen Golf en su versión más alta es el peor.

Quizá podamos arreglar el desaguisado asignando pesos a cada característica. Si, verbigracia, multiplicamos los valores de potencia por 144 los resultados oscilarían entre 14.380 y 28.761, de forma que la potencia importaría más o menos lo mismo que el precio. Esto nos permite, además, personalizar el cálculo a nuestra preferencia. Quizá seamos de esas personas que, en lo relativo a seguridad del vehículo, no miran el duro. Quizá queramos un coche potente para divertirnos. O quiźa busquemos gastar lo mínimo posible. Los pesos nos permiten adaptar el resultado a nuestras necesidades, si bien introducen un grado de subjetividad con el que hay que ser cuidadosos, so pena de ser víctimas del sesgo de confirmación, esto es, de que la clasificación refleje nuestras creencias previas.

Veamos un ejemplo utilizando pesos. Supónganse los siguientes pesos:

Puntuación = 3 * CV + 4 * Equipamiento

La ecuación anterior refleja que nos importa más el equipamiento que la potencia. La interpretación matemática sería que 4 caballos equivalen a 3 elementos de equipamiento. Así pues, siendo todo lo demás igual, si un coche tiene 104 caballos y 10 elementos de equipamiento tendrá los mismos puntos que uno con 100 caballos y 13 elementos de equipamiento.

Cuando solo tenemos dos atributos es sencillo ver qué significa cada peso. Sin embargo, cuando tenemos decenas o cientos de ellos la interpretación se torna dificíl o imposible.

Continuará.

No hay comentarios:

Publicar un comentario