07/10/2024

Académico de Estadística UdeC publica artículo en prestigiosa revista internacional.

Un estudio centrado en el uso de Modelos de Elección Discreta y algoritmos de Machine Learning fue llevado a cabo por investigadores de la Universidad de Concepción. El trabajo titulado “A systematic comparative evaluation of machine learning classifiers and discrete choice models for travel mode choice in the presence of response heterogeneity” está liderado por el académico del Departamento de Estadística Patricio Salas, en conjunto con Rodrigo De la Fuente (Dpto. de Ingeniería Industrial), Sebastián Astroza (Dpto. de Ingeniería Industrial e Instituto Sistemas Complejos de Ingeniería) y Juan Antonio Carrasco (Dpto. de Ingeniería Civil e Instituto Sistemas Complejos de Ingeniería).

En el estudio, los investigadores realizaron una comparación del rendimiento predictivo de cinco clasificadores de Machine Learning (ML) y dos modelos de elección discreta (Multinomial Logit y Mixed Logit), y analizaron la capacidad de explicación de los distintos modelos calculando el efecto de diferentes variables, sobre la performance predictiva de los modelos en términos globales y locales utilizando un método de modelo agnóstico.

Es importante mencionar que los modelos de elección discreta han sido durante décadas la técnica más utilizada para modelar la elección del modo de viaje de las personas; se utilizan para explicar o predecir una elección en un conjunto de alternativas distintas. Un ejemplo del uso de este tipo de modelo se utiliza para responder preguntas como ¿por qué motivos la gente elige viajar en vehículo, metro, bicicleta o caminando para ir al trabajo? o también su uso se puede aplicar para analizar los factores que influyen que una persona elija un tipo de vehículo en lugar de otro. Por otra parte, durante los últimos años ha aumentado el uso de algoritmos de ML para modelar este mismo fenómeno.

“Nuestros análisis pueden utilizarse para apoyar la toma de decisiones de gestión y para comprender mejor los factores que determinan el comportamiento de viaje de las personas”, explica el investigador Patricio Salas.

Entre los modelos de elección discreta, el Multinomial Logit (MNL) es el modelo más popular. Varias versiones de este modelo han sido propuestas, como el modelo Mixed Logit (MMNL) que permite incorporar efectos como la heterogeneidad entre individuos. Por otro lado, los métodos de ML han comenzado a ganar terreno en el campo del transporte, mostrando un alto poder predictivo que supera a los modelos tradicionales. En la actualidad, la mayoría de los estudios comparan los métodos de ML y los modelos logit enfocados en la precisión predictiva, mientras que pocos se centran en el análisis de explicaciones post hoc.

“Los diferentes métodos se prueban en base a conjuntos de datos sintéticos con y sin heterogeneidad entre los tomadores de decisiones, mostrando una significativa reducción de la brecha de precisión predictiva entre los modelos de elección discreta y los algoritmos de ML cuando hay presencia de heterogeneidad”, explica el docente. En su estudio, los investigadores además presentaron una aplicación empírica utilizando cuatro conjuntos de datos de elección de modo. “Nuestros resultados muestran que las redes neuronales generalmente funcionan mejor que otros modelos en términos de precisión e interpretación. Los resultados destacan la importancia de analizar la equivalencia entre los modelos para complementar las explicaciones obtenidas a través de los dos enfoques”, puntualiza el investigador.

El académico señala que esperan seguir trabajando en esta línea, “gracias a este trabajo me di cuenta de que hay posibilidades de explotar otros métodos de explicación de predicciones. En esta línea pronto someteré un segundo artículo que es una extensión del actual”, finaliza Salas.

La investigación fue publicada en “Expert Systems with Applications”, revista internacional que se centra en el intercambio de información relacionada con los sistemas expertos e inteligentes aplicados en la industria, la administración y las universidades de todo el mundo, cuenta con un factor de impacto de 6.95 y un CiteScore de 12.7 siendo muy bien evaluada en el área.

Más información en: https://doi.org/10.1016/j.eswa.2021.116253

Por Celeste Burgos Badal
Comunicacion