24/06/2026
Etiquetas populares
p

Académicos de Ingeniería Estadística UdeC proponen nueva variante de algoritmo para detectar patrones en conjuntos de datos mixtos

Los académicos del Departamento de Ingeniería Estadística de la Universidad de Concepción, Dr. Patricio Salas y Dr. Patricio Sáez, desarrollaron GowerSOM, un paquete para el lenguaje de programación R que permite aplicar mapas auto-organizados (Self-Organizing Maps, SOM) en conjuntos de datos con atributos mixtos. La herramienta fue publicada recientemente en CRAN, el repositorio internacional oficial de paquetes del software estadístico R.

Este desarrollo surge a partir de un trabajo teórico-práctico publicado recientemente en la revista científica Journal of Data Science and Analytics, donde se presenta la propuesta metodológica que dio origen a GowerSOM.

El desarrollo busca resolver una limitación frecuente en el análisis de datos, ya que muchos métodos tradicionales funcionan principalmente con variables numéricas, mientras que en la práctica los datos suelen combinar variables numéricas, categóricas y binarias.

“Muchos algoritmos de análisis de datos funcionan bien cuando todas las variables son numéricas, pero en la práctica los datos reales suelen ser mixtos. GowerSOM surge precisamente para abordar este problema”, explicó el Dr. Patricio Salas.

El método utiliza la distancia de Gower para analizar datos de distinta naturaleza y permite representar grandes conjuntos de información en mapas visuales que facilitan la identificación de patrones y relaciones entre variables. Todo lo anterior combinado con métodos heurísticos.

“Las tablas de datos pueden ser difíciles de interpretar cuando tienen muchas variables. Un Self-Organizing Map transforma esa información en un mapa bidimensional donde observaciones similares quedan cerca entre sí, lo que facilita el análisis y la visualización”, señaló el Dr. Patricio Sáez.

Actualmente, estudiantes de la carrera ya están utilizando este enfoque en sus proyectos, explorando aplicaciones como imputación de datos, detección de outliers y análisis exploratorio de datos complejos, lo que demuestra el impacto formativo de este desarrollo en la comunidad estudiantil.

Tras su publicación en CRAN, los investigadores esperan continuar ampliando las aplicaciones del método en distintas áreas donde se analizan datos de naturaleza mixta, fortaleciendo así el aporte del Departamento de Estadística UdeC al desarrollo de herramientas para la ciencia de datos y el análisis estadístico.