Logo 34 años
Logo Info UNLP Logo CIC

PROYECTO (2023-2026) F030 – Inteligencia de Datos. Técnicas y Modelos de Machine Learning

Director: Dr. Waldo Hasperué

Codirectora: Dra. Laura Lanzarini

Cabe hacer notar que el proyecto planteado actúa de manera coordinada con otro proyecto presentado a esta convocatoria por el III-LIDI, en temas de Arquitecturas Multiprocesador y Sistemas Distribuidos.

Objetivos generales

  • Estudiar, adaptar y desarrollar técnicas y algoritmos de aprendizaje automático para dispositivos limitados en recursos de hardware.
  • Estudiar, adaptar y proponer métricas que puedan aplicarse en algoritmos y dispositivos asociados al TinyML.
  • Estudiar y desarrollar algoritmos para la extracción de características en flujos de datos.
  • Analizar y diseñar nuevas técnicas capaces de identificar la deriva de concepto en flujos de datos.
  • Diseñar modelos descriptivos para flujos de datos.
  • Desarrollar técnicas de metaheurísticas poblacionales para la asistencia de selección de características en entornos Big Data.
  • Diseñar y analizar nuevas arquitecturas de aprendizaje automático y sistemas inteligentes, con énfasis en las Redes Neuronales.
  • Proponer y mejorar modelos y sistemas basados en redes neuronales para las áreas de la astronomía, lengua de señas y salud.

 

Objetivos específicos

  • Estudiar y seguir el estado del arte de la adaptación de algoritmos de aprendizaje automático y redes neuronales para su ejecución en microcontroladores con importantes limitaciones de hardware.
  • Analizar Hardware de diferentes características de cómputo para la ejecución de algoritmos de aprendizaje automático.
  • Analizar software (principalmente de código abierto) disponible para el desarrollo de aplicaciones de aprendizaje automático para microcontroladores.
  • Proponer métricas y medir el rendimiento de algoritmos, bibliotecas, frameworks y microcontroladores.
  • Estudiar y proponer optimizaciones de algoritmos TinyML en función de la arquitectura de distintos microcontroladores.
  • Generar modelos y aplicaciones que pongan de manifiesto el potencial del uso del aprendizaje automático en dispositivos con limitaciones de hardware.
  • Adaptar y proponer mejoras de algoritmos de aprendizaje automático a dispositivos TinyML.
  • Aplicar los conocimientos adquiridos para el desarrollo de un framework que facilite el desarrollo de aplicaciones TinyML.
  • Desarrollar técnicas adecuadas para la extracción de características de series temporales correspondientes a diferentes estados del funcionamiento de máquinas industriales.
  • Desarrollar métricas para identificar la deriva de concepto en flujos de datos.
  • Diseñar y analizar modelos para el mantenimiento predictivo de máquinas industriales.
  • Estudiar y analizar distintas representaciones de trayectorias vehiculares.
  • Estudiar y diseñar técnicas de clustering dinámico aplicables a trayectorias vehiculares.
  • Proponer mecanismos de interpretación de los modelos obtenidos mediante la visualización de mapas dinámicos para la detección de situaciones anómalas.
  • Desarrollar métricas de interpretabilidad para redes neuronales, haciendo foco en las propiedades de invarianza y auto-equivarianza.
  • Utilizar las métricas para analizar modelos y añadir a su interpretabilidad.
  • Proponer y analizar modelos para el reconocimiento de Lengua de Señas en video.
  • Proponer y analizar modelos de redes generativas para la creación de datos artificiales en la Lengua de Señas.
  • Generar una base de datos para la traducción de la Lengua de Señas Argentina a texto en español.
  • Desarrollar un sistema de detección de estrellas, con particular énfasis en estrellas Be, generalizable a distintos conjuntos de datos.
  • Desarrollar un sistema automático de recortes de espectros estelares.
  • Entrenar, evaluar e implementar modelos de predicción de diabetes y prediabetes.
  • Estudiar y analizar técnicas metaheurísticas poblacionales para trabajar de manera conjunta con técnicas de selección de características.
  • Estudiar técnicas de reducción de dimensionalidad a partir de técnicas de selección de características.
  • Estudiar y seguir el estado del arte de modelos de Machine Learning aplicados al análisis de supervivencia.
  • Implementar algoritmos que ejecuten las metaheurísticas y técnicas de selección de características en un entorno distribuido.
  • Implementar mecanismos de balance de carga para las herramientas existentes o en desarrollo a fin de optimizar la reducción de dimensionalidad y acelerar el descubrimiento de gene signatures.
  • Publicar bajo licencias de código abierto los algoritmos y herramientas desarrolladas.

 

Líneas de Estudio/Investigación y Desarrollo

  • Adaptación de algoritmos de aprendizaje automático tradicional a dispositivos con restricciones de hardware.
  • Estudio de hardware y software para TinyML.
  • Análisis y desarrollo de modelos para TinyML.
  • Análisis y desarrollo de métricas de rendimiento y eficiencia de algoritmos para TinyML.
  • Mejora del proceso de mantenimiento de máquinas industriales a partir del análisis de flujos de datos correspondiente a su funcionamiento.
  • Modelización de trayectorias espacio-temporales con capacidad para establecer características comunes y detectar situaciones anómalas.
  • Estudio de técnicas de clustering dinámico basadas en densidad para modelar trayectorias GPS e identificar sectores de posible congestionamiento.
  • Estudio de técnicas de selección de características.
  • Estudio de metaheurísticas poblacionales.
  • Obtención de métricas que permitan predecir tiempos de ejecución en la obtención de modelos de clasificación.
  • Desarrollo de un framework de propósito general para la ejecución de algoritmos de metaheurísticas poblacionales en un entorno distribuído.
  • Redes neuronales profundas, convolucionales y recurrentes.
  • Invarianza y auto-equivarianza en redes neuronales.
  • Traducción de lengua de señas.
  • Generación de imágenes con GANs y otros modelos generativos.
  • Análisis de datos astronómicos.
  • Identificación de Personas con Riesgo de Diabetes y Prediabetes.

 

Productos y/o Resultados finales esperados

  • Creación de una Base de datos de gran tamaño para traducción de Lengua de Señas Argentina.
  • Sistema de asistencia a la digitalización de placas espectroscópicas, con un detector inteligente de espectros estelares.
  • Diseño de modelos de traducción de gestos/señas.
  • Generación modelos de clasificación de estrellas con información fotométrica.
  • Implementación de un sistema recomendador para detección de diabetes y prediabetes.
  • Diseño de métricas de Invarianza y auto-equivarianza en redes neuronales.
  • Adaptación de algoritmos de aprendizaje automático para TinyML.
  • Desarrollo de una biblioteca con algoritmos de inferencia de aprendizaje automático para dispositivos con limitaciones de hardware.
  • Desarrollo de un framework de aprendizaje automático para TinyML.
  • Diseño y adaptación de modelos para TinyML.
  • Diseño de métricas de rendimiento de software y hardware para TinyML.
  • Medición de performance de técnicas de selección de características.
  • Desarrollo de metaheurísticas poblacionales para ser ejecutadas en entornos Big Data.
  • Diseño de métricas que permitan predecir tiempos de ejecución en la obtención de modelos de clasificación.
  • Desarrollo de un framework de propósito general para la ejecución de algoritmos de metaheurísticas poblacionales.