PROYECTO (2023-2026) F030 – Inteligencia de Datos. Técnicas y Modelos de Machine Learning

Director: Dr. Waldo Hasperué

Codirectora: Dra. Laura Lanzarini

Cabe hacer notar que el proyecto planteado actúa de manera coordinada con otro proyecto presentado a esta convocatoria por el III-LIDI, en temas de Arquitecturas Multiprocesador y Sistemas Distribuidos.

Objetivos generales

Estudiar, adaptar y desarrollar técnicas y algoritmos de aprendizaje automático para dispositivos limitados en recursos de hardware.
Estudiar, adaptar y proponer métricas que puedan aplicarse en algoritmos y dispositivos asociados al TinyML.
Estudiar y desarrollar algoritmos para la extracción de características en flujos de datos.
Analizar y diseñar nuevas técnicas capaces de identificar la deriva de concepto en flujos de datos.
Diseñar modelos descriptivos para flujos de datos.
Desarrollar técnicas de metaheurísticas poblacionales para la asistencia de selección de características en entornos Big Data.
Diseñar y analizar nuevas arquitecturas de aprendizaje automático y sistemas inteligentes, con énfasis en las Redes Neuronales.
Proponer y mejorar modelos y sistemas basados en redes neuronales para las áreas de la astronomía, lengua de señas y salud.

Objetivos específicos

Estudiar y seguir el estado del arte de la adaptación de algoritmos de aprendizaje automático y redes neuronales para su ejecución en microcontroladores con importantes limitaciones de hardware.
Analizar Hardware de diferentes características de cómputo para la ejecución de algoritmos de aprendizaje automático.
Analizar software (principalmente de código abierto) disponible para el desarrollo de aplicaciones de aprendizaje automático para microcontroladores.
Proponer métricas y medir el rendimiento de algoritmos, bibliotecas, frameworks y microcontroladores.
Estudiar y proponer optimizaciones de algoritmos TinyML en función de la arquitectura de distintos microcontroladores.
Generar modelos y aplicaciones que pongan de manifiesto el potencial del uso del aprendizaje automático en dispositivos con limitaciones de hardware.
Adaptar y proponer mejoras de algoritmos de aprendizaje automático a dispositivos TinyML.
Aplicar los conocimientos adquiridos para el desarrollo de un framework que facilite el desarrollo de aplicaciones TinyML.
Desarrollar técnicas adecuadas para la extracción de características de series temporales correspondientes a diferentes estados del funcionamiento de máquinas industriales.
Desarrollar métricas para identificar la deriva de concepto en flujos de datos.
Diseñar y analizar modelos para el mantenimiento predictivo de máquinas industriales.
Estudiar y analizar distintas representaciones de trayectorias vehiculares.
Estudiar y diseñar técnicas de clustering dinámico aplicables a trayectorias vehiculares.
Proponer mecanismos de interpretación de los modelos obtenidos mediante la visualización de mapas dinámicos para la detección de situaciones anómalas.
Desarrollar métricas de interpretabilidad para redes neuronales, haciendo foco en las propiedades de invarianza y auto-equivarianza.
Utilizar las métricas para analizar modelos y añadir a su interpretabilidad.
Proponer y analizar modelos para el reconocimiento de Lengua de Señas en video.
Proponer y analizar modelos de redes generativas para la creación de datos artificiales en la Lengua de Señas.
Generar una base de datos para la traducción de la Lengua de Señas Argentina a texto en español.
Desarrollar un sistema de detección de estrellas, con particular énfasis en estrellas Be, generalizable a distintos conjuntos de datos.
Desarrollar un sistema automático de recortes de espectros estelares.
Entrenar, evaluar e implementar modelos de predicción de diabetes y prediabetes.
Estudiar y analizar técnicas metaheurísticas poblacionales para trabajar de manera conjunta con técnicas de selección de características.
Estudiar técnicas de reducción de dimensionalidad a partir de técnicas de selección de características.
Estudiar y seguir el estado del arte de modelos de Machine Learning aplicados al análisis de supervivencia.
Implementar algoritmos que ejecuten las metaheurísticas y técnicas de selección de características en un entorno distribuido.
Implementar mecanismos de balance de carga para las herramientas existentes o en desarrollo a fin de optimizar la reducción de dimensionalidad y acelerar el descubrimiento de gene signatures.
Publicar bajo licencias de código abierto los algoritmos y herramientas desarrolladas.

Líneas de Estudio/Investigación y Desarrollo

Adaptación de algoritmos de aprendizaje automático tradicional a dispositivos con restricciones de hardware.
Estudio de hardware y software para TinyML.
Análisis y desarrollo de modelos para TinyML.
Análisis y desarrollo de métricas de rendimiento y eficiencia de algoritmos para TinyML.
Mejora del proceso de mantenimiento de máquinas industriales a partir del análisis de flujos de datos correspondiente a su funcionamiento.
Modelización de trayectorias espacio-temporales con capacidad para establecer características comunes y detectar situaciones anómalas.
Estudio de técnicas de clustering dinámico basadas en densidad para modelar trayectorias GPS e identificar sectores de posible congestionamiento.
Estudio de técnicas de selección de características.
Estudio de metaheurísticas poblacionales.
Obtención de métricas que permitan predecir tiempos de ejecución en la obtención de modelos de clasificación.
Desarrollo de un framework de propósito general para la ejecución de algoritmos de metaheurísticas poblacionales en un entorno distribuído.
Redes neuronales profundas, convolucionales y recurrentes.
Invarianza y auto-equivarianza en redes neuronales.
Traducción de lengua de señas.
Generación de imágenes con GANs y otros modelos generativos.
Análisis de datos astronómicos.
Identificación de Personas con Riesgo de Diabetes y Prediabetes.

Productos y/o Resultados finales esperados

Creación de una Base de datos de gran tamaño para traducción de Lengua de Señas Argentina.
Sistema de asistencia a la digitalización de placas espectroscópicas, con un detector inteligente de espectros estelares.
Diseño de modelos de traducción de gestos/señas.
Generación modelos de clasificación de estrellas con información fotométrica.
Implementación de un sistema recomendador para detección de diabetes y prediabetes.
Diseño de métricas de Invarianza y auto-equivarianza en redes neuronales.
Adaptación de algoritmos de aprendizaje automático para TinyML.
Desarrollo de una biblioteca con algoritmos de inferencia de aprendizaje automático para dispositivos con limitaciones de hardware.
Desarrollo de un framework de aprendizaje automático para TinyML.
Diseño y adaptación de modelos para TinyML.
Diseño de métricas de rendimiento de software y hardware para TinyML.
Medición de performance de técnicas de selección de características.
Desarrollo de metaheurísticas poblacionales para ser ejecutadas en entornos Big Data.
Diseño de métricas que permitan predecir tiempos de ejecución en la obtención de modelos de clasificación.
Desarrollo de un framework de propósito general para la ejecución de algoritmos de metaheurísticas poblacionales.