Área de Investigación

Visión Computacional

La Visión Computacional se ocupa del desarrollo de modelos y métodos que permiten a los sistemas artificiales interpretar y analizar información visual, como imágenes y videos. En las últimas décadas, el aprendizaje profundo ha transformado este campo, habilitando avances significativos en tareas como clasificación, segmentación y detección de estructuras complejas, y consolidando a la visión computacional como un componente central de múltiples aplicaciones científicas y tecnológicas.

En el LIAA, la investigación en Visión Computacional se enfoca en problemas fundamentales y aplicados, con un énfasis particular en imágenes médicas y biomédicas, donde los modelos visuales interactúan con decisiones críticas en contextos reales. Estas aplicaciones plantean desafíos específicos que van más allá de la precisión promedio, como la necesidad de modelos confiables, interpretables, bien calibrados y justos frente a distintas poblaciones.

Las principales líneas de investigación en Visión Computacional incluyen:

  • Análisis de imágenes médicas mediante aprendizaje profundo: Desarrollo de modelos de visión computacional para tareas de clasificación, segmentación, registración y detección en imágenes médicas como radiografías, tomografías computadas y resonancias magnéticas. Se estudian arquitecturas profundas y estrategias de entrenamiento que permitan trabajar con datos ruidosos, anotaciones incompletas o a gran escala, con énfasis en la reproducibilidad y la validación rigurosa.
  • Modelado y calibración de incertidumbre en visión computacional: Investigación de métodos para estimar la incertidumbre de las predicciones de modelos visuales. Se analizan propiedades como la calibración y la utilidad de la incertidumbre para detectar casos difíciles, datos fuera de distribución y escenarios clínicos de alto riesgo.
  • Sesgos, equidad y evaluación en modelos visuales: Estudio de sesgos sistemáticos en modelos de visión computacional, particularmente en imágenes médicas, y de cómo estos se manifiestan en diferencias de desempeño entre subpoblaciones. Se desarrollan métricas y protocolos de evaluación que permiten caracterizar desigualdades, así como estrategias para su mitigación, enmarcando estos problemas dentro de sistemas sociotécnicos complejos.
  • Generalización y robustez fuera de distribución:  Análisis del comportamiento de modelos visuales frente a cambios en el dominio, variaciones en la adquisición de datos y condiciones no vistas durante el entrenamiento. Esta línea busca comprender los límites de la generalización y desarrollar modelos más robustos y confiables para su uso en entornos reales.
  • Datasets, benchmarks y evaluación reproducible: Diseño y liberación de conjuntos de datos y benchmarks para visión computacional en diversos contextos, incluyendo anotaciones estructurales y estimaciones de incertidumbre. El objetivo es facilitar la comparación justa entre modelos y promover prácticas de evaluación transparentes y reproducibles.
  • Visión computacional y modelos multimodales: Integración de información visual y textual mediante modelos multimodales, explorando cómo la combinación de imágenes y lenguaje puede mejorar la interpretación, explicación y evaluación de sistemas automáticos, especialmente en aplicaciones clínicas.