Durante la semana del 23 al 27 de abril, el LIAA estuvo presente en ICLR 2026 (International Conference on Learning Representations), una de las conferencias más importantes sobre inteligencia artificial a nivel mundial, celebrada este año en Río de Janeiro, Brasil. Becarios del laboratorio asistieron de forma presencial y presentaron en total cuatro trabajos, entre la conferencia principal y workshops temáticos.

Eitan Sprejer, becario del programa AISAR (AI Safety Argentina) del LIAA, presentó en el workshop CAO (Catch, Adapt, and Operate: Monitoring ML Models Under Drift) el trabajo “White-Box Monitoring for Personality Mirroring in Conversational AI“, en colaboración con Agustín E. Martínez-Suñé y Bruno Bianchi.
Resumen:
Los asistentes de inteligencia artificial conversacionales, como ChatGPT o Gemini, tienden a adaptar su forma de hablar al usuario que tienen del otro lado: pueden volverse más formales, más sarcásticos o más afectuosos según con quién charlen. En este trabajo, los autores desarrollaron un método para detectar y medir ese fenómeno mirando “por dentro” del modelo, analizando directamente sus representaciones internas en lugar de solamente el texto que produce. Aplicado al modelo Gemma-2-27B de Google sobre 2.940 conversaciones simuladas, encontraron que el modelo imita de forma espontánea los rasgos de personalidad del usuario, incluso sin que nadie le pida hacerlo. El tema de conversación también influye: por ejemplo, en escritura creativa el modelo adopta un tono más irreverente y libre, mientras que en temas de política se vuelve más cauto y diplomático. La herramienta aporta una forma de auditar cómo se comportan estos sistemas en interacción real, algo importante para su uso seguro y confiable.
En la conferencia principal, Manuel Fernández Burda presentó “Kaleidoscope: In-language Exams for Massively Multilingual Vision Evaluation”, un benchmark multimodal y multilingüe que evalúa modelos de visión-lenguaje (VLMs) sobre exámenes reales en 18 idiomas, 14 materias y 20.911 preguntas. El trabajo (ya cubierto previamente en esta nota del LIAA) fue una colaboración entre el LIAA, Cohere Labs y la University of Copenhagen, y muestra que incluso los modelos comerciales más avanzados tienen dificultades significativas con idiomas de bajos recursos.

En el GEM Workshop (Generative and Experimental Perspectives for Biomolecular Design), Manuel presentó su tesis de Maestría: “Inference-Time Toxicity Mitigation in Protein Language Models via Logit-Diff Amplification“. El trabajo muestra que el fine-tuning de modelos de lenguaje de proteínas sobre grupos taxonómicos específicos puede inducir, de manera no intencional, la generación de secuencias tóxicas (entre el 10% y el 65% de las generaciones, partiendo de niveles cercanos a cero). Como mitigación, se propone una técnica de seguridad aplicable en tiempo de inferencia, sin necesidad de re-entrenar el modelo y preservando la plausibilidad biológica de las secuencias generadas. El trabajo se realizó bajo la dirección de Enzo Ferrante e Iván Arcuschín Moreno.
En el LMRL Workshop (Learning Meaningful Representations of Life), Manuel presentó “On the Robustness of scRNA-seq Foundation Models for Plants Under Cross-Domain Experimental Shift”, en colaboración con Rodrigo Bonazzola, Georgina Stegmayer, Diego H. Milone y Enzo Ferrante. El trabajo introduce scAraFM, un foundation model específico para Arabidopsis thaliana, y demuestra que los protocolos de evaluación habituales basados en splits aleatorios pueden sobreestimar el rendimiento en clasificación de respuesta a estrés en 20 a 30 puntos de AUROC, en comparación con esquemas más estrictos de validación cruzada entre experimentos.
Enlaces
- ICLR 2026: Sitio oficial de la conferencia
- White-Box Monitoring for Personality Mirroring: OpenReview · Código · Dataset
- Kaleidoscope: arXiv
- Inference Time Toxicity Mitigation in Protein Language Models via Logit Diff Ampliffication: Inference-Time Toxicity Mitigation in Protein Language Models
Agradecimientos
El trabajo presentado por Eitan Sprejer fue desarrollado en el marco del programa de becas AISAR (AI Safety Argentina) del LIAA, con agradecimiento especial a Christina Lu por el acceso a los vectores PCA de espacio de rasgos y por las discusiones a lo largo del proyecto.
El trabajo presentado por Manuel Fernández Burda en GEM Workshop fue desarrollado gracias al programa de becas AISAR (AI Safety Argentina) del LIAA.