Métodos, retos, y herramientas para la Inteligencia Artificial Explicable

Coordinador(a): EMILIO SERRANO FERNANDEZ
Co-coordinador(a): JAVIER BAJO PEREZ

Centro: E.T.S. DE INGENIEROS INFORMÁTICOS

Nivel: Nivel 2. Proyectos promovidos por otros colectivos de profesores de la UPM

Código: IE1920.1003
memoria >> prorrogado 2021

Línea: E3. Aprendizaje Basado en Retos - Design Thinking

Aprendizaje Activo
Aprendizaje Basado en Retos
Aprendizaje Experiencial
Big Data
Competencias transversales
Evaluación del aprendizaje

Nombre y apellidos	Centro	Plaza *
DAMIANO ZANARDINI	E.T.S. DE INGENIEROS INFORMÁTICOS	TITULAR UNIVERSIDAD
JAVIER BAJO PEREZ	E.T.S. DE INGENIEROS INFORMÁTICOS	CATEDRÁTICO UNIVERSIDAD
EMILIO SERRANO FERNANDEZ	E.T.S. DE INGENIEROS INFORMÁTICOS	L.D. PRF.AYUD.DOCTOR

* La plaza que se muestra corresponde a la ocupada en el momento de la convocatoria
(para PDI/PAS de la UPM, en el resto de casos no se especifica).

El Aprendizaje Basado en Retos (ABR) es un método docente con sus orígenes en la compañía Apple, Inc. que está ganando creciente popularidad en universidades y empresas alrededor del mundo. ABR ofrece un marco de trabajo efectivo y eficiente para aprender cómo abordar retos y cómo crear soluciones sostenibles. En este proyecto de innovación educativa se explorará el ABR para la docencia en Ciencia de Datos (CD) e Inteligencia Artificial Explicable (IAE).

La Ciencia de Datos o Data Science es un campo interdisciplinar que se encarga de la extracción del conocimiento a partir de datos en bruto. Esta disciplina se ha convertido en una revolución que ha cambiado la forma de hacer negocios, la sanidad, la política, la educación y la biología. La CD se solapa con el aprendizaje automático (machine learning) y el aprendizaje profundo (deep learning), todas ellas incluidas en la Inteligencia Artificial (IA). Sin embargo, existe una preocupación creciente por la incapacidad de algunos de los modelos más exitosos en inteligencia artificial de generar buenas explicaciones sobre sus decisiones.

La IA explicable se basa en el uso de sistemas cuyas decisiones sean fácilmente entendibles por los seres humanos. Es decir, utilizar sistemas interpretables en lugar de cajas negras. Así mismo, la IAE se preocupa también por el desarrollo de modelos con otras propiedades importantes, tales como fidelidad, parsimonia, consistencia, que tengan sentido en el dominio de aplicación, que sean generalizables y que sean confiables.

Ante este complejo problema, la IA del siglo XXI revisa sistemas clásicos como Mycin, un sistema de razonamiento con incertidumbre de los años 70 capaz de diagnosticar enfermedades infecciosas de la sangre. Para ello, emplea una base de conocimiento de unas 600 reglas y es capaz de devolver a los usuarios las reglas utilizadas para la predicción a modo de explicación. Tecnologías bien establecidas en la IA como son los sistemas expertos y el razonamiento basado en casos rara vez aparecen en la literatura actual especializada y en la docencia de Ciencia de Datos. Sin embargo, su aplicación y combinación con otros métodos de Aprendizaje Automático pueden dotar a la IA más actual de la capacidad de explicar sus acciones.

Tras la ejecución del proyecto de innovación educativa “Aprendizaje basado en retos para la Biología Computacional y la Ciencia de Datos” en el curso académico 2017/2018; se plantea este nuevo proyecto que se ejecutará en el mismo contexto: la asignatura de “Knowledge representation and acquisition” en el “Máster Universitario en Biología Computacional” organizado por la ETS de Ingenieros Informáticos y la ETS de Ingeniería Agronómica, Alimentaria y de Biosistemas.

La Biología computacional emplea la ciencia de la computación y las tecnologías de la información para el modelado de procesos biológicos o el análisis de datos biológicos. En un reto de Biología Computacional, como por ejemplo identificar los micro ARNs (ácido ribonucleico) relacionados con el cáncer de cuello uterino, no basta predecir con éxito y encontrar altos porcentajes de correlación, sino que la IA debe dar explicaciones de sus hallazgos.

Se propone en este proyecto de innovación educativa la exploración del ABR en Ciencia de Datos e Inteligencia Artificial Explicable en torno a tres líneas principales de actuación: (1) métodos para el ABR de CD e IAE; (2) retos específicos para la CD y la IAE en el Máster en Biología Computacional; (3) herramientas para dar soporte a este aprendizaje combinando distintas ramas de la IA como son el aprendizaje automático, los sistemas expertos, y el razonamiento basado en casos.

El perfil de los estudiantes del Máster Universitario en Biología Computacional es multidisciplinar, perteneciendo parte de ellos al mundo de la biología y parte de ellos a ramas de las tecnologías de la información. La ciencia de datos, la inteligencia artificial explicable, y el ABR; ofrecen un marco excepcional para que se establezcan sinergias entre estos perfiles, combinando la experiencia en campos como la programación y en el dominio concreto del reto. Los estudiantes, además, tendrán la oportunidad de aplicar a casos reales y desafiantes el conocimiento adquirido en otras asignaturas del máster como “Statistical Analysis and Data Visualization” y “Machine Learning”. Los resultados de este proyecto serán directamente aplicables a otras asignaturas del máster, de otros másters como el “Master in Data Science (EIT Digital Master School)”, y también en asignaturas de grado como “Minería de Datos”, perteneciente al “Grado en Ingeniería Informática”.

Dentro del proyecto, los estudiantes se embarcarán en un reto realista y, en base a la actualización del framework de ABR propuesto por Nichols et al. (2016), los estudiantes aprenderán siguiendo tres fases principales: involucrarse, investigar, y actuar

Este proyecto tiene tres objetivos fundamentales:

O1. Desarrollo de métodos para el aprendizaje basado en retos (ABR) de Ciencia de Datos e Inteligencia Artificial Explicable. Este objetivo comprende la instanciación de metodologías y frameworks generales de ABR al campo específico a tratar. Destacan entre estos marcos, la actualización de 2016 para el framework de ABR propuesto por Apple Inc.; y el informe de "Aprendizaje Basado en Retos" de 2015 realizado por el instituto Tecnológico y de Estudios Superiores de Monterrey. Este objetivo continúa la línea del proyecto anterior “Aprendizaje basado en retos para la Biología Computacional y la Ciencia de Datos” en el curso académico 2017/2018, pero explorando otras ramas de la IA con capacidades explicativas, como los sistemas expertos y el razonamiento basado en casos. Además, se actualizarán los métodos del ABR para el aprendizaje automático con las novedades de este campo tan puntero como cambiante.

O2. Estudio de retos concretos en el campo de la Ciencia de Datos y la Inteligencia Artificial Explicable. Aplicación de la instanciación de los métodos explorados o ampliados la Ciencia de datos y la Inteligencia Artificial Explicable en O1; para la selección de retos concretos y para un perfil de estudiantes concreto. Este objetivo continúa la línea del proyecto anterior “Aprendizaje basado en retos para la Biología Computacional y la Ciencia de Datos” en el curso académico 2017/2018 donde se definieron 15 retos específicos para la Biología Computacional, enfatizando el uso del aprendizaje automático como principal herramienta predictiva. En este nuevo proyecto, se diseñarán retos que requieran de la IA que aporte explicaciones, utilizando tecnologías como los sistemas expertos y el razonamiento basado en casos.

O3. Implementación, integración y documentación de herramientas para el soporte del ABR en Ciencia de Datos y la Inteligencia Artificial Explicable. Este objetivo comprende el análisis y documentación de herramientas disponibles para dar soporte al ABR en la asignatura concreta. Existe una plétora de herramientas de Ciencia de Datos que se adaptan bien al perfil de los estudiantes por no requerir conocimientos avanzados de programación, como Weka o RapidMiner. Sin embargo, todavía no se han encontrado herramientas que permitan modificar, combinar, o utilizar los modelos de aprendizaje automático desde sistemas expertos o razonadores basados en casos de manera intuitiva. Si bien se favorecerá el uso e integración de software libre existente, este objetivo puede requerir la implementación de nuevo software a medida para el proyecto.

Gracias a la aplicación del ABR, se espera una mejora de la calidad que se podrá reflejar en:

Una comprensión más profunda de la Ciencia de Datos y la Inteligencia Artificial Explicable, permitiendo diagnosticar y analizar problemas antes de proponer soluciones.
Un mayor compromiso al involucrar al estudiante tanto en la definición del problema a ser abordado, como en la solución que desarrollarán para resolverlo.
Desarrollo de habilidades para investigar, crear modelos, materializarlos, trabajar colaborativa y multidisciplinariamente.
Un mayor acercamiento a la realidad de su profesión, estableciendo relaciones con expertos que contribuye a su crecimiento profesional.
Fortalecimiento de la conexión entre lo que aprenden en el Máster y lo que perciben del mundo profesional.
Desarrollo de habilidades de comunicación de alto nivel, a través del uso de herramientas sociales y técnicas de producción de medios, para crear y compartir las soluciones desarrolladas por ellos mismos.

Titulación/es Grado:
Titulación/es Máster:	MASTER UNIVERSITARIO EN BIOLOGIA COMPUTACIONAL
Nº de Asignatura/s:	1
Centro/s de la UPM:

Se consideran las siguientes tres grandes tareas, con una clara correspondencia con los tres objetivos ya mencionados:

T1. Desarrollo de métodos para el aprendizaje basado en retos de Ciencia de Datos y la Inteligencia Artificial Explicable.
T2. Analizar y seleccionar retos concretos en el campo de la Ciencia de Datos y la Inteligencia Artificial Explicable.
T3. Implementar, integrar y documentar herramientas para el soporte del ABR en Ciencia de Datos y la Inteligencia Artificial Explicable.

También se considera, como especifica la convocatoria, el comienzo del proyecto en febrero de 2020, y la finalización el 15 de noviembre de 2020 o antes, existiendo, por tanto 9 meses de ejecución, numerados de M1 a M9.

En un enfoque iterativo e incremental como el de la metodología Scrum, se plantea el siguiente cronograma que permite dar tres iteraciones a cada tarea de manera que los resultados preliminares de cada una de ellas sirvan para realimentar las siguientes fases del proyecto:

M1 T1 primera iteración
M2 T2 primera iteración
M3 T3 primera iteración
M4 T1 segunda iteración
M5 T2 segunda iteración
M6 T3 segunda iteración
M7 T1 tercera iteración
M8 T2 tercera iteración
M9 T3 tercera iteración

Fundamentalmente se utilizarán:

Repositorios científicos disponibles en la UPM como ScienceDirect.
La Plataforma Institucional de Telenseñanza de la UPM (Moodle).
Sitios webs de repositorios de datos y concursos en Ciencia de Datos como Kaggle.
Recursos informáticos del Departamento de Inteligencia Artificial como servidores web.

La Evaluación del proyecto se realizará por medio de la generación de un e-portafolio por parte de los estudiantes de la asignatura. El e-portafolio es una colección digital de evidencias, que incluye demostraciones, recursos, y logros obtenidos por los estudiantes. De acuerdo al framework de ABR propuesto por Apple Inc., se valorarán los siguientes apartados:

Informe de las grandes ideas a investigar.
La propuesta del reto, la pregunta esencial a responder y la motivación sobre lo significativo del reto.
Cuestiones guía, preguntas que guiarán la búsqueda de una solución.
Plan de aprendizaje y cronograma.
Informe de investigación, en formato Jupyter notebook, o alternativa, para asegurar la reproducibilidad y repetibilidad de los resultados alcanzados.
Solución propuesta, presentación incluyendo prototipos, conceptos, y el feedback de expertos.
Implementación y planes de evaluación.
Resultados de Evaluación.
Presentaciones finales.
Diarios con experiencia personal y de grupo.
Reflexiones finales sobre lo aprendido.

Se elaborarán los siguientes entregables.

E1. Informe sobre métodos para el ABR en Ciencia de Datos e Inteligencia Artificial Explicable.
E2. Informe sobre el análisis y selección de retos adecuados para el aprendizaje de Ciencia de Datos e Inteligencia Artificial Explicable.
E3. Manual de herramientas para el soporte al ABR en la Ciencia de Datos e Inteligencia Artificial Explicable.
E4. Informe sobre la evaluación de los resultados basándose en e-portafolio creado por estudiantes.
E5. Artículo de revista o conferencia para la divulgación de resultados.

Como se describió en la sección de alcance, estos entregables tienen una aplicación directa en otras asignaturas del máster para el que se propone, otros masters, y otros grados. También puede suponer una ventaja competitiva en la organización de MOOCs, al presentar una filosofía pedagógica distinta a alternativas como los cursos de Ciencia de Datos que ofrece la universidad de Stanford o la universidad Johns Hopkins.

Los principales materiales divulgativos generados serán:

E3. Manual de herramientas para el soporte al ABR en la Ciencia de Datos e Inteligencia Artificial Explicable.
E4. Informe sobre la evaluación de los resultados basándose en e-portafolio creado por estudiantes.
E5. Artículo de revista o conferencia para la divulgación de resultados.

También se considerará:

la construcción de una web que recoja todos los entregables,
noticias para la difusión en la UPM,
entradas de microblogging (Twitter) en el departamento y la escuela,
entrevistas radiofónicas para divulgación de la innovación educativa.

Se consultará con frecuencia al Gabinete de Tele-Educación (GATE) para buscar soluciones software ya integradas con la Plataforma Institucional de Telenseñanza de la UPM (Moodle) que permitan dar soporte al espacio colaborativo requerido para el aprendizaje basado en retos. También se consultará a GATE las posibilidades de integración de las herramientas y resultados de este proyecto de innovación con Moodle.

Ficha Proyecto I.E. 2019-2020

Métodos, retos, y herramientas para la Inteligencia Artificial Explicable