Información Proyectos I.E.



Aprendizaje basado en retos para la Biología Computacional y la Ciencia de Datos

Coordinador(a): EMILIO SERRANO FERNANDEZ
Centro: E.T.S. DE INGENIEROS INFORMÁTICOS
Nivel: Nivel 2. Proyectos promovidos por otros colectivos de profesores de la UPM
Código: IE1718.1003
Línea: E4. Aprendizaje Basado en Retos
Palabras clave:
  • Aprendizaje Activo
  • Aprendizaje Basado en Retos (ABR)
  • Big Data
  • Lengua inglesa
  • Máster
Miembros de la comunidad UPM que lo componen
Nombre y apellidos Centro Plaza Email
MARTIN MOLINA GONZALEZ E.T.S. DE INGENIEROS INFORMÁTICOS CATEDRÁTICO UNIVERSIDAD martin.molina[at]upm[dot]es
DANIEL MANRIQUE GAMO E.T.S. DE INGENIEROS INFORMÁTICOS TITULAR UNIVERSIDAD daniel.manrique[at]upm[dot]es
JAVIER BAJO PEREZ E.T.S. DE INGENIEROS INFORMÁTICOS TITULAR UNIVERSIDAD javier.bajo[at]upm[dot]es
EMILIO SERRANO FERNANDEZ E.T.S. DE INGENIEROS INFORMÁTICOS L.D. PRF.AYUD.DOCTOR emilio.serrano[at]upm[dot]es
DESCRIPCIÓN DEL PROYECTO

La Ciencia de datos o Data Science (DS) es un campo interdisciplinar que se encarga de la extracción del conocimiento de los datos. Esta ciencia se ha convertido en una revolución que ha cambiado la forma de hacer negocios, la sanidad, la política, la educación y la innovación.

La Ciencia de Datos está en una posición privilegiada respecto a otras ramas del conocimiento para articular su aprendizaje mediante retos. La plataforma Kaggle libera periódicamente una serie de competiciones sobre problemas reales como "Predicting a Biological Response"; que ofreció 20.000 dólares al mejor modelo predictivo que enlazase una respuesta biológica de moléculas con sus propiedades químicas. Estas competiciones públicas tienen el potencial de involucrar activamente al estudiante en una situación problemática real, significativa, y relacionada con su entorno; incluyendo un marco de trabajo para la implementación de una solución para el reto.

Este proyecto plantea un aprendizaje basado en retos (ABR)  destinado a estudiantes del máster en Biología Computacional impartido en la ETS de Ingenieros Informáticos; y más concretamente en la asignatura de “Knowledge representation and acquisition”. Dentro del proyecto, los estudiantes se embarcarán en un reto del nivel de competición Kaggle con especial preferencia por retos activos y multidisciplinares. Sobre este reto y en base a la actualización de 2016 para el framework de ABR propuesto por Apple Inc; los estudiantes aprenderán siguiendo tres fases principales: involucrarse, investigar, y actuar.

El perfil de estos estudiantes es multidisciplinar, perteneciendo parte de ellos al mundo de la biología y parte de ellos a ramas de las tecnologías de la información. La ciencia de datos y el ABR ofrecen un marco excepcional para que se establezcan sinergias entre estos dos perfiles principales, combinando la experiencia en campos como la programación y la experiencia en el dominio concreto del reto. Los estudiantes, además, tendrán la oportunidad de aplicar a casos reales el conocimiento adquirido en otras asignaturas del máster como "Statistical Analysis and Data Visualization" y "Machine Learning". Los resultados de este proyecto serán directamente aplicables a otras asignaturas del máster, de otros másters como el “Master in Data Science (EIT Digital Master School)", y también en asignaturas de grado como “Minería de Datos” en el “Grado en Ingeniería Informática”.

OBJETIVOS DEL PROYECTO

Este proyecto tiene tres objetivos fundamentales:  

O1. Desarrollo de métodos para el aprendizaje basado en retos (ABR) de Ciencia de Datos y Biología Computacional. Este objetivo comprende la instanciación de metodologías y frameworks generales de ABR al campo específico a tratar. Destacan entre estos marcos, la actualización de 2016 para el framework de ABR propuesto por Apple Inc; y el informe de "Aprendizaje Basado en Retos" de 2015 realizado por el instituto Tecnológico y de Estudios Superiores de Monterrey.  

O2. Estudio de retos concretos en el campo de la Ciencia de Datos y la Biología Computacional. Aplicación de la instanciación de métodos explorados, ampliados, e instanciados a la Ciencia de datos en O1; para la selección de  retos concretos y para un perfil de estudiantes concreto. Los estudiantes trabajarán en un reto del nivel competición de Kaggle con especial preferencia por restos activos y multidisciplinares. Ejemplos de competiciones pasadas que se ajustan al perfil de estudiantes y a la temática de la asignatura son “Predicting a Biological Response", “Merck Molecular Activity Challenge”, “Shelter Animal Outcomes”, “Leaf Classification”, o “Zoo Animal Classification”.

O3. Integración y documentación de herramientas para el soporte del ABR en la Representación y Adquisición de Conocimiento. Este objetivo comprende el análisis y documentación de herramientas disponibles para dar soporte al ABR en la asignatura concreta. Si bien Kaggle dispone de un entorno de trabajo, Kaggle Kernels, se combinará este marco de trabajo con otras herramientas, preferentemente libres y de código abierto, que satisfagan la necesidades del ABR. Entre otros, y de acuerdo a la  la actualización de 2016 para el framework de ABR propuesto por Apple Inc., se necesitará: un calendario, espacio para la colaboración, y almacenamiento de documentos. Herramientas de gestión de proyectos como Trello y Asana así como alternativas libres serán consideradas.

 

ALCANCE Y PÚBLICO OBJETIVO AL QUE SE DIRIGE

Titulación/es Grado:
Titulación/es Máster:
  • Nº de Asignatura/s: 1
    Centro/s de la UPM:
  • E.T.S DE ING. DE SISTEMAS INFORMÁTICOS
  • FASES DEL PROYECTO Y ACCIONES QUE SE VAN A DESARROLLAR

    Se considerarán las siguientes tres grandes tareas con una clara correspondencia a los tres objetivos ya mencionados:

    • T1. Desarrollo de métodos para el aprendizaje basado en retos de Ciencia de Datos y Biología computacional.
    • T2. Analizar y seleccionar retos concretos en el campo de la Ciencia de Datos y la Biología computacional.
    • T3. Integrar y documentar herramientas para el soporte del ABR en la Representación y Adquisición de Conocimiento.

    También se considerará, como especifica la convocatoria, un comienzo en febrero de 2018, y una finalización el 15 de noviembre de 2018 o antes, dando 9 meses de proyecto numerados de M1 a M9.

    En un enfoque iterativo e incremental como el de la metodología Scrum, se plantea el siguiente cronograma que permite dar tres iteraciones a cada tarea de manera que los resultados preliminares de cada una de ellas sirvan para realimentar las siguientes fases del proyecto:

    • M1 T1 primera iteración
    • M2 T2 primera iteración
    • M3 T3 primera iteración
    • M4 T1 segunda iteración
    • M5 T2 segunda iteración
    • M6 T3 segunda iteración
    • M7 T1 tercera iteración
    • M8 T2 tercera iteración
    • M9 T3 tercera iteración

     

    RECURSOS Y MATERIALES DOCENTES

    Fundamentalmente se utilizarán:

    • Repositorios científicos disponibles en la UPM como ScienceDirect.

    • La Plataforma Institucional de Telenseñanza de la UPM (Moodle).

    • Sitios webs de repositorios de datos y concursos en Ciencia de Datos como Kaggle.

    • Recursos informáticos del Departamento de Inteligencia Artificial como servidores web.

    SEGUIMIENTO Y EVALUACION

    La Evaluación del proyecto se realizará por medio de la generación de un e-portafolio por parte de los estudiantes de la asignatura. El e-portafolio es una colección digital de evidencias, que incluye demostraciones, recursos, y logros obtenidos por los estudiantes. De acuerdo al framework de ABR propuesto por Apple Inc; se valorarán los siguientes apartados:

    • Informe de las grandes ideas a investigar.
    • La propuesta del reto, la pregunta esencial a responder y la motivación sobre lo significativo del reto.
    • Cuestiones guía, preguntas que guiarán la búsqueda de una solución.
    • Plan de aprendizaje y cronograma.
    • Informe de investigación, en formato de Jupyter IPython notebook, o alternativa, para asegurar la reproducibilidad y repetibilidad de los resultados alcanzados.
    • Solución propuesta, presentación incluyendo prototipos, conceptos, y el feedback de expertos.
    • Implementación y planes de evaluación.
    • Resultados de Evaluación.
    • Presentaciones finales.
    • Diarios con experiencia personal y de grupo.
    • Reflexiones finales sobre lo aprendido.
    PRODUCTOS RESULTANTES

    Se elaborarán los siguientes entregables.

    • E1. Informe sobre  métodos para el ABR en Biología Computacional y Ciencia de Datos.
    • E2. Informe sobre el análisis y selección de retos adecuados para el aprendizaje de Biología Computacional y Ciencia de Datos.
    • E3. Manual de herramientas para el soporte al ABR en la Representación y Adquisición de Conocimiento.
    • E4. Informe sobre la evaluación de los resultados basándose en e-portafolio creado por estudiantes.
    • E5. Artículo de revista o conferencia para la divulgación de resultados.

    Como se describió en la sección de alcance, estos entregables tienen una transferencia interna en la UPM hacia otras asignaturas del máster para el que se propone, otros masters, y otros grados. También puede suponer una ventaja competitiva en la organización de MOOCs al presentar una filosofía pedagógica distinta a alternativas como los cursos de Ciencia de Datos que ofrece la universidad de Stanford o la universidad Johns Hopkins.

     

    MATERIAL DIVULGATIVO

    Los principales materiales divulgativos generados serán:

    • E3. Manual de herramientas para el soporte al ABR en la Representación y Adquisición de Conocimiento.
    • E4. Informe sobre la evaluación de los resultados basándose en e-portafolio creado por estudiantes.
    • E5. Artículo de revista o conferencia para la divulgación de resultados.

    También se considerará:

    • la construcción de una web que recoja todos los entregables,
    • noticias para la difusión en la UPM,
    • entradas de microblogging (Twitter) en el departamento y la escuela,
    • entrevistas radiofónicas para divulgación de la innovación educativa.

     

    COLABORACIONES

    Se consultará con frecuencia al Gabinete de Tele-Educación (GATE) para buscar soluciones software ya integradas con la Plataforma Institucional de Telenseñanza de la UPM (Moodle)  que permitan dar soporte al espacio colaborativo requerido para el aprendizaje basado en retos. También se consultará a GATE las posibilidades de integración las herramientas y resultados de este proyecto de innovación con la mencionada plataforma.