Nuevo enfoque de enseñanza de Aprendizaje Automático a través del trabajo cooperativo entre grupos multidisciplinares
memoria >>
Nombre y apellidos | Centro | Plaza * |
ALEJANDRA STALLER VAZQUEZ | E.T.S.I. TOPOGRAFIA GEODESIA CARTOGRAFIA | TITULAR UNIVERSIDAD |
ALICIA RIVAS MEDINA | E.T.S.I. TOPOGRAFIA GEODESIA CARTOGRAFIA | L.D. PRF.AYUD.DOCTOR |
BORJA BORDEL SANCHEZ | E.T.S DE ING. DE SISTEMAS INFORMÁTICOS | L.D. PRF.CONTR.DOCT. |
CALIMANUT IONUT CIRA | E.T.S.I. TOPOGRAFIA GEODESIA CARTOGRAFIA | L.D. AYUDANTE |
JORGE MIGUEL GASPAR ESCRIBANO | E.T.S.I. TOPOGRAFIA GEODESIA CARTOGRAFIA | TITULAR UNIVERSIDAD |
LUIS SEBASTIAN LORENTE | E.T.S.I. TOPOGRAFIA GEODESIA CARTOGRAFIA | TITULAR E.U. |
MIGUEL ANGEL MANSO CALLEJO | E.T.S.I. TOPOGRAFIA GEODESIA CARTOGRAFIA | TITULAR UNIVERSIDAD |
RAMON PABLO ALCARRIA GARRIDO | E.T.S.I. TOPOGRAFIA GEODESIA CARTOGRAFIA | TITULAR UNIVERSIDAD |
ROSA MARIA GARCIA BLANCO | E.T.S.I. TOPOGRAFIA GEODESIA CARTOGRAFIA | TITULAR UNIVERSIDAD |
SANDRA MARTINEZ CUEVAS | E.T.S.I. TOPOGRAFIA GEODESIA CARTOGRAFIA | L.D. PRF.CONTR.DOCT. |
TERESA ITURRIOZ AGUIRRE | E.T.S.I. TOPOGRAFIA GEODESIA CARTOGRAFIA | TITULAR E.U. |
TOMAS ENRIQUE ROBLES VALLADARES | E.T.S DE ING. DE SISTEMAS INFORMÁTICOS | CATEDRÁTICO UNIVERSIDAD |
YOLANDA TORRES FERNANDEZ | E.T.S.I. TOPOGRAFIA GEODESIA CARTOGRAFIA | L.D. PRF.AYUD.DOCTOR |
(para PDI/PAS de la UPM, en el resto de casos no se especifica).
El Aprendizaje Automático o Machine Learning (en adelante utilizaremos AA) corresponde a una rama de la inteligencia artificial que se enfoca en la capacidad de aprendizaje de equipos computacionales a través del reconocimiento de patrones en grandes volúmenes de datos, para luego ejecutar tareas específicas de manera más eficiente en comparación con las posibilidades de un ser humano. El AA es uno de los skills emergentes más valorado actualmente, y representa alrededor de un 1.3% de todas las ofertas según la base de datos mundial de Global Data [1].
Los expertos en el Aprendizaje Automático e Inteligencia Artificial, también llamados “Científicos de Datos” tienen una muy prometedora perspectiva laboral como indica el IEB sobre las profesiones más demandados en 2022 [2].
Muchas carreras que no están directamente relacionadas con las Ciencias de la Computación han empezado a incorporar temario de Inteligencia Artificial en asignaturas de sus planes de estudio, como en el caso de la ETSI en Topografía, Geodesia y Cartografía, con las asignaturas Big Data Geoespacial y Análisis de Series Temporales, mientras titulaciones de escuelas como la ETSI en Sistemas Informáticos están planteando incorporar este temario sobre asignaturas ya tradicionalmente establecidas, como Administración y Gestión de Redes, Redes avanzadas y Programación HW reconfigurable (Grado en Tecnologías para la Sociedad de la Información -TSI- y Dobles Grado de Ing. del Software y TSI y Grado Ing. de Computadores y TSI). Además, muchas titulaciones ya consideran en sus sistemas de prácticas en empresas este perfil del alumnado, posicionándose como un activo de interés que otorga prestigio a la titulación en el mercado laboral.
Sin embargo, la implantación de técnicas de Aprendizaje Automático en la educación universitario no es sencilla, y plantea varios retos.
Por lado, aquellos planes de estudio que sí incluyen asignaturas específicas de AA en su descripción enfrentan una falta de recursos digitales muy importante. La aplicación de técnicas de aprendizaje automático requiere de una gran cantidad de datos que suministrar a los sistemas de aprendizaje para que puedan perfeccionar el reconocimiento de patrones. Para suplir la falta de datos que analizar, los profesores de asignaturas relacionadas con esta disciplina ofrecen a los alumnos conjuntos de datos (en adelante datasets) ya generados y publicados en portales como Kraggle, que facilita el procesamiento de los datos. Pero muchos de estos datasets están descontextualizados, y no permiten que los alumnos comprendan el entorno de aplicación o la necesidad real que los motiva. Este problema posee cierta gravedad ya que un aspecto fundamental de los Científicos de Datos es la capacidad para el razonamiento crítico de los resultados obtenidos a la luz del escenario de aplicación, los datos recolectados, etc.
Por otro lado, en asignaturas no relacionadas con el campo de la Inteligencia Artificial a menudo se encuentran con escenarios idóneos para la aplicación de técnicas de AA (por ejemplo, al generar datos suficientes para poder aplicar estas técnicas), y la creciente demanda de este tipo de conocimiento por parte de los alumnos y las empresas empuja a los docentes a incluir estas tecnologías en el cronograma. Pero esta tecnología es muy compleja, y hoy en día no existen herramientas genéricas sectoriales que permitan un uso amigable de la misma. Por tanto, es muy complicado que alumnos sin formación específica puedan emplear estas soluciones sin un esfuerzo extracurricular muy importante.
En ambos casos, esta difícil situación degenera en una degradación de la enseñanza, principalmente concretada en dos aspectos. Primero la baja motivación y/o frustración de los alumnos al no comprender completamente una tecnología esencial y muy demandada en la actualidad, como es el AA. Los alumnos no consiguen satisfacer sus expectativas de formación, debido a un fuerte sentimiento de desconocimiento. Este desanimo aparece en etapas muy tempranas de las asignaturas y causa que el aprendizaje decaiga rápidamente y con el él la calidad de los proyectos desarrollados y el aprovechamiento de las nuevas oportunidades de adquirir conocimientos (lo que intensifica más la desmotivación). Tanto las encuestas generales de la UPM, como la evolución de la calificación media (y comparada con otras asignaturas del mismo semestre y titulación) reflejan estos problemas en sus relativamente bajos valores. Y, segundo, una presencia limitada de nuestros egresados en puestos relacionados con tecnologías de AA, a pesar del liderazgo que la UPM posee en el área. Estudios informales sobre las titulaciones mencionadas en esta propuesta (mediante encuestas/testimonios) indican que los egresados no se sienten competitivos en el área de Aprendizaje Automático, en comparación con otros egresados.
Para resolver esta situación en este PIE proponemos un esquema de aprendizaje colaborativo entre estudiantes especializados en Aprendizaje Automático que precisan de datasets y casos de estudio y estudiantes de otras áreas de la informática que desean aplicar esta técnica a sus escenarios de una manera amigable y centrada en sus propios intereses y motivaciones. Para ello, los estudiantes de AA proporcionarán sus conocimientos a otros estudiantes, que ofrecerán datos y escenarios. Del trabajo colaborativo ambos grupos de estudiantes obtendrán un mayor aprendizaje y una mejor comprensión del AA.
[2] https://www.iebschool.com/blog/profesiones-solicitadas-bien-pagadas-reclutamiento-seleccion/
A continuación, se detallan los objetivos que se pretenden abordar en esta propuesta:
Objetivo 1: Mostrar a los alumnos que no disponen de AA en su programa curricular los beneficios del empleo de esta técnica para su entorno de especialización (redes y HW reconfigurable). Permitirles, a través de trabajo cooperativo, llegar a comprender su aplicación de una manera amigable y con bajo nivel de frustración (nivel de “comprensión” en los ámbitos cognitivos de la taxonomía de Bloom [1]).
Objetivo 2: Contribuir a la motivación y a la adquisición de conocimientos de estudiantes de AA, a través de un enfoque de enseñanza de experimentación activa. Numerosos expertos reconocen los beneficios en cuanto a mayor motivación y experiencia de aprendizaje cuando se llevan ejemplos y problemas de la vida real a la experimentación en el aula [2].
Objetivo 3: Con ayuda de los alumnos, comenzar la generación de una base de datos materiales docentes que podrá ser utilizado por otros equipos de trabajo para la resolución de problemas relacionados con los retos tecnológicos de la sociedad, evitando utilizar datasets frecuentemente analizados en Internet.
Objetivo 4: Capacitar a los alumnos de competencias profesionales en Aprendizaje Automático para la posterior evaluación de su desempeño en prácticas en empresa.
Objetivo 5: Mejorar la capacidad de los alumnos para su adaptación a entornos cambiantes, y el trabajo en equipos multidisciplinares (distintas escuelas y planes de estudio). Estos soft-skills se demandan de manera creciente en la búsqueda de nuevos perfiles profesionales [3].
[1] Universidad ICESI: https://eduteka.icesi.edu.co/articulos/TaxonomiaBloomCuadro
[2] Janelle Cox, Bring the Real World into the Classroom as a Teaching Strategy, https://www.futureeducators.org/bring-the-real-world-into-the-classroom-as-a-teaching-strategy/
Los problemas descritos en la sección de introducción han sido detectados en 5 asignaturas que coordinan los profesores participantes en esta propuesta. A continuación, ofrecemos los aspectos de la propuesta que pueden contribuir a resolver dichos problemas:
A los estudiantes de Big Data Geoespacial y Análisis de Series Temporales, actualmente se les solicita la realización de un trabajo donde deben obtener métricas de rendimiento de algoritmos clásicos de aprendizaje máquina (regresión, clasificación, y clustering) y técnicas del estado del arte (redes neuronales) sobre un dataset de libre elección que proceda de un repositorio público. Esta aproximación para asignaturas relacionadas con el aprendizaje máquina está muy extendida en los planes de estudios, y produce que los datos procedentes de estos repositorios tan populares ya hayan sido analizados múltiples veces y soluciones de procesamiento de estos datos estén ya ampliamente publicadas en Internet. Esto hace que el aprendizaje del alumno, que puede encontrar las soluciones al problema a resolver de una manera muy guiada, pierda calidad, al retroceder de manera significativa en la escala de la taxonomía de Bloom, de “Crear” a “Aplicar/Analizar”.
Por otro lado, en las asignaturas de Administración y Gestión de Redes, Redes avanzadas y Programación HW reconfigurable, que mantienen una metodología de aprendizaje basada en proyectos, los alumnos emplean recursos tradicionales como los estadísticos para la detección de problemas en la red, como pueden ser ciberataques. Al ser un enfoque que fomenta el aprendizaje autónomo de los alumnos, estos escogen recursos que les resultan cómodos. El educador Tom Senninger enmarca esta práctica en la llamada Zona de Confort (Confort Zone), y propone [1] que el AA alcance la Zona de Aprendizaje o Crecimiento (Learning/Growth Zone), donde los alumnos experimentarían con su curiosidad y harían nuevos descubrimientos tecnológicos.
Como mejora de la calidad docente, se pretende, por tanto, que los alumnos mejoren la calidad de las entregas en sus respectivas asignaturas y que trabajen de una manera más intensa los objetivos de aprendizaje asociados a las mismas. Esta mejora se deberá materializar en una mayor satisfacción (medidas a través de las encuestas UPM) y una mejor calificación media tanto parcial como global entre los estudiantes participantes. Además, la estrategia propuesta en este proyecto permitirá la generación de materiales docentes en forma de base de datos, por parte de los alumnos, que podrá ser utilizado por otros equipos de trabajo para la resolución de problemas relacionados con los retos tecnológicos de la sociedad, y así evitar utilizar datasets frecuentemente analizados y cuyas soluciones son ampliamente conocidas.
[1] http://www.thempra.org.uk/social-pedagogy/key-concepts-in-social-pedagogy/the-learning-zone-model/
Titulación/es Grado: | DOBLE GRADO INGENIERIA COMPUTADORES Y TECNOLOGIAS PARA SOCIEDAD INFORMACION |
Titulación/es Máster: |
|
Nº de Asignatura/s: | 6 |
Centro/s de la UPM: |
E.T.S.I. TOPOGRAFIA GEODESIA CARTOGRAFIA |
Las asignaturas donde se aplicará la experiencia docente se han descrito en el apartado de “descripción”. En este apartado se recurre a este listado para la adecuación de las fases a los semestres de impartición de cada asignatura y a las actividades que se van a desarrollar en las mismas.
El diseño y aplicación de la metodología propuesta comprende las siguientes fases, que tienen lugar entre el 1 de febrero 2023 (mes 1, M1) y el 15 de noviembre 2023(M10):
Primera fase (M1-M2): Preparación del entorno. Se necesita una infraestructura común donde se puedan crear y alojar los grupos de estudiantes. Se utilizará para eso un portal de leaderboard como el ofrecido por Kaggle, que permite organizar los resultados de cada grupo de alumnos de manera que la calidad de las soluciones se muestra tanto a profesores como alumnos. Generación de material de apoyo al enfoque de enseñanza.
Segunda fase (M3): Preparación de grupos. Los profesores implicados en las asignaturas presentan el ejercicio, ofrecen el material de apoyo y realizan intervenciones conjuntas para que los alumnos participantes en el experimento se conozcan.
Tercera fase (M4-M8): Realización del experimento. Durante el transcurso de las asignaturas, los grupos de alumnos van trabajando en sus proyectos. Alumnos de la asignatura de prácticas en empresas que hayan estado involucrados en trabajos relacionados con la Inteligencia Artificial, realizarán una presentación en clase para motivar a los alumnos.
Cuarta fase (M9-M10): Evaluación. Con ánimo de evaluar la eficacia y la acogida de la actividad, se realizarán entrevistas informales a los alumnos participantes, y se evaluará el rendimiento académico en ambas asignaturas respecto a cursos previos. El grupo de profesores participantes compartirán estos resultados con la comunidad universitaria para dar a conocer esta experiencia docente. En estos foros se presentará el análisis del resultado académico y el beneficio de la implantación de esta experiencia. En esta fase también se estudia cómo mantener la iniciativa para los próximos cursos, implicando en la medida de lo posible a más profesores y asignaturas relacionadas con los retos planteados (Ver apartado de colaboraciones).
El seguimiento del proyecto se realizará siguiendo dos procedimientos. (i) Un seguimiento continuo mediante la supervisión por parte de los profesores del desarrollo de las actividades y (ii) un seguimiento producto de la evaluación de los siguientes hitos o resultados:
Hito 1 (M2): Propuesta de metodología de trabajo cooperativo en equipos multidisciplinares, con un detalle completo de las actividades a realizar en cada asignatura, sincronizando sesiones con calendario lectivo. Comprobación de los mejores vehículos de difusión del trabajo y establecimiento de plan y calendario de diseminación de resultados.
Hito 2 (M4): Listado de datasets más representativos tanto públicos como a generar en el contexto educativo del proyecto, elaborados por los estudiantes de HW reconfigurable y redes.
Hito 3 (M7): Listado de técnicas de AA para representativas para abordar el análisis de estos datasets, con posibilidades de aplicar funciones como la detección automática o la predicción.
Hito 4 (M8): Perfil curricular actualizado del estudiante de cada una de las titulaciones que intervienen en el experimento. El perfil se utilizará para la búsqueda de prácticas en empresa de características compatibles.
Hito 5 (M10): Recopilación de documentación con resultados para su presentación en los canales de difusión del proyecto.
Consideraremos superado el proyecto cuando la generación y evaluación de la documentación generada cumpla con los estándares aplicados según los siguientes indicadores:
- Encuestas a los alumnos para el seguimiento del experimento, en las que se preguntará por la adecuación del mismo, el tiempo de dedicación, y el nivel de motivación del alumnado. Se utilizará como umbral de éxito un resultado superior a 7 sobre 10. Para evaluar la mejora del nivel de motivación de los alumnos se emplearán procedimientos reconocidos en la literatura como [1].
- Encuesta final de satisfacción del alumnado, con resultados similares o superiores a las encuestas de cursos pasados. Encuesta final de satisfacción del profesorado, con resultados superiores a 8 sobre 10.
- Tasas de eficiencia y de éxito para cada asignatura, en relación con tasas de cursos pasados, con un nivel de significancia de un 5% (p<0.05)
[1] Pintrich, P. R. (2004). A conceptual framework for assessing motivation and self-regulated learning in college students. Educational psychology review, 16(4), 385-407.
Los productos generados se presentan a continuación:
Informe final del proyecto describiendo el equipo, acciones de coordinación, dificultades relevantes, colaboración con otros proyectos, actuaciones realizadas, y acciones y el material elaborado para la divulgación y difusión del proyecto. Todos estos materiales, previa autorización de todos los autores involucrados, podrá ser transferidos, primero a todos los docentes de la UPM que deseen unirse a la experiencia, y posteriormente se valorará una transferencia externa de carácter divulgativo.
Informe sobre la experiencia realizada, siguiendo formato de un artículo científico, para su diseminación como comunicación científica, centrado en os resultados y el impacto en la mejora de la calidad docente lograda con el proyecto.
Repositorio de datos que contiene los datasets generados y analizados por los equipos de trabajo. El objetivo es que este repositorio se enriquezca con las aportaciones de otros docentes que también trabajen asignaturas donde el aprendizaje automático tenga cabida, y que puedan aportar sus casos de uso de interés y fomentar las colaboraciones con estudiantes de otras titulaciones y Escuelas.
Los resultados y productos del proyecto serán difundidos a través de la realización de comunicaciones en congresos y revistas de prestigio, de ámbito nacional e internacional. La selección particular de las mismas dependerá, mayormente, de la situación editorial que se configure al final de la ejecución del proyecto, buscando siempre el mayor impacto. A modo de ejemplo, se han revisado las siguientes conferencias y revistas, donde los participantes de esta propuesta ya han publicado en los últimos años sus trabajos de innovación educativa:
- Seminario de Experiencias Educativas: https://eventos.upm.es/55360/section/26974/seminario-de-experiencias-educativas.html
- International Journal of Online Engineering: http://online-journals.org/index.php/i-joe
- International Journal of Emerging Technologies in Learning: https://online-journals.org/index.php/i-jet
- WorldCist'22 - 10st World Conference on Information Systems and Technologies. 12-14 April; Budva, Montenegro: http://www.worldcist.org/
- INTED2022 - 16th annual Technology, Education and Development Conference, Spain. https://iated.org/inted/
- ICERI2022 - 15th annual International Conference of Education, Research and Innovation, Seville (Spain). https://iated.org/iceri/
- EDULEARN 2021 - 13th annual International Conference on Education and New Learning Technologies, Palma de Mallorca (Spain). https://iated.org/edulearn/
A comienzo del proyecto, si resulta aceptado, se publicará también una reseña en la página del grupo de investigación GISAI: http://gisai.dit.upm.es/ y se actualizará la información del proyecto en las páginas de los grupos 79 - Redes y Servicios de Comunicaciones (https://innovacioneducativa.upm.es/informacion_grupo?grupo=234) y 25-Inngeo (http://grupos.topografia.upm.es/inngeo/)
Colaborarán en la iniciativa profesores e investigadores de dos Escuelas diferentes: ETSI Topografía, Geodesia y Cartografía, ETSI Sistemas Informáticos. Dos grupos de Innovación Educativa darán soporte a la experiencia (INNGEO y Redes y Servicios de Comunicaciones), donde intervendrán 6 asignaturas correspondiente a 4 titulaciones de Grado.
Las colaboraciones previstas entre los profesores implicados están pensadas para su continuidad más allá de la finalización del proyecto, haciendo la experiencia piloto sostenible en el tiempo. Se contemplan las asignaturas Informática gráfica (código 125000414) y Sistemas Basados en Computador (código 615000335), cuyos profesores valoran la aplicación de esta metodología a sus asignaturas para los próximos cursos.
Al menos alumnos de tres áreas de conocimiento se integrarán para formar grupos multidisciplinares. A saber:
- Ingeniería cartográfica, geodésica y fotogrametría.
- Ingeniería telemática.
- Arquitectura y tecnología de computadores.