Concurso de Becas UCM (72.000€)

concurso-master-data-science

Te contamos como nuestros alumnos de los másteres de marketing digital, data science y big data de la Universidad Complutense han tenido la oportunidad de presentar sus proyectos grupales de TFM ante un jurado de inversores, ganando miles de euros en premios.

¿Cómo se ha desarrollado el concurso de becas?

Como en las ediciones pasadas, los alumnos de Data Science han realizado el TFM aplicando los conocimientos adquiridos en el transcurso de los módulos del máster.

Los alumnos formaron grupos para el TFM de aproximadamente 6 personas para presentar su proyecto frente a un jurado para participar en el concurso de becas.

Como cada año, el TFM consta de dos partes:

  1. Un escrito de entre 40-70 páginas en el cual se desarrolla en profundidad el proyecto elegido por los alumnos del máster en Data Science. Cada grupo entrega un TFM diferente en función de la naturaleza de su proyecto.

 

  1. Una presentación en el formato escogido (Teniendo en cuenta que es una de las directrices de puntuación). La presentación no dura más de 5 minutos y es evaluada por un grupo de inversores expertos.

Directrices de puntuación

El jurado puntúa cada proyecto del TFM en función de las siguientes directrices:

Los 4 puntos que se evalúan en la competición y marcan el resultado del concurso de becas son:

 

  • Aplicación y metodología de las técnicas de big data.
  • Resultados obtenidos.
  • Exposición del trabajo.
  • Innovación en el proyecto.

En resumen, los alumnos deben mentalizarse de que expondrán su trabajo final ante unos inversores profesionales. Ganarán aquellos que logren convencer al jurado sobre la innovación, viabilidad y aplicación del Big Data y Data Science en su proyecto.

El gran objetivo es que demostréis en esa exposición que sabéis desarrollar un proyecto Big Data  y aplicar los conocimientos del máster; no tanto montar una empresa.

Ganadores del Concurso 2019 – 2020

La promoción de 2019/2020 estuvo marcada por la presencia del coronavirus y las clases por vía streaming. Pero esto no freno a nuestros alumnos, que supieron adaptarse a las circunstancias para elaborar un TFM con el que consiguieron impresionar al jurado y formar parte de los grupos ganadores, con su correspondiente satisfacción y recompensa económica.

Entre todos los Másteres de la UCM (marketing digital, big data y data science), se presentaron un total de 30 Grupos y más de 180 alumnos a la competición.

Presentamos aquí a los ganadores del Concurso de Becas de la promoción 19/20´ Pertenecientes al Máster de Big Data

Primer Premio: SECUREPLACE – Te mantenemos en tu metro cuadrado :

SECUREPLACE es un proyecto de distanciamiento social a través del Deep Learning.

Busca generar una puntuación de riesgo de contagio de CO-VID19, basándose en el cumplimiento de la distancia social y en algoritmos de reconocimiento de video. Esto permitiría determinar la seguridad sanitaria en un entorno determinado, clasificándolo en tres niveles de riesgo: bajo, medio y alto.

El algoritmo genera datos que son mostrados en una pantalla mientras el video transcurre. Además, almacena la información que se genera por unidad de tiempo en archivos csv. De este modo, se puede consultar el histórico y establecer políticas de prevención.

El riesgo se ajusta en base a factores como; si el individuo se encuentra o no en un lugar cerrado, así como si existe un brote epidemiológico en la zona… El objetivo es lograr una mejor aproximación a la medición del riesgo.

logo-secureplace-ganador-ucm

La finalidad de SECUREPLACE es:

  • Poder contribuir con más información para la toma de decesiones
  • Que los ciudadanos puedan conocer el riesgo de determinados espacios públicos que transitan de manera diaria.
  • Que los hacedores de políticas públicas cuenten con esta herramienta para determinar futuras medidas.

Desde SECUREPLACE, creemos haber podido determinar la seguridad de los espacios públicos.

Segundo Premio: Oxygen ML

 

Oxygen ML es una plataforma modular de ciencia de datos que automatiza flujos de trabajo en machine learning e incorpora módulos de procesamiento de lenguaje natural y series temporales.

El módulo principal automatiza el flujo de trabajo de machine learning, desde la carga de datos desde distintas fuentes, análisis exploratorio de datos (EDA), ‘feature engineering’, particiones de entrenamiento y prueba, hasta la selección de modelos y generación de predicciones.

La carga de datos se permite desde archivos csv, xls, hojas de cálculo de Google o SQL. Una inspección inicial de los datos permite conocer la integridad de los conjuntos. Al seleccionar la variable objetivo, la plataforma reconoce el tipo de problema a resolver (regresión, clasificación binaria, clasificación multiclase) y realiza un EDA apropiado en función de la variable objetivo.

Usando un algoritmo de random forest, la plataforma evalúa la importancia de las variables sobre el objetivo permitiendo seleccionar las mejores variables para el modelaje. La herramienta permite escoger el tamaño de la partición de entrenamiento y prueba, permite escoger entre distintos algoritmos de modelaje (xgboost, random forests, regresiones, etc.) y muestra las métricas de desempeño cada uno para así escoger el mejor modelo y generar predicciones en los datos.

Con pocos clics, la herramienta ha generado predicciones que han ganado o han quedado en el top 5% de competencias de ciencia de datos.

Además del módulo de machine learning, la plataforma integra un módulo de procesamiento de lenguaje natural (NLP) y análisis de sentimiento. Este módulo permite conectarse a 3 fuentes distintas de datos: documentos pdf, archivos csv/xls y Twitter.

 El módulo permite el análisis de sentimiento en textos en español e inglés y muestra la dinámica de sentimientos por páginas en el caso de pdfs, tiempo en el caso de tweets u otras variables en el caso de archivos csv/xls. También usa identificación de partes del lenguaje natural basado en “Universal Dependencies” para realizar el análisis de textos identificando las palabras más frecuentes por tipo y las relaciones de palabras en los textos.

La plataforma Oxygen ML fue diseñada pensando en hacer que las herramientas de ciencia de datos sean más accesibles a cualquier tipo de usuarios, incluyendo de empresas de todo tamaño, investigadores consultores, estudiantes.

Premios del concurso

Se ha repartido un total de 72.000 € en premios entre todos los participantes del concurso. Dividiéndose en 12.000€ para cada una de las clases, y repartiéndose de la siguiente manera:

Primer Premio: 8.000€ / Grupo

Segundo Premio: 4.000€ / Grupo

Conclusión

Como habrás podido leer. el nivel de los proyectos no deja indiferente a nadie.

Presentar un proyecto basado en la ciencia del dato en 5 minutos, no es fácil. Pero los ganadores de nuestro concurso y el resto de los participantes han demostrado que sí se puede.

Logo Universidad Complutense de Madrid

Nos reservamos el derecho a que el concurso de becas pueda sufrir modificaciones cada año.