Asignatura #SistemasDeInformación del Máster de Ingeniería Informática #MI2, visitando la empresa @mobbeel de biometría etc.

Estamos acabando las clases del segundo semestre en la Universidad de Extremadura #UEx @infouex, concretamente el próximo martes 14 de mayo y en menos de dos semanas estaremos empezando el periodo de exámenes desde el jueves 23 de mayo.

grupoSI

Este curso en la asignatura de #SistemasDeInformación del #MásterDeIngenieríaInformática #MI2 hemos tenido 11 estudiantes y hemos dividido este semestre la materia en tres partes:

unnamed-25

1ª parte)

Impartida por @pablogarguez. La primera parte comenzó con la instalación y manejo de #ApacheSpark, incluyendo consultas a los datos.

http://spark.apache.org/downloads.html

https://github.com/apache/spark

http://spark.apache.org/docs/latest/api/python/pyspark.html

Se trabajó de forma práctica y con ejemplos sencillos los conceptos más característicos de Apache Spark, diferenciando RDDs de DataFrames con las transformaciones y las acciones, y además a posteriori haciendo consultas con SQL y también con la propia API. Se trabajó también inicialmente con MLlib sabiendo que está obsoleta pero que es necesario conocer su funcionamiento para empezar a hacerse una idea de distintas potencialidades #BigData, viéndose a continuación el ML package dividiendo dicho estudio en tres partes : Transformers, Estimators (clasificación, regresión y clustering) y Pipelines.

 

2ª parte)

Impartida por @jaricogallego

Se vieron contenidos relacionados con #MachineLearning y #DeepLearning en #Python, desde los fundamentos hasta algunos ejemplo más o menos avanzados, junto con algunas bibliotecas. Utilizando sobre todo las siguientes referencias:

  • Learning Python, Mark Lutz. O’Reilly. Partes II-IV.
  • Python Data Science Handbook, Jake Vanderplas. O’Reilly. Parte II.

Hemos utilizado #JupiterNotebooks para la programación de ejemplos. Vimos en clase una introducción a los fundamentos del algoritmo de Regresión Lineal, una de las herramientas más utilizadas en el campo de Machine Learning. Estudiamos como se plantea en forma de algoritmo de optimización iterativo para ajustar los pesos de nuestro modelo. La biblioteca Scikit-Learn nos facilitó el trabajo en este sentido, ocultando los detalles del algoritmo y proporcionando una interfaz sencilla y muy potente. Dimos nuestros primeros pasos con esta biblioteca. Además, vimos ejemplos de regresión más avanzados, con varias características (features) y regresión polinómica. Finalmente, evaluamos los modelos para saber si se generaliza bien a nuevos datos, y vimos los dos problemas habituales: overfitting y underfitting, además de ofrecer algunas pautas generales para resolverlos. Introdujimos redes neuronales de forma práctica, desde el estudio de la unidad básica (Perceptrón), hasta las MLP (Multi-Later Perceptron), y aplicamos los conocimientos a varios problemas reales utilizando la biblioteca Keras, sirviéndonos de introducción a Deep Learning, en concreto a las redes neuronales MLP, e hicimos algunos ejemplos de clasificación con este tipo de redes densamente conectadas. Uno de los campos en que Deep Learning ha conseguido mejores resultados es el de visión por computador, así trabajamos con  Redes Neuronales Convolucionales (CNN o ConvNets), especializadas en este tipo de aplicaciones y analizamos dos problemas de clasificación (binaria y multi-clase). También estudiamos la forma de cargar una red convolutional per-entrenada, y vimos cómo mejoraba la precisión de la clasificación en un porcentaje muy significativo. Comprobamos como estas redes, y en general las NN profundas, necesitan grandes datasets para alcanzar buenos resultados, y que esto requiere mucha capacidad de cómputo.

 

3ª parte)

Impartida por @pablogarguez

Aún no está terminada y se ha basado en la metodología basada en la resolución de problemas mediante el trabajo en equipo. Mañana jueves 9 de mayo, último día de clase (4 horas) se expondrán los resultados obtenidos en cada uno de los 3 grupos:

  • GraphFrames: datos, consultas, visualización, …
  • TensorFrames: datos, operaciones con matrices, vectores de características, …
  • Streaming: datos, real-time, análisis de la información, …

 

Otras actividades realizadas: 

A) Participación por equipos en el HashCode del @gdgcaceres de #Google (jueves 28/02/2019) – 3 equipos del Máster de Ingeniería Informática #MI2

https://www.meetup.com/es-ES/GDG-Caceres/events/258172775/

¿Que es la HashCode?

La HashCode es un evento organizado por Google a nivel internacional en el que se propone un reto y se puntúa por el tiempo que se tardo en resolver y los errores cometidos. Para participar es condición necesaria hacerlo en equipos de mínimo 2 personas y máximo 4.

¿Como me registro?

Tenéis hasta el día 25 de Febrero para registraros para el evento.

Para registrarse en la HashCode:
https://codingcompetitions.withgoogle.com/hashcode
(El correo de confirmación de registro puede tardar más de 24h)

Una vez registrado en el evento, inicias sesión en el juez online (https://hashcodejudge.withgoogle.com) y te permite elegir tu equipo y el hub con el que participas (Si ya te registraste en la web de la Hashcode pero al entrar en el juez te dice que no estás aun registrado, tienes que esperar a que te llegue el correo de confirmación para poder entrar, que puede tardar más de 24h).

Ca9HG7EWEAAFV8z

B) Conferencia del Colegio Profesional de  Ingeniería Informática de Extremadura @cpiiex

Nuevos cambios que se avecinan: ¿Cuáles van a ser tus competencias profesionales? La charla será impartida por el presidente del CPIIEx Markus Hernández Droth @Markus_hd en la Semana del Centro #EscuelaPolitécnica (jueves 21 de marzo, una hora antes de la clase de 16:30h a 17:30h)

unnamed-23

C) Visita al Garaje 2.0 a la empresa @mobbeel

Empresa implantada en Extremadura por estudiantes egresados de la #EscuelaPolitécnica y de alcance profesional en el campo de la biometría en dispositivos móviles: reconocimiento del iris ocular, reconocimiento de firmas, reconocimiento facial, huella dactilar, OCR zonal en documentos identificativos como el DNI, etc.

IMG-5937

#SomosEPCC

pablogarguez

@pablogarguez es actualmente Director General de Agenda Digital de la Consejería de Economía, Ciencia y Agenda Digital de la Junta de Extremadura, desde septiembre de 2019, siendo responsable básicamente de la Conectividad y la Transformación Digital en consonancia con la políticas de la Unión Europea. Fue Director de la Escuela Politécnica de Cáceres (School of Technology) de la Universidad de Extremadura durante 3 años (2017-2019), con titulaciones de grado, máster y doctorado en los campos de Ingeniería Civil, Edificación, Informática y Telecomunicaciones. Su trayectoria docente comienza en 1997 en la Universidad de Extremadura con su centrada en asignaturas de Programación en Ingeniería Informática y en el campo de las Bases de Datos y los Sistemas de Información. En el año 2000 defendió su tesis doctoral en la Universidad de Extremadura, que es la primera con mención de Tesis Europea de la Universidad, obteniendo el título de Doctor en Ingeniería Informática por la UEx. Su actividad investigadora se ha centrado en las áreas de Ciberseguridad, el BigData, el Internet de las Cosas (IoT), la Visión por Computador y el desarrollo de técnicas de Reconocimiento de Patrones y Análisis de Imagen. Fruto de esta labor de investigación, resaltar que es coautor de más de veinte artículos publicados en revistas internacionales indexadas en JCR, con un índice H de 12 en cuanto a las citas conseguidas por estos artículos. Actualmente tiene 3 sexenios de investigación a nivel nacional, y el último de ellos es un sexenio vivo (activo). También posee un sexenio de transferencia de los nuevos habilitados por el Ministerio (2019).

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *