Programa
- Presentación. Introducción a la ciencia de datos y a la ingeniería de datos.
- Herramientas de trabajo básicas: Docker, Python y Jupyter Notebook.
- Introducción a la manipulación de datos con Pandas.
- Datos estructurados y no estructurados.
- Bases de datos SQL y NoSQL.
- Adquisición de datos de fuentes heterogéneas: APIs, web, etc.
- Visualización de datos con Matplotlib/Seaborn
- Preprocesamiento y preparación de datos
- Análisis exploratorio de datos con Statsmodels
- Introducción al aprendizaje automático. scikit-learn.
- Modelos de aprendizaje supervisado y no supervisado.
- Evaluación y validación de modelos.
- Modelos avanzados de aprendizaje automático.
- Tratamiento de casos específicos.
- Introducción al Deep Learning.
- Desarrollo de redes neuronales feed-forward y convolucionales.
- Implementación con TensorFlow 2.
- Visualización, análisis y modelos predictivos en series temporales.
- Aprendizaje automático sobre información textual. NLTK y Spicy
- Análisis de redes. NetworkX
- Sistemas de recomendación.
- Principios de visualización.
- Herramientas avanzadas de visualización.
- Diseño e implementación de paneles de control.
- Introducción a la computación en la nube usando AWS
- Despliegue de máquinas virtuales en AWS con Amazon Elastic Compute Cloud (EC2)
- Almacenamiento de ficheros con S3
- Monitorización básica de aplicaciones cloud con Amazon Cloudwatch
- Diseño de arquitecturas altamente disponibles en la nube
- Seguridad en AWS. Usuarios, permisos y roles con AWS Identity and Access Management (IAM)
- Bases de datos relacionales (Amazon RDS) y no relacionales (Amazon DynamoDB)
- Computación serverless con AWS Lambda
- Inteligencia artificial bajo demanda con los servicios cognitivos de AWS.
- Introducción a las tecnologías BigData
- Computación distribuida para Big Data con Apache Spark.
- Machine Learning a escala con MLib.
- Procesamineto de flujos de datos con Spark Streaming
- Introducción al almacenamiento de datos como datalakes
- Procesos ETL (extracción, transformación y carga) con AWS Glue
- Mantenimiento e integridad de los datos
- Monitorización de datalakes
- Gobierno y calidad del dato
- Gestión de la arquitectura como códico (IaC) con AWS Cloudformation
- Despliegue de aplicaciones con el Serverless framework y con AWS Serverless Application Model (SAM)
- Integración y despliegue contínuo de aplicaciones