A toda persona interesada en programación de datos.
Adquirir nuevos conocimientos relacionados con el sector. Herramientas y librerías que aprenderás:
• Python
• Linux
• Jupyter Lab
• Pycharm
• AWS
• Spark (PySpark, Spark MLlib, PySpak Pandas)
• Hadoop (HDFS, YARN)
• Mongo DB
• NumPy
• Pandas
• Matplotlib
• Sklearn
• ChatGPT
• DALL·E 3
• OpenAI API
• Chatbots
1) Módulo 1: Introducción a los sistemas Informáticos y tecnologías Big Data
- Principales componentes de un sistema informático. Sistemas Operativos, para que sirven, que tipos hay y cómo funcionan…
- Introducción a GNU/Linux
- GNU/Linux Avanzado
- Como usar GNU/Linux en Cloud (AWS)
- Introducción teórica a las tecnologías Big Data: Bases de Datos SQL/No SQL, Computación distribuida, Cloud…
2) Módulo 2: Fundamentos de Programación en Python
- Introducción a los lenguajes de programación
- Python: Sentencias Básicas y Bloques Lógicos
- Python: Funciones y Scope
- Python: Clases y Objetos y Tratamiento de Excepciones
- Python: Módulos y Uso de librerías de Python
3) Módulo 3: Análisis de Datos con Python
- Python: Librerías básicas de Data Science: Pandas, Numpy, Matplotlib, Sklearn…
- Introducción teórica al análisis exploratorio de Datos
- Python: Ejemplificación del análisis exploratorio de datos mediate Datasets reales
4) Módulo 4: Introducción al Machine Learning
- Desambiguación de términos: ¿Machine Learning? ¿Deep Learning? ¿Data Science? ¿Big Data? Machine Learning: Aprendizaje supervisado (regresión/clasificación), no supervisado y por refuerzo.
- Nuestros primeros pasos con el Machine Learning: Regresión Lineal y Regresión Logística. Ejemplos con datos reales en Python.
4.1) Módulo 4.1: Introducción a la IA Generativa
- ¿Como aprovechar los recientes avances en IA generativa? Panorama actual de tecnologías más relevantes por campo:
• Texto: ChatGPT, Bard, LLaMA…
• Imagen: Dalle, Midjourney, Stable Diffusion…
- ¿Qué es el Prompt Engineering? ¿Es quizás una de las profesiones del futuro¿
- Usando la API de Open AI para crear nuestros primeros chatbots basados en ChatGPT.
5) Módulo 5: Bases de Datos Big Data
- Introducción a las Bases de datos SQL
- Programación en Python con SQLite
- Bases de datos NoSQL: Clave-Valor, Columnares, Documentales y de Grafos
- Bases de Datos NoSQL Documentales: MongoDB (PyMongo)
6) Módulo 6: Procesamiento Distribuido
- Funcionamiento de un sistema Big Data de Procesamiento Distribuido: Ingestión, Almacenamiento, Gestión de Recursos, Cálculo Distribuido…
- Hadoop
- Introducción a Spark: pySpark y DataFrame API
- Machine Learning con Spark ML
- PySpark Pandas
7) Módulo 7: TFM (Opcional)
- El alumno presentará una propuesta de proyecto de en el que se utilicen tecnologías Big Data y lenguaje de Python para resolver un caso de negocio al docente.
- Una vez aprobada la propuesta el alumno lo realizará
- Al entregarlo el docente dará su feedback y si este es positivo el alumno tendrá una mención especial en su diploma y prioridad en nuestra bolsa de empleo.
Recibirás:
• Máster en Big Data Science
• Iniciación a GNU/Linux
• Desarrollo en Python avanzado
• Análisis de datos y visualización con Python
• Big Data Avanzado
• Iniciación al Machine Learning
No son necesarios requisitos académicos previos
Conocer el funcionamiento de un sistema Big Data
Información Adicional
• Prácticas en empresa
Colaboramos con cientos de empresas especializadas para que nuestros alumnos realicen prácticas (garantizadas)
• Bolsa de Empleo
Grupo Atrium es Agencia de Colocación de la Comunidad de Madrid, Además nuestros alumnos pasas a formar parte de nuestra bolsa de empleo y tienen acceso a talleres de búsqueda activa de empleo
• Metodología_Online con clases en directo
• Salidas Laborales_
• Trabajar como Data Engineer, Data Analyst o Data Scientist especializado en Big Data.
• Actuar como Ingeniero de Software y programador en proyectos de ingeniería y consultoría relacionados con el dato.
• Ser arquitecto y administrador de sistemas Big Data.
• Liderar proyectos de datos como experto en Big Data