Con el curso incursionarás en mundo de la programación, conocerás su ecosistema y cómo utilizarlo para la resolución de problemas, aprenderás a visualizar los datos de una manera correcta para conseguir una clara interpretación de los mismos, conocerás y pondrás en práctica las diferentes técnicas para la explotación de datos y prepararás proyectos orientados al Big Data incluyendo elementos fundamentales… Para todo ello utilizarás Databricks y trabajarás con Python, Spark, SQL, Hadoop… También te enseñaremos algunos algoritmos del Machine Learning.
Personas que deseen especializarse en big data.
Big Data: arquitectura y análisis de datos
Módulo 1: introducción al Big Data
Ecosistema Big Data
Definición de componentes y arquitectura
Disponibilidad, Escalabilidad y Resiliencia
Introducción a Hadoop y MapReduce
Estrategias Basadas en Datos
Cuadros de Mando (Dashboards)
Business Intelligence vs Big Data
Entornos de procesamiento
Cloud Computing
Internet de las Cosas (IoT)
Casos de uso de Big Data: ejemplos en la industria
Módulo 2: El dato y su ciclo de vida
Datos
El Dato
Calidad del dato
Derechos sobre los datos
Ciclo de vida del dato
Fuentes de datos
Adquisición de datos
Tratamiento, Carga y procesamiento
Almacenamiento de datos
Análisis para la explotación
Visualización y Storytelling para la explotación
La selección de los elementos visuales
Toma de decisiones
Módulo 3: Almacenamiento escalable de datos
Sistemas distribuidos (Hadoop)
Bases de datos no estructuradas (MongoDB)
Bases de datos de grafos (Neo4j o Spark graph x)
Módulo 4: Arquitectura Big Data
El ecosistema Hadoop
Introducción a Hadoop
Herramientas del ecosistema Hadoop
Cluster y sistemas distribuidos (HDFS, MapReduce)
Análisis de datos con Hive y Pig
Procesamiento de datos con Spark
Spark RDD (Resilient Distributed Datsets)
Spark Streaming
Spark SQL
Módulo 5: Análisis para la exportación de dato
Perfiles de datos
Científicos de datos
Ingeniero de datos
Análisis Exploratorio de datos
Estadística descriptiva
Distribución de los datos
Exploración de datos categóricos y binarios
Correlación
Exploración de 2 o más variables
Técnicas de muestreo de datos
Selección aleatoria
Selección Bias
Selección por distribución estadística
Contraste de hipótesis
Testeo de muestras A/B
Testeo de hipótesis
Significancia estadística y P-value
P-Value
Regresión y Predicción
Regresión Linear
Regresión Multilineal
Interpretar los resultados de una regresión
Predecir usando regresión
Aprendizaje Supervisado
Conceptos
Algoritmos: Arboles de decisión
Aprendizaje No supervisado
Componentes principales
Algoritmos: K-Means, Clusters Jerárquicos
Introducción al Deep Learning
Conceptos fundamentales
Redes Neuronales
Módulo 6: Presentación proyectos Big Data y storytelling
Presentación de un proyecto big data
La importancia del contexto
La audiencia y su importancia
Componentes para la presentación de un proyecto Big Data
Ideas de diseño
Apache Hadoop
Módulo 1. Introducción al Big Data
Conceptos básicos
Definición y conceptos
Evolución de los datos
SQL vs NoSQL
Preparación entorno de trabajo
Módulo 2. Apache Hadoop (HDFS)
Conceptos básicos y arquitectura
Conceptos fundamentales
Arquitectura Hadoop
Lectura, escritura y replicación
Permisos y borrado de datos
Safemode, snapshots y gestión de caché
Profundizando con la shell
Módulo 3. Map Reduce & Yarn
Map reduce: el algoritmo
Arquitectura
Configuración
Implementación de algoritmos map reduce
Maneras de ejecutar el algoritmo
YARN: Arquitectura, gestión de colas y Zookeeper
Módulo 4. Ecosistema Hadoop
Apache Hive
Arquitectura
Componentes
Apache Sqoop
Arquitectura
Componentes
Apache Pig
Arquitectura
Componentes
Pig Latin
Apache Spark
Arquitectura
Componentes
Tipos de datos
Integración con Hive
Reporting con Zeppelin
La importancia del reporting
Creación de reportes con Zeppelin
Business Intelligence
Módulo 1. Introducción al BI
Historia y evolución del BI
¿Qué es el BI?
Componentes BI.
Fuentes de información
Conceptos Básicos BI.
Herramientas/procesos básicos BI.
Modelado de datos
Modelo en estrella
Modelo copo de nieve
Modelo multidimensional
Aprovisionamiento de datos
Datawarehouse
Datamart
Principales diferencias
Módulo 2. ETL e introducción a la visualización
Procesos de extracción transformación y cargas y herramientas
Diseño de proceso ETL.
Principales herramientas del mercado y particularidades
Introducción a la visualización
Introducción a la visualización de la información
Beneficios de la visualización
Categorías de la visualización
Herramientas y particularidades
Principales herramientas del mercado y comparativa
Módulo 3. Introducción al power BI
Comprensión básica de PowerBI
¿Qué es?
¿Para qué sirve?
Interfaz
Conexión a orígenes de datos
Editor Power Query
Formateo de datos
Detección de errores
Pivot
Creación de gráficos
Construcción de informe con filtros
Vinculación y desvinculación en gráficos
Introducción a DAX (Data Analysis Expressions)
Introducción a DAX
Tablas y columnas calculadas, medidas simples
Filtrado de filas y medidas avanzadas
Creación de métricas y gráficos avanzados
Módulo 4. Introducción a Tableau: Visualización
Tableau I
Comprensión básica de Tableau
Conexión a fuente/base de datos
Combinación de datos
Editar y guardar fuente de datos
Dimensiónes y métricas
Tableau II
Conversión tipo de datos
Representación gráfica de los datos
Filtrado de informes y características
Creación Jerarquías y drill down
Tableau III
Creación campos calculados. (medidas y dimensiones)
Creación de parámetros
Combinación campos calculados y parámetros
Descripciones emergentes
Módulo 5. Tableau avanzado: Visualización II
Tableau Avanzado I
Creación de grupos
Creación de conjuntos
Expresiones LOD
Tableau Avanzado II
Creación de dashboard
Objetos dashboard
Fomatos Dashboard
Interactividad Dashboard
Tableau Avanzado III
Extensiones Tableau
Configuración Extensión
Gráficos no nativos
Movilidad y colaboración
Creación de historias
Adaptación de informes para móvil y Tablet
Finalizada la formación recibirás:
Para acceder a la formación, no es necesario que el aspirante posea conocimientos previos en el sector, ni una titulación específica.
Información Adicional
Nuestros cursos no tienen una fecha de inicio y fin. Con el programa formativo 100% online de Tokio, tú decides tus ritmos, circunstancias y capacidades y nosotros te seguimos. El nuestro es un aprendizaje “hecho a medida”.