Menú
¡Llama gratis! 900 264 357

Curso de big data: arquitectura y análisis de datos del centro TOKIO

Programa de Curso de big data: arquitectura y análisis de datos

Modalidad: Online , Presencial , Semi-presencial
Duración 300 horas
Localización: A Coruña , Álava/Araba , Albacete y otros lugares

Descripción

Con este curso podrás obtener la certificación de Data Science de la mano de IBM. Estarás preparado para trabajar como arquitecto de datos, data scientist, data consultant o big data developer.

Con el curso incursionarás en mundo de la programación, conocerás su ecosistema y cómo utilizarlo para la resolución de problemas, aprenderás a visualizar los datos de una manera correcta para conseguir una clara interpretación de los mismos, conocerás y pondrás en práctica las diferentes técnicas para la explotación de datos y prepararás proyectos orientados al Big Data incluyendo elementos fundamentales… Para todo ello utilizarás Databricks y trabajarás con Python, Spark, SQL, Hadoop… También te enseñaremos algunos algoritmos del Machine Learning.

A quién va dirigido

Personas que deseen especializarse en big data.

Objetivos

  • Incursionar en el mundo de la programación.
  • Conocer el ecosistema Big Data y aprender a usarlo para la resolución de problemas.
  • Aprender a visualizar correctamente los datos para realizar una interpretación de los mismos.
  • Dominar las técnicas para la explotación de datos.
  • Preparar proyectos orientados al Big Data incluyendo los elementos fundamentales​.

Temario

Big Data: arquitectura y análisis de datos

Módulo 1: introducción al Big Data

Ecosistema Big Data

Definición de componentes y arquitectura

Disponibilidad, Escalabilidad y Resiliencia

Introducción a Hadoop y MapReduce

Estrategias Basadas en Datos

Cuadros de Mando (Dashboards)

Business Intelligence vs Big Data

Entornos de procesamiento

Cloud Computing

Internet de las Cosas (IoT)

Casos de uso de Big Data: ejemplos en la industria

Módulo 2: El dato y su ciclo de vida

Datos

El Dato

Calidad del dato

Derechos sobre los datos

Ciclo de vida del dato

Fuentes de datos

Adquisición de datos

Tratamiento, Carga y procesamiento

Almacenamiento de datos

Análisis para la explotación

Visualización y Storytelling para la explotación

La selección de los elementos visuales

Toma de decisiones

Módulo 3: Almacenamiento escalable de datos

Sistemas distribuidos (Hadoop) 

Bases de datos no estructuradas (MongoDB)

Bases de datos de grafos (Neo4j o Spark graph x)

Módulo 4: Arquitectura Big Data

El ecosistema Hadoop

Introducción a Hadoop

Herramientas del ecosistema Hadoop

Cluster y sistemas distribuidos (HDFS, MapReduce)

Análisis de datos con Hive y Pig

Procesamiento de datos con Spark

Spark RDD (Resilient Distributed Datsets)

Spark Streaming

Spark SQL

Módulo 5: Análisis para la exportación de dato

Perfiles de datos

Científicos de datos

Ingeniero de datos

Análisis Exploratorio de datos

Estadística descriptiva

Distribución de los datos

Exploración de datos categóricos y binarios

Correlación

Exploración de 2 o más variables

Técnicas de muestreo de datos

Selección aleatoria

Selección Bias

Selección por distribución estadística

Contraste de hipótesis

Testeo de muestras A/B

Testeo de hipótesis

Significancia estadística y P-value

P-Value

Regresión y Predicción

Regresión Linear

Regresión Multilineal

Interpretar los resultados de una regresión

Predecir usando regresión

Aprendizaje Supervisado

Conceptos

Algoritmos: Arboles de decisión

Aprendizaje No supervisado

Componentes principales

Algoritmos: K-Means, Clusters Jerárquicos

Introducción al Deep Learning

Conceptos fundamentales

Redes Neuronales

Módulo 6: Presentación proyectos Big Data y storytelling

Presentación de un proyecto big data

La importancia del contexto

La audiencia y su importancia

Componentes para la presentación de un proyecto Big Data

Ideas de diseño

Apache Hadoop

Módulo 1. Introducción al Big Data

Conceptos básicos

Definición y conceptos

Evolución de los datos

SQL vs NoSQL

Preparación entorno de trabajo

Módulo 2. Apache Hadoop (HDFS)

Conceptos básicos y arquitectura

Conceptos fundamentales

Arquitectura Hadoop

Lectura, escritura y replicación

Permisos y borrado de datos

Safemode, snapshots y gestión de caché

Profundizando con la shell

Módulo 3. Map Reduce & Yarn

Map reduce: el algoritmo

Arquitectura

Configuración

Implementación de algoritmos map reduce

Maneras de ejecutar el algoritmo

YARN: Arquitectura, gestión de colas y Zookeeper

Módulo 4. Ecosistema Hadoop

Apache Hive

Arquitectura

Componentes

Apache Sqoop

Arquitectura

Componentes

Apache Pig

Arquitectura

Componentes

Pig Latin

Apache Spark

Arquitectura

Componentes

Tipos de datos

Integración con Hive

Reporting con Zeppelin

La importancia del reporting

Creación de reportes con Zeppelin

 

Business Intelligence

Módulo 1. Introducción al BI

Historia y evolución del BI

¿Qué es el BI?

Componentes BI.

Fuentes de información

Conceptos Básicos BI.

Herramientas/procesos básicos BI.

Modelado de datos

Modelo en estrella

Modelo copo de nieve

Modelo multidimensional

Aprovisionamiento de datos

Datawarehouse

Datamart

Principales diferencias

Módulo 2. ETL e introducción a la visualización

Procesos de extracción transformación y cargas y herramientas

Diseño de proceso ETL.

Principales herramientas del mercado y particularidades

Introducción a la visualización

Introducción a la visualización de la información

Beneficios de la visualización

Categorías de la visualización

Herramientas y particularidades

Principales herramientas del mercado y comparativa

Módulo 3. Introducción al power BI

Comprensión básica de PowerBI

¿Qué es?

¿Para qué sirve?

Interfaz

Conexión a orígenes de datos

Editor Power Query

Formateo de datos

Detección de errores

Pivot

Creación de gráficos

Construcción de informe con filtros

 Vinculación y desvinculación en gráficos

Introducción a DAX (Data Analysis Expressions)

Introducción a DAX

Tablas y columnas calculadas, medidas simples

Filtrado de filas y medidas avanzadas

Creación de métricas y gráficos avanzados

Módulo 4. Introducción a Tableau: Visualización

Tableau I

Comprensión básica de Tableau

Conexión a fuente/base de datos

Combinación de datos

Editar y guardar fuente de datos

Dimensiónes y métricas

Tableau II

Conversión tipo de datos

Representación gráfica de los datos

Filtrado de informes y características

Creación Jerarquías y drill down

Tableau III

Creación campos calculados. (medidas y dimensiones)

Creación de parámetros

Combinación campos calculados y parámetros

Descripciones emergentes

Módulo 5. Tableau avanzado: Visualización II

Tableau Avanzado I

Creación de grupos

Creación de conjuntos

Expresiones LOD

Tableau Avanzado II

Creación de dashboard

Objetos dashboard

Fomatos Dashboard

Interactividad Dashboard

Tableau Avanzado III

Extensiones Tableau

Configuración Extensión

Gráficos no nativos 

Movilidad y colaboración

Creación de historias

Adaptación de informes para móvil y Tablet 

Titulación obtenida

Finalizada la formación recibirás:

  • Diploma del Curso de Big Data.
  • Diploma del idioma elegido.

Requisitos

Para acceder a la formación, no es necesario que el aspirante posea conocimientos previos en el sector, ni una titulación específica.

Información Adicional

Nuestros cursos no tienen una fecha de inicio y fin. Con el programa formativo 100% online de Tokio, tú decides tus ritmos, circunstancias y capacidades y nosotros te seguimos. El nuestro es un aprendizaje “hecho a medida”.

Contacta ahora con el centro

Junglebox S.L. (Responsable) tratará tus datos personales con la finalidad de gestionar el envío de solicitudes de información requeridas y el envío de comunicaciones promocionales sobre formación, derivadas de tu consentimiento. Podrás ejercer tus derechos de acceso, supresión rectificación, limitación, portabilidad y otros derechos, según lo indicado en nuestra P. de Privacidad​