Curso Experto en BIG DATA ANALYTICS AND PROCESSING FOUNDATIONS del centro Grupo ATRIUM

Programa de Curso Experto en BIG DATA ANALYTICS AND PROCESSING FOUNDATIONS

Modalidad: Online
Duración 300 HORAS
Precio: 2271.75 €

Facilidades de Financiación. Descuento por pago al contado. Bolsa de Empleo y Prácticas.

Descripción

El manejo de grandes cantidades de información con una compleja velocidad de crecimiento requiere de expertos capaces de gestionar estos datos de forma adecuada.

Con el amplio crecimiento de las tecnologías de la información, el manejo de grandes cantidades de datos se ha convertido en una tarea compleja la cual requiere de un personal altamente capacitado, por esto el curso experto en big data analytics and processing foundations es ideal para formar profesionales capaces de dar respuesta a esta necesidad del mercado.

A quién va dirigido

A todas las personas que deseen adquirir las capacidades técnicas y analíticas necesarias para especializarse en Analítica de Negocio o Big Data.

también aplica para los profesionales en áreas como Tecnología, negocio o departamentos analíticos que necesitan conocer las técnicas y métodos del “business analytics”

Objetivos

1. Uso y gestión de datos en bases de datos relacionales.

2. Conocer funcionamiento y uso de las bd NOSQL en relación a las bases de datos tradicionales.

3. Dominar las habilidades y destrezas necesarias en el lenguaje java, para su posterior aplicación en el desarrollo de programas, así como uso de la interface gráfica, gestión de ficheros y pruebas unitarias, combinadas con la utilización de patrones y buenas prácticas de programación.

4. Conocer y utilizar el lenguaje Python, para su posterior aplicación en el desarrollo de programas, y pruebas unitarias, combinadas con la utilización de patrones y buenas prácticas de programación.

5. Estudia las formas de procesamiento/almacenamiento de datos a gran escala. Ecosistema Hadoop.

6. Reconocerla programación funcional en Scala para su posterior uso en Spark.

7. Aplicar la arquitectura Spak y su impacto en el mundo Big Data. Procesamiento a gran escala con Spark.

Temario

MÓDULO 1: INTRODUCCIÓN SISTEMAS DE INFORMACIÓN

• Introducción. BI y DWH

• Sistemas operativos (LINUX, introducción a DOS y PowerShell)

• Conceptos generales de Linux

• Comandos, variables de entorno y scripts

• Control y planificación de procesos

• Sistemas de almacenamiento y sistemas de ficheros

• Administración Básica de Linux

• Introducción DOS y Powershell

• Técnicas Data Warehousing y SQL

• Conceptos generales Data Warehouse

• Gestor de base de datos.

• Lenguaje de manipulación de datos (DML), sentencias Select, insert, update, delete, merge

• Lenguaje de definición de datos (DDL), sentencias Create, Alter, Drop

• Operadores aritméticos, lógicos, de relación

• Funciones de fila simple, de grupo. Subselects, joins

• ETL, Extracción, Transformación y Carga de datos

• Introduction

• Database Vs Data Warehouse

• Preparacíon de entornos e instalacion

• Principales algoritmos en integracion de datos

• Principales ETL del mercado: (Pentaho, Talend, Qulick..)

• Lectura y escritura de ficheros planos y base de datos

• Uso de las principales funciones (agregación, join, uniones, sorters,..)

• Carga de un modelo de datos

EJERCICIO FINAL DE MÓDULO

MÓDULO 2: BASES DE DATOS NOSQL

• Introducción a las bases de datos NoSQL

• ¿Qué son?

• Tipos de BBDD NoSQL

• Ventajas y desventajas

• Introducción a BBDD NOSQL orientada a documentos (MongoDB)

• CRUD (Create, Read, Update and Delete) y el shell de Mongo DB

• Uso de cursores en MongoDB

• Sharding: distribución de la información en múltiples servidores

• Motores de almacenamiento en MongDb e índices

• Introducción a BBDD NOSQL orientada a grafos (Neo4j)

• Introducción.

• Operaciones y análisis de grafos

• Cypher Query Languaje

EJERCICIO FINAL DE MÓDULO

MÓDULO 3: VISUALIZACIÓN

• La Visualización de Datos

• Cómo desarrollar visualizaciones efectivas

• Recogida de datos y análisis

• Principales herramientas del mercado: Tableau, Qlick Sense, Power BI…

EJERCICIO FINAL DE MÓDULO

MÓDULO 4: PYTHON PARA ANÁLISIS DE DATOS

• Introducción

• Tipos: cadenas, listas, diccionarios, tuplas, etc

• Iteración: Loops e ifs

• Lectura y escritura de ficheros

• Librerías: numpy, matplotlib, pandas, etc

• Introducción a modelos predictivos.

EJERCICIO FINAL DE MÓDULO

MÓDULO 5: HADOOP Y SU ECOSISTEMA

• Apache Hadoop: Introducción

• El sistema de almacenamiento de ficheros HDFS y MapReduce

• Ecosistema Hadoop: hive, sqoop, hue, …

• Arquitectura de un cluster

• Arquitectura Yarn

• Tipos de despliegue Hadoop

• Streaming

• Seguridad

EJERCICIO FINAL DE MÓDULO

MÓDULO 6: SPARK

• Introducción a Apache Spark

• Módulos Spark:

• Spark Sql

• Spark Streaming

• Spark MLlib

• GraphX

• Creación y manejo de RDDs

• Pair RDDs

• Spark vs MapReduce

• HDFS y Spark

• Spark en cluster

• Programación en Spark:

• Spark Java API (Javadoc)

• Spark R API (Roxygen2)

• Scala API

• PySpark Python API

• Introducción a la programación en Scala y PySpark

• Estructuras de control básicas

• Tipos de datos

• Colecciones

• Funciones principales

EJERCICIO FINAL DE MÓDULO

PROYECTO FIN DE MÁSTER

Titulación obtenida

Al finalizar la formación obtendrá el participante el diploma como experto en big data analytics and processing foundations

Requisitos

No es necesaria documentación previa

Información Adicional

El estudiante tendrá acceso a prácticas en empresas y a la bolsa de empleo.

Salidas Laborales

Arquitecto de soluciones Big Data

Administrador y/o desarrollador de sistemas Big Data

Chief Data Officer (CDO).

Machine Learning Engineer.

Business Analyst.

Big Data Consultant.

Analista de datos (Data Analyst)

Big Data Developer.

Big Data Engineer.

Data Scientist.

Data Analyst.

NLP Consultant.

Otros cursos

Ver todos los cursos de Grupo ATRIUM

Contacta ahora con el centro

Nombre

1er Apellido

Teléfono

Código Postal

Fecha de nacimiento

Día

Mes

Año

Acepto la política de privacidad y recibir la información solicitada

Acepto recibir correos electrónicos de aprendemas.com (JungleBox S.L)

Junglebox S.L. (Responsable) tratará tus datos personales con la finalidad de gestionar el envío de solicitudes de información requeridas y el envío de comunicaciones promocionales sobre formación, derivadas de tu consentimiento. Podrás ejercer tus derechos de acceso, supresión rectificación, limitación, portabilidad y otros derechos, según lo indicado en nuestra P. de Privacidad