Obtener datos, extraer información de ellos, identificar patrones y predecir resultados, haciendo uso de la “Analítica de Datos” y las técnicas de “Aprendizaje de Máquinas”, genera diferentes ventajas para la organización, por ese motivo los profesionales con conocimientos en esté ámbito son ampliamente solicitados.
Durante el curso, aprenderás a usar estrategias de aprendizaje de forma autónoma para su aplicación en las tecnologías de Aprendizaje de Máquinas, utilizando Python el lenguaje de programación más utilizado para este fin. Los contenidos se impartirán bajo una modalidad flexible, con numerosos recursos que facilitan el aprendizaje, y en contacto continuo e individualizado con el equipo docente, formado por profesores que son también profesionales en activo del sector.
Personas interesadas en adquirir, mejorar o actualizar sus conocimientos en el área.
LOS DATOS, FUENTES DE DATOS Y EXTRACCIÓN
Tipos básicos de datos. Tipos de datos compuestos. Fuentes de datos.
TEORÍA DE PROBABILIDADES Y ESTADÍSTICA
Bases de la teoría de la probabilidad. Parámetros centrales, de dispersión y de forma de las variables aleatorias discretas. Distribuciones. Variables aleatorias multidimensionales. Introducción a la estadística. Apéndice. Otras distribuciones.
REPRESENTACIÓN DE DATOS CON SEABORN
Tipos de datos en aprendizaje de máquinas. Repaso de conceptos de Matplotlib. Combinación de funciones de Matplotlib y de Seaborn. Funciones a nivel de ejes y a nivel de figura en Seaborn. Gráficas de dispersión. Gráficas de funciones del tiempo. Agregación y representación de la incertidumbre. Trazado de subconjuntos de datos con mapeos semánticos. Figuras con gráficas múltiples relacionadas con facetas. Datos categóricos. Diagramas de caja usando Seaborn. Representaciones en violín. Diagramas de barra. Representación de la distribución de una variable. Estimación de la densidad del núcleo. Representación de distribuciones de dos variables. Representación de relaciones entre pares de variables. Representación de relaciones entre variables.
PROCESADO DE DATOS
Librerías de interés en preprocesado de datos. La librería Scikit-learn. Limpieza de datos. Normalización y escalado. Extracción y selección de características.
BASES DEL MODELADO DE DATOS Y DEL APRENDIZAJE
Aprendizaje de máquinas. El modelado de los datos. Clasificación de los algoritmos de aprendizaje. Conjuntos de entrenamiento, validación y prueba. Análisis de errores. Función de pérdida. Validación cruzada. Sobreajuste, infraajuste y regularización. Métricas en Scikit-learn. Clases desequilibradas. Matriz de confusión. Tipos de modelos. La librería Scikit-learn en aprendizaje.
ALGORITMOS SUPERVISADOS (I). REGRESIÓN Y MÁQUINAS DE VECTORES SOPORTE
Parte I. Regresión. Parte II. Máquinas de vectores soporte.
APRENDIZAJE SUPERVISADO (II). REDES NEURONALES
Las neuronas biológicas. Aplicaciones de las redes neuronales. Las neuronas artificiales. El perceptrón lineal. Transformación de un problema no lineal en uno lineal. Redes neuronales artificiales. El perceptrón multicapa. Teoría de aproximación universal. Implementación de las redes neuronales con Scikit-learn. Clasificación multiclase (cuatro clases) con perceptrón multicapa.
SISTEMAS DE APRENDIZAJE NO SUPERVISADA: AGRUPAMIENTOS
Tipos de clustering. El algoritmo K-means. El algoritmo kmeans de la librería sklearn. K vecinos más próximos. Variantes del algoritmo básico. DBSCAN. Uso del módulo scipy en clustering.
Título Propio emitido por la Universidad San Jorge, con 6 créditos europeos ECTS.
En estos casos, se expide el título de “Curso Técnico”, en el que se otorgan créditos ECTS.
Información Adicional
Salidas profesionales
Otros cursos