CERTIFICADO DE APROVECHAMIENTO

 

En Madrid, a 15 de noviembre de 2021

 Marc Roset Tomas

del programa JUNIOR SCHOOL,  ha finalizado de manera satisfactoria el curso

Modelado de datos con PySpark

 del 02 de noviembre de 2021 y 09 de noviembre de 2021 

con un total de 20 horas horas.

DEXS Digital Experience School
Marc Roset Tomas

 

CONTENIDO DEL PROGRAMA

1.- Introducción y conceptos básicos

2.- Fuentes de datos de Spark y API de bajo nivel: trabajando con RDD

3.- Agregación de datos con pair RDD: RDD avanzados

4.- Trabajo individual: ejercicio sobre análisis de datos no estructurados en Spark

5.- Configuración de aplicaciones Apache Spark

6.- Procesamiento Paralelo en Apache Spark

7.- Persistencia y Linaje en Spark

8.- Acumuladores y variables de broadcast 

9.- DataFrames y Apache Spark SQL

10.- Trabajo individual: ejercicio sobre análisis de datos estructurados

11.- Spark Streaming 

12.- Bibliotecas de Spark ML 

13.- Pipelines y GridSearch 

14.- Desarrollo y entrenamiento de modelos en PySpark con la librería ml