CERTIFICADO DE APROVECHAMIENTO
En Madrid, a 15 de noviembre de 2021
Marc Roset Tomas
del programa JUNIOR SCHOOL, ha finalizado de manera satisfactoria el curso
Modelado de datos con PySpark
del 02 de noviembre de 2021 y 09 de noviembre de 2021
con un total de 20 horas horas.
CONTENIDO DEL PROGRAMA 1.- Introducción y conceptos básicos 2.- Fuentes de datos de Spark y API de bajo nivel: trabajando con RDD 3.- Agregación de datos con pair RDD: RDD avanzados 4.- Trabajo individual: ejercicio sobre análisis de datos no estructurados en Spark 5.- Configuración de aplicaciones Apache Spark 6.- Procesamiento Paralelo en Apache Spark 7.- Persistencia y Linaje en Spark 8.- Acumuladores y variables de broadcast 9.- DataFrames y Apache Spark SQL 10.- Trabajo individual: ejercicio sobre análisis de datos estructurados 11.- Spark Streaming 12.- Bibliotecas de Spark ML 13.- Pipelines y GridSearch 14.- Desarrollo y entrenamiento de modelos en PySpark con la librería ml
|