Diplomado en Big data y cloud computing
Objetivos
Malla académica
Curso Introducción a minería de datos y machine learning
Profesor:
Mauricio Arriagada Benítez, Doctor Pontificia Universidad Católica de Chile
Mauricio Arriagada Benítez, Doctor Pontificia Universidad Católica de Chile
Plan de estudios
Clase en vivo
Un profesor ayudante interactúa directamente con un grupo reducido de participantes para ayudar a resolver problemas técnicos remanentes, como por ejemplo la correcta instalación de herramientas de software y el uso apropiado de algunas herramientas. Asimismo, para la preparación de set de datos para la reducción de dimensionalidad, y guiar el trabajo en las diferentes técnicas de reglas de asociación, algoritmos de clasificación, clustering y medidas de similaridad.
Trabajo individual
Los alumnos deben aplicar los conocimientos aprendidos en tres trabajos o pequeños proyectos concretos. El último proyecto suele tener características integradoras y, por lo tanto, es un poco más largo y completo que los anteriores. Aun cuando el trabajo se entrega en forma individual y no grupal, los alumnos pueden conversar y discutir sobre sus ideas de soluciones con sus compañeros, antes de desarrollar y entregar el proyecto. Los miniproyectos estarán enfocados en: procesar y consolidar datos aplicando ETL (extracción, transformación y carga de datos); utilizar el algoritmo Random Forest y KNN para dos casos propuestos, y realizar el preprocesamiento de una base de datos propuesta, aplicando dos algoritmos de los vistos en clases para así mostrar sus rendimientos a través de evaluar al clasificador y presentar las métricas, pudiendo establecer una comparación de rendimiento entre los dos algoritmos elegidos.
Contenidos
Conceptos sobre Data Warehouse y uso de Dataframes
Procesamiento y consolidación de datos
- Preprocesamiento de datos
- Selección y transformación de datos
Reglas de asociación
Aplicación de los algoritmos Random Forest y KNN
- Árbol de decisión
- KNN
- Random Forest
Aplicación de los algoritmos K-Means y DBSCAN
- Clustering
- K-means
- Clustering jerárquico
Introducción al Machine Learning
- Modelo de entrenamiento
- Métricas de evaluación
Clase Ejecutiva UC se reserva el derecho a modificar el contenido en cualquier momento.
Curso Introducción al cloud computing
Profesor:
Mauricio Gamboa, Ingeniero informático, Inacap, Chile.
Mauricio Gamboa, Ingeniero informático, Inacap, Chile.
Contenidos
Introducción: Qué es cloud computing, características principales, tipos de servicio, tipos de nube
Tecnologías habilitantes (máquinas virtuales, arquitecturas orientadas a servicio, etc.)
Virtualización
Principales plataformas de servicios en la nube: Amazon AWS, Google Cloud y Microsoft Azure
Tipos de servicios en la nube: desde el fierro virtual a los servicios cognitivos
Tipos de almacenamiento en la nube
Aspectos de seguridad
Clase Ejecutiva UC se reserva el derecho a modificar el contenido en cualquier momento.
Curso Servicios cloud para ciencia de datos y machine learning
Profesor:
Stefanni Cavaletto, Magíster UAI (Chile)
Stefanni Cavaletto, Magíster UAI (Chile)
Contenidos
Introducción a Big data y ML
Modelos de Regresión y Clasificación
Preparación de Datos, el pipeline de datos
Manejo de Big Data en la nube
Servicios para ML en Azure
Azure machine learning studio
ML automatizado (Azure AML)
Servicios cognitivos en Azure
AutoML en GCP
Introducción a Vertex AI en GCP
Servicios cognitivos en GCP
Clase Ejecutiva UC se reserva el derecho a modificar el contenido en cualquier momento.
Curso Técnicas de big data para machine learning
Profesor:
Gabriel Sepúlveda, Ph.D (c) Pontificia Universidad Católica de Chile Ver más...
Gabriel Sepúlveda, Ph.D (c) Pontificia Universidad Católica de Chile Ver más...
Plan de estudios
Clase en vivo
Un profesor ayudante interactúa directamente con un grupo reducido de participantes para ayudar a resolver problemas técnicos remanentes, como por ejemplo, relacionados con el uso del ambiente de desarrollo Google Colaboratory, con la instalación de herramientas Hadoop y Spark o con la utilización de la API para el almacenamiento y procesamiento de big data.
Trabajo individual
Los alumnos deben aplicar los conocimientos aprendidos en tres trabajos o pequeños proyectos concretos, los cuales tendrán por objetivo aplicar de forma práctica las técnicas y herramientas para el manejo de big data. En particular, se enfocan en el uso del ecosistema Hadoop, del framework Spark y su biblioteca para machine learning Spark MLLIB, y de herramientas prácticas para visualización de datos. El último proyecto suele tener características integradoras y, por lo tanto, es un poco más largo y completo que los anteriores. Aun cuando el trabajo se entrega en forma individual y no grupal, los alumnos pueden conversar y discutir sobre sus ideas de soluciones con sus compañeros, antes de desarrollar y entregar el proyecto.
Contenidos
Ecosistema Hadoop
- Introducción a big data
- Instalación de herramientas Hadoop
Herramientas de Ecosistema Hadoop
- Hadoop MapReduce
- Apache Hive
- Apache Pig
Apache Spark
- Programación en Apache Spark
Data Analytics con Apache Spark
- Apache Flume
- Spark Streaming
- Spark SQL
Machine Learning con Apache Spark
- Spark MLLIB: algoritmos supervisados
- Spark MLLIB: algoritmos no supervisados
Técnicas de visualización
- Reducción de dimensionalidad
Clase Ejecutiva UC se reserva el derecho a modificar el contenido en cualquier momento.
Jefe de programa

Jaime Navón Cohen
Ph.D University of North Carolina at Chapel Hill (Estados Unidos)
Jaime Navón Cohen es Ph.D Computer Science, University of North Carolina at Chapel Hill (EE.UU.). Además tiene un Master of Science, Technion-Israel Institute of Technology (Israel). Es ingeniero civil electricista, Pontificia Universidad Católica de Chile (UC).
Asimismo, es profesor asociado del Departamento de Ciencia de la Computación de la UC.
Jefe de programa
Profesores

Gabriel Sepúlveda
Ph.D (c) Pontificia Universidad Católica de Chile
Gabriel Sepúlveda es Ph.D (c) en Ciencias de la Ingeniería área Ciencia de la Computación, Pontificia Universidad Católica de Chile (UC). Además, es ingeniero civil electrónico, con mención en Control Automático y Mención Complementaria en Computadores, Universidad Técnica Federico Santa María (Chile). Se desempeña como profesor instructor del Departamento de Ciencia de la Computación, Escuela de Ingeniería de la UC.

Iván Lillo
Doctor Pontificia Universidad Católica de Chile
Iván Lillo es doctor en Ciencias de la Ingeniería, Pontificia Universidad Católica de Chile (UC). Además tiene un Magíster en Ciencias de la Ingeniería, UC, y es ingeniero civil electricista, UC. Se desempeña como profesor instructor del Departamento de Ciencia de la Computación, Escuela de Ingeniería de la UC.

Mauricio Arriagada Benítez
Doctor Pontificia Universidad Católica de Chile
Mauricio Arriagada Benítez es doctor y máster en Ciencias de la Ingeniería, Pontificia Universidad Católica de Chile (UC). También es ingeniero civil en Computación e Informática, Universidad de Tarapacá (Chile). Asimismo, tiene un Master in Computer Science, University of Northern Iowa (EE.UU.), y un Máster en Ingeniería de Software, Universidad de Tarapacá (Chile).

Mauricio Gamboa
Ingeniero informático, Inacap, Chile.
Mauricio Gamboa es ingeniero en Informática y analista programador, Inacap, Chile. Además es consultor en diseño, desarrollo e implementación de aplicaciones en entornos Microsoft, programa que cursó en La Salle Campus Madrid. También cuenta con las certificaciones: Microsoft MVP Business Applications; EMCSE: Data Management and Analytics - Certified 2019; MCSA: SQL 2016; Business Intelligence Development - Certified 2019, y Microsoft Certified Solutions Developer: Web Applications.

Stefanni Cavaletto
Magíster UAI (Chile)
Stefanni Cavaletto tiene un MSc Artificial Intelligence UAI, Chile, y un postítulo de Inteligencia de Negocios, Universidad de Chile. Además, es ingeniera matemática, Universidad de Santiago de Chile. Actualmente es senior customer engineer (ML & AI) en Google. Su línea de investigación es la ciencia de datos. Ha trabajado en diversas industrias en sus 8 años de experiencia, tales como banca, telecomunicaciones, retail y salud, además de Microsoft. Es miembro activo de dos organizaciones sin fines de lucro: Analytics & Python y R-Ladies.
Ventajas


