Ir al contenido principal

Big Data
La inscripción en este curso es sólo por invitación

Aprende cómo se almacenan y procesan grandes volúmenes de datos a grandes velocidades
La inscripción en este curso es sólo por invitación
Logo UNAL

Big Data

INSCRIBIRSE

Acerca de

Contenido

Tercer módulo del programa de formación Machine Learning & Data Science, en el que se introducirán las herramientas y conocimiento para desarrollar soluciones computacionales que involucren el almacenamiento, procesamiento y acceso a grandes volumenes de datos, generados a velocidades vertiginosas y en diversos formatos.

El módulo cubrirá los fundamentos de trabajar con grandes volumenes de datos, cómo manejar el almacentamiento diferentes tipos de bases de datos SQL y NoSQL y a realizar procesamiento distribuido

En el programa de formación en MLDS se asume la educación como un proceso de interacción dinámica centrada en los participantes, donde el rol del profesor, además de proveer su experiencia profesional y los elementos conceptuales, se concentra en ser un dinamizador de las actividades de aprendizaje. Desde esta perspectiva la metodología debe reflejar el enfoque propiciando el desarrollo de las competencias propuestas.

El módulo se impartirá de manera virtual. Para tal fin, los estudiantes contarán con acceso a un sistema de videoconferencia para las sesiones sincrónicas y acceso a una plataforma de aprendizaje autónomo dónde encontrarán una gran cantidad de recursos educativos digitales (REDs) que han sido especialmente diseñados para esta actividad, tales como: videos, imágenes, animaciones, lecturas, notebooks de código pre programado, guías de referencia, etc.

Contenido del curso

En el transcurso del curso se realizarán las siguientes unidades temáticas:

Unidad 1 - Introducción a Big Data

  • ¿Qué es Big Data?
  • Motores de Bases de Datos Relacionales Big Data
  • Conceptos de SQL

Unidad 2 - Bases NoSQL columnares

  • Cassandra
  • Infraestructura
  • Modelo CAP

Unidad 3 - Bases NoSQL documentales

  • MongoDB
  • Diccionarios y Mappings
  • Modelo de procesamiento Map-Reduce

Unidad 4 - Procesamiento distribuido I

  • Procesamiento distribuido
  • Dask
  • Procesamiento de memoria

Unidad 5 - Procesamiento distribuido II

  • DAGs
  • PySpark

INSCRIBIRSE

EQUIPO DOCENTE

Profesor Jorge

Jorge Eliécer Camargo, PhD

Profesor del Departamento de Ingeniería de Sistemas e Industrial de la Universidad Nacional de Colombia, Sede Bogotá. Cuenta con más de 100 publicaciones científicas en revistas, libros y conferencias internacionales relacionadas con el manejo de grandes volúmenes de datos (big data) y aplicaciones de machine learning en imágenes, audio y texto. Actualmente es líder del grupo de investigación en ciberseguridad UnSecureLab.

INSCRIBIRSE

LANDING PAGE

La inscripción en este curso es sólo por invitación