Ir al contenido principal

Big Data
La inscripción en este curso es sólo por invitación

Aprende cómo se almacenan y procesan grandes volúmenes de datos a grandes velocidades
La inscripción en este curso es sólo por invitación

Acerca del curso

Tercer módulo del programa de formación Machine Learning & Data Science, en el que se introducirán las herramientas y conocimiento para desarrollar soluciones computacionales que involucren el almacenamiento, procesamiento y acceso a grandes volumenes de datos, generados a velocidades vertiginosas y en diversos formatos.

Contenido del curso

En el transcurso del curso se realizarán las siguientes unidades temáticas:

Unidad 1 - Introducción a Big Data

  • ¿Qué es Big Data?
  • Motores de Bases de Datos Relacionales Big Data
  • Conceptos de SQL

Unidad 2 - Bases NoSQL columnares

  • Cassandra
  • Infraestructura
  • Modelo CAP

Unidad 3 - Bases NoSQL documentales

  • MongoDB
  • Diccionarios y Mappings
  • Modelo de procesamiento Map-Reduce

Unidad 4 - Procesamiento distribuido I

  • Procesamiento distribuido
  • Dask
  • Procesamiento de memoria

Unidad 5 - Procesamiento distribuido II

  • DAGs
  • PySpark

Docente


Profesor Fabio

Jorge Eliecer Camargo, PhD

Profesor del Departamento de Ingeniería de Sistemas e Industrial de la Universidad Nacional de Colombia, Sede Bogotá. Cuenta con más de 60 publicaciones científicas en revistas, libros y conferencias internacionales relacionadas con el manejo de grandes volúmenes de datos (big data) y aplicaciones de machine learning en imágenes, audio y texto. Actualmente es líder del grupo de investigación en ciberseguridad UnSecureLab.

La inscripción en este curso es sólo por invitación