Ir al contenido principal

Big Data
La inscripción en este curso es sólo por invitación

Curso del tercer módulo del programa de formación virtual "Machine Learning and Data Science" de la Universidad Nacional de Colombia. En este curso se introducirá de forma práctica las tecnologías Big Data para el almacenamiento y procesamiento de grandes volúmenes de datos.
La inscripción en este curso es sólo por invitación

Acerca del curso

Tercer módulo del programa de formación Machine Learning & Data Science, en el que se introducirán las herramientas y conocimiento para desarrollar soluciones computacionales que involucren el almacenamiento, procesamiento y acceso a grandes volumenes de datos, generados a velocidades vertiginosas y en diversos formatos.

Puedes obtener más información acerca del curso en nuestra landing page

Contenido del curso

En el transcurso del curso se realizarán las siguientes unidades temáticas:

Unidad 1 - Introducción a Big Data

  • ¿Qué es Big Data?
  • Motores de Bases de Datos Relacionales Big Data
  • Conceptos de SQL

Unidad 2 - Bases NoSQL columnares

  • Cassandra
  • Infraestructura
  • Modelo CAP

Unidad 3 - Bases NoSQL documentales

  • MongoDB
  • Diccionarios y Mappings
  • Modelo de procesamiento Map-Reduce

Unidad 4 - Procesamiento distribuido I

  • Procesamiento distribuido
  • Dask
  • Procesamiento de memoria

Unidad 5 - Procesamiento distribuido II

  • DAGs
  • PySpark

Docente


Profesor Fabio

Jorge Eliecer Camargo, PhD

Profesor del Departamento de Ingeniería de Sistemas e Industrial de la Universidad Nacional de Colombia, Sede Bogotá. Cuenta con más de 60 publicaciones científicas en revistas, libros y conferencias internacionales relacionadas con el manejo de grandes volúmenes de datos (big data) y aplicaciones de machine learning en imágenes, audio y texto. Actualmente es líder del grupo de investigación en ciberseguridad UnSecureLab.

La inscripción en este curso es sólo por invitación