Arquitecto de Big Data

Define, gestiona y analiza grandes volúmenes de información

Un arquitecto Big data es el encargado de definir y analizar los componentes de la arquitectura en un proyecto de implantación de una plataforma de Big Data. Debe definir y casos de uso posibles para esa plataforma e implantar las arquitecturas y soluciones de Big Data y Analytics
Conocer las características básicas de los escenarios Big Data Capacitar para elegir las tecnologías utilizar en cada caso.
Dominar las capacidades básicas de manejo de datos en MongoDB.
Aprender a diseñar el modelo de datos y la infraestructura de una solución Big Data basada en MongoDB.
Conocer el paradigma de programación y los componentes básicos de Spark.
Utilizar el proyecto adecuado del ecosistema Hadoop para alcanzar la mejor solución a un problema. Uso de ecosistemas en Cloud.
Profesionales técnicos con formación en informática, telecomunicaciones o similar.

Informáticos con experiencia en programación orientada a objetos, desarrollo de software y conocimientos en administración de sistemas operativos y bases de datos.

Profesionales de tecnología con experiencia en arquitectura y desarrollo.

Introducción a Apache Hadoop y su Ecositema:

  • Introduccion
  • Almacenamiento
  • Proceso de datos
  • Análisis de Datos

Arquitectura HDFS

  • Almacenamiento y arquitectura HDFS
  • Formatos Apache Hadoop

Gestores de Recursos

  • Cluster en Apache
  • Arquitectura YARN

 

 

Datos Relacionales y Apache Sqoop

  • Introducción
  • Importación y Exportación de datos con Sqoop

Introducción a Apache Spark

  • Tratamiento de datos con RDDs
  • Programación con Apache Spark

Operaciones con RDDs

  • Trabajando con RDDs de clave,valor
  • Paradigma Map-Reduce
  • Transformaciones y acciones sobre RDDs

Aplicaciones Apache Spark

  • Construir y ejecutar aplicaciones Spark (Python, Scala)
  • La consola de Spark: Stages y tareas

Configurando aplicaciones Apache Spark

Procesamiento paralelo en Apache Spark

  • Spark en cluster
  • Ficheros HDFS
  • Particionado de RDDs y operaciones en paralelo

Persistencia y Lineage de RDDs

Algoritmos en Spark

  • Uso de algoritmos de la librería ml de Machine Learning
  • Algoritmos iterativos.
  • Funciones de usuario y broadcast.

Spark DataFrames y Spark SQL

  • SparkSession y SQL
  • Creación y transformación de Spark Dataframes y Datasets.
  • Uso de Apache Impala.
  • Uso de Hive.

Apache Kafka y Proceso de Mensajes

  • Introducción a Kafka
  • Arquitectura cluster y escalado con Apache Kafka.

Apache Flume y proceso de datos en streaming

  • Introducción a Apache Flume
  • Arquitectura de Apache Flume: sources y sinks
  • Configuración y canals.

Apache Flume y Apache Kafka: Integración

  • Configuración.
  • Casos de Uso.

 

 

Apache Spark Streaming

  • Introducción a Apache Spark DStreams
  • Operaciones de multiples batches y sliding Windows

Apache Spark Streaming

  • Fuentes de streaming.

Casos de Uso

  • Las convocatorias se celebran enmodalidad Presencial en horario de tarde con un total de 24 horas lectivas.
  • Una vez inscrito, te enviaremos unaviso recordatorio del comienzo de la convocatoria y la dirección exacta y como llegar a nuestro Centro de Formación en transporte publico.
  • Te haremos entrega de una carpeta, incluyendo un pendrivecon los materiales al comienzo del curso
  • Durante la formación, se realizarán sucesivasprácticas y ejercicios para consolidar los conocimientos adquiridos.
  • Grabaremos todas las sesiones del curso, y las compartiremos a través de un Drive Privado a los alumnos participantesdurante 3 meses tras la finalización del curso.

Una vez finalizada la formación, te haremos entrega de un Certificado del curso emitido por Aula-Center S.L

  • La presente convocatoria también está disponible en modalidad Telepresencial.
  • Una vez inscrito, te enviaremos el acceso a la plataforma clases en directo,y un Drive Privado con toda la información y contenidos.
  • Podrás realizar el curso a través de tu ordenador, móvil o tablet. 
  • Los alumnos deberán conectarse en los mismos horarios que la modalidad Presencial,y disponer de conexión a internet y micrófono.
  • Durante la retransmisión curso,escucharás el discurso del formador en tiempo real, podrás ver la presentación,  realizar ejercicios y consultar tus dudas al momento durante el curso. 
  • Grabaremos todas las sesiones del curso, y las compartiremos a través de un Drive Privado a los alumnos participantes durante 3 meses tras la finalización del curso.

Una vez finalizada la formación, te enviaremos un Certificado del curso emitido por Aula-Center S.L

  • Fecha de inicio: 29 de Septiembre
  • Fin de Curso: 2 de Diciembre
  • Horario: Viernes de 16-21 horas y Sábado de 9-14 horas

Precio: 1525€ IVA Inc 

Duración:  100 Horas

Formulario de Contacto

Localización:

El curso se impartirá en Aula-Center. Calle Ferrer del Rio 35, junto al metro Diego de León

grabacion de clases

Grabación de todas las sesiones del curso

Estarán a disposición de los alumnos durante 3 meses tras la finalización del curso.

clases reducidas

Grupos Reducidos:

Máximo 8 alumnos por clase

aula informatizada

Curso Presencial en Madrid en Horario de Tarde:

Dispondrás de un aula informatizada para realizar la formación durante los horarios del curso. 

certificado Aula Center

Certificado de formación oficial emitido por Aula-Center S.L.

Al finalizar la formación, se hará entrega del Certificado del curso para asegurarte un mejor empleo.

Fundacion Estatal

Somos Entidad Organizadora de la Fundación Estatal para el empleo