×Revisa nuestra última campaña de Plan de Formación aquí.

IFCD0043

Cloudera data analyst training

Identificar el ecosistema y los retos de código abierto de herramientas Big Data y aplicar Apache Hive y Apache Impala combinando los datasets con el uso de JOIN o UNION.

Diseñado y producido por Smartmind

Descatalogado

Contenidos de la especialidad formativa

IFCD0043 — Cloudera data analyst training

Módulo 1

Fundamentos de Hadoop, descripción y consultas en Hive e Impala

Objetivo. Definir las características generales de Hadoop, en almacenamientos, gestión y consulta de datos con las herramientas Hive e Impala. CONOCIMIENTOS / CAPACIDADES COGNITIVAS Y PRÁCTICAS

Contenidos: 0

HABILIDADES DE GESTIÓN, PERSONALES Y SOCIALES

Interés por la innovación tecnológica y a la formación en línea, siendo consciente de sus utilidades y de la necesidad de actualización permanente

Módulo 2

Operadores comunes, funciones integradas, administración, almacenamiento y rendimiento de los datos

Objetivo. Enumerar los operadores y funciones integradas en el sistema, elaborando bases de datos para la gestión y el tratamiento completo de los datos cargados. CONOCIMIENTOS / CAPACIDADES COGNITIVAS Y PRÁCTICAS

Contenidos: 0

HABILIDADES DE GESTIÓN, PERSONALES Y SOCIALES

Interés por las bases de datos y adquisición de técncas y habilidadades para la gestión y administración.

Módulo 3

Múltiples datasets, funciones analíticas y de ventana, gestión de datos complejos

Objetivo. Formular consultas en las que intervienen múltiples datasets, aplicando funciones analíticas y de ventanas a los datos, mediante las herramientas Hive e Impala y el manejo de grupos de datos complejos CONOCIMIENTOS / CAPACIDADES COGNITIVAS Y PRÁCTICAS

Contenidos: 0

HABILIDADES DE GESTIÓN, PERSONALES Y SOCIALES

Coordinación y responsabilidad a la hora de aplicar funciones analíticas y de ventanas a los datos.

Módulo 4

Análisis de textos, optimización y extensiones de Hive e Impala

Objetivo. Sintetizar expresiones regulares para un análisis de textos, aplicando factores de optimización a Hive e Impala y la mejora de su rendimiento en las consultas, extendiendo el funcionamiento de dichas herramientas para el incremento de su eficacia. CONOCIMIENTOS / CAPACIDADES COGNITIVAS Y PRÁCTICAS

Contenidos: 0

HABILIDADES DE GESTIÓN, PERSONALES Y SOCIALES

Implicación en la sintetización de expresiones regulares para realizar un análisis de textos.

Rigor en la aplicación de factores de optimización a Hive e Impala para la mejora del rendimiento en las consultas.

Módulo 5

Selección de opciones. Introducción a Apache Kudu

Objetivo. Seleccionar la opción idonea para realizar una buena gestión de los datos analizados, integrando Apache Kudu en el marco de la herramienta Impala. CONOCIMIENTOS / CAPACIDADES COGNITIVAS Y PRÁCTICAS

Contenidos: 0

HABILIDADES DE GESTIÓN, PERSONALES Y SOCIALES

Coordinación con el resto del equipo que interviene en la gestión, seguimiento y evaluación de la formación y interés por por la integración de Apache Kudu en el marco de la herramienta Impala.