60HORAS |
Diseñado y producido por Smartmind
Contenidos de la especialidad formativa
Objetivo. Definir las características generales de Hadoop, en almacenamientos, gestión y consulta de datos con las herramientas Hive e Impala. CONOCIMIENTOS / CAPACIDADES COGNITIVAS Y PRÁCTICAS
Contenidos: 3
Descripción de los Fundamentos Hadoop
Identificación de Hadoop
Aspectos generales de Hadoop
Almacenamiento de datos: HDFS
Procesamiento de datos distribuidos: YARN, MapReduce, y Spark
Procesamiento y análisis de datos: Hive, e Impala
Integración de datos: Sqoop
Otras herramientas de datos de Hadoop
Explicación del escenario con ejercicios
Explicación de Hive e Impala
Definción de Hive
Definción de Impala
Descripción de Hive e Impala
Schema y almacenamiento de datos
Comparación entre Hive y las bases de datos tradicionales
Casos de utilización
Aplicación de Hive e Impala
Tablas y bases de datos
Sintaxis básica en consultas Hive e Impala
Tipos de datos
Hue para ejecutar consultas
Beeline (la Shell de Hive)
Shell de Impala
Interés por la innovación tecnológica y a la formación en línea, siendo consciente de sus utilidades y de la necesidad de actualización permanente
Objetivo. Enumerar los operadores y funciones integradas en el sistema, elaborando bases de datos para la gestión y el tratamiento completo de los datos cargados. CONOCIMIENTOS / CAPACIDADES COGNITIVAS Y PRÁCTICAS
Contenidos: 3
Definición de operadores comunes y funciones integradas
Operadores
Funciones escalares
Funciones de agregación
Indicación de la administración de datos
Almacenamiento de datos
Creación de bases de datos y tablas
Carga de datos
Alteración de bases de datos y tablas
Simplificación de consultas con vistas
Almacenamiento de resultados de consultas
Síntesis sobre el Almacenamiento de datos y rendimiento
Partición de tablas
Carga de datos en tablas particionadas
Cuando utilizar las particiones
Elección del formato de archivo
Utilización de los formatos de archivo Avro y Parquet
Interés por las bases de datos y adquisición de técncas y habilidadades para la gestión y administración.
Objetivo. Formular consultas en las que intervienen múltiples datasets, aplicando funciones analíticas y de ventanas a los datos, mediante las herramientas Hive e Impala y el manejo de grupos de datos complejos CONOCIMIENTOS / CAPACIDADES COGNITIVAS Y PRÁCTICAS
Contenidos: 3
Aplicación de múltiples Datasets
UNION y Joins
Manejo de valores NULL en Joins
Joins avanzados
Utilización de Funciones analíticas y funciones de ventana
Utilización de funciones analíticas comunes
Otras funciones analíticas
Ventanas deslizantes
Gestión de Datos complejos
Datos complejos con Hive
Datos complejos con Impala
Coordinación y responsabilidad a la hora de aplicar funciones analíticas y de ventanas a los datos.
Objetivo. Sintetizar expresiones regulares para un análisis de textos, aplicando factores de optimización a Hive e Impala y la mejora de su rendimiento en las consultas, extendiendo el funcionamiento de dichas herramientas para el incremento de su eficacia. CONOCIMIENTOS / CAPACIDADES COGNITIVAS Y PRÁCTICAS
Contenidos: 4
Aplicación del Análisis de texto
Expresiones regulares
Procesamiento de texto con SerDes en Hive
Análisis de Sentimiento y n-grams
Utilización de Optimización Hive
Rendimiento de las consultas
Bucketing
Indexación de datos
Hive con Spark
Gestión de Optimización de Impala
Ejecución de consultas
Mejorar el rendimiento de Impala
Formulación de preguntas sobre Hive e Impala
Customizar SerDes y formatos de archivo en Hive
Transformación de datos con Scripts personalizados en Hive
Funciones definidas por el usuario
Consultas parametrizadas
Implicación en la sintetización de expresiones regulares para realizar un análisis de textos.
Rigor en la aplicación de factores de optimización a Hive e Impala para la mejora del rendimiento en las consultas.
Objetivo. Seleccionar la opción idonea para realizar una buena gestión de los datos analizados, integrando Apache Kudu en el marco de la herramienta Impala. CONOCIMIENTOS / CAPACIDADES COGNITIVAS Y PRÁCTICAS
Contenidos: 2
Resumen de la mejor opción
Comparación entre MapReduce, Hive, Impala y bases de datos relacionales
Síntesis de Apache Kudu
Descripción de Kudu
Tablas Kudu
Uso de Impala con Kudu
Coordinación con el resto del equipo que interviene en la gestión, seguimiento y evaluación de la formación y interés por por la integración de Apache Kudu en el marco de la herramienta Impala.

Selecciona tu perfil para continuar:
Actualmente atendemos a los usuarios particulares desde nuestra web.
Ver cursos para particulares