About this course

O Cloudera Data Analyst with Hive, Pig and Impala é um treinamento de 32 horas dividido em 4 dias de 8 horas cada que capacita profissionais de TI e de desenvolvimento a utilizar o Hive, Pig e Impala como soluções de Big Data para análise de dados.

Como é o programa completo do curso?

  • Introdução;
  • Fundamentos do Hadoop;
  • Introdução ao Pig;
  • Análise de dados básica com o Pig;
  • Processando dados complexos com o Pig;
  • Operações em múltiplos datasets com o Pig;
  • Extensões do Pig;
  • Resolução de problemas e otimização do Pig;
  • Introdução ao Hive;
  • Análise de dados com o Hive;
  • Gerenciamento de Dados com o Hive;
  • Processamento de texto com o Hive;
  • Otimização do Hive;
  • Extensões para o Hive;
  • Introdução ao Impala;
  • Analisando dados com Impala;
  • Escolhendo a melhor ferramenta para cada tarefa;
  • Conclusão.

O que vou aprender?

  • Informações fundamentais sobre Apache Hadoop e ETL (Extrair, Transformar e Carregar), ingestão de dados e processamento com as ferramentas Hadoop;
  • Fazer joins em múltiplos datasets, e analisar dados estruturados ou não-estruturados com Pig;
  • Organizando dados em tabelas, fazer transformações e simplificar consultas complexas com o Hive;
  • Performar análise interativa em tempo real em datasets massivos armazenados em HDFS ou HBase usando SQL com o Impala; Como escolher a melhor ferramenta para cada tarefa com o Hadoop.