About this course

O Cloudera Administrator for Apache Hadoop (CAAH) é um treinamento de 32 horas dividido em 4 dias de 8 horas cada que capacita profissionais de TI e de desenvolvimento a utilizar o Hadoop e todas as suas principais features de armazenamento (HDFS) e processamento de informações (MapReduce) em larga escala.

Como é o programa completo do curso?

  • Introdução
  • A caso do Apache Hadoop
  • HDFS
  • Colocando dados no HDFS
  • MapReduce
  • Planejando o seu Cluster Hadoop
  • Instalação do Hadoop e configuração inicial
  • Instalação e configuração do Hive, Impala e Pig
  • Clientes Hadoop
  • Cloudera Manager
  • Configuração avançada de cluster
  • Segurança do Hadoop
  • Gerenciando e agendando Jobs
  • Manutenção de Cluster
  • Monitoramento de Cluster e Troubleshooting
  • Conclusão

O que vou aprender?

  • Como o Hadoop Distributed File System e o MapReduce funcionam.
  • Que configurações de hardware são necessárias para o Hadoop Cluster
  • Que considerações de rede levar em consideração ao construir o seu cluster
  • Como configurar as opções do Hadoop para a melhor performance do cluster
  • Como configurar Alta Disponibilidade no Namenode
  • Como configurar o FairScheduler para prover SLA para múltiplos usuários de um cluster
  • Como instalar e implementar segurança baseada em Kerberos para o seu cluster
  • Como manter e monitorar o seu cluster
  • Como carregar dados no cluster a partir de arquivos dinamicamente gerados usando Flume e de bancos de dados relacionais usando Sqoop
  • Que outras características de administração existem para outros projetos Hadoop como Hive, Pig e HBase