About this course

O : Developer for Apache Hadoop & Spark I é um treinamento de 32 horas dividido em 4 dias de 8 horas cada que capacita profissionais de TI e de desenvolvimento a utilizar o Hadoop e todas as suas principais features de armazenamento (HDFS) e processamento de informações (Apache Spark) em larga escala.

Como é o programa completo do curso?

  • Introdução
  • A motivação pelo Hadoop
  • Conceitos Básicos para se escrever um programa Spark
  • Testando Programas Spark
  • Conhecendo profundamente a API do Spark
  • Dicas práticas de desenvolvimento e técnicas
  • Entrada e saída de dados
  • Algoritmos comuns de Spark
  • Fazendo Joins em Conjuntos de Dados em Spark e Spark SQL
  • Integrando o Spark no workflow da empresa
  • Machine Learning e Spark
  • Introdução ao Hive e Impala
  • Conclusão

O que eu vou aprender?

  • As tecnologias core do Hadoop
  • Como o Hadoop Distributed File System e o Spark funcionam
  • Como desenvolver aplicativos Spark
  • Como fazer testes em aplicações Spark
  • Melhores práticas para desenvolver e fazer debug de aplicativos Spark
  • Como implementar saída e entrada de dados em aplicações Spark
  • Algoritmos comuns para tarefas Spark
  • Como fazer um Join com dados em Spark SQL
  • Como o Hadoop e Spark se integram ao Data Center
  • Como usar os algoritmos de Machine Learning com Spark
  • Como o Hive e o Impala podem ser usados para desenvolvimento rápido de queries