Inhalt

Dieser Kurs bringt den Kursteilnehmern in zwei Tagen das Big-Data-Ökosystem rund um Apache Hadoop näher. Bei Hadoop handelt es sich um das weltweit verbreitetste Projekt im Bereich Big Data. Es besteht aus drei Komponenten: verteiltes Speichern von Daten, verteilte Berechnungen auf Daten und Verwalten von Computerressourcen. Aber damit ist es nicht getan: Heute umfasst dieses Ökosystem hunderte von Tools und Frameworks – die wichtigsten werden in diesem Kurs vorgestellt, und zwar unabhängig von der Hadoop-Distribution.
Im Hands-on-Teil werden einfache Befehle verwendet, um auf HDFS zuzugreifen, sowie ggf. auch Spark-Jobs auf YARN und SQL-Statements mit Hive.

Ziele

Die Kursteilnehmer lernen, was Hadoop eigentlich ist. Sie erfahren, dass es viel mehr ist als nur ein einzelnes Projekt. Es handelt sich um ein ganzes Ökosystem an Tools und Produkten.

  • Big-Data-Einführung, kurze Geschichte
  • Einführung in Apache Hadoop (HDFS, YARN, MapReduce)
  • Einführung in das Ökosystem (HBase, Flume, Spark, Hive, Impala usw.)
  • Wie wird Hadoop für welche Use Cases eingesetzt?
  • Welches sind die wichtigsten Web-UIs und Kommandozeilenbefehle?
  • Hinweise zu Administration und Security
  • Hands-on-Erfahrungen mit Hadoop an praxisrelevanten Beispielen

Voraussetzungen & Teilnehmer

Der Kurs richtet sich an Big-Data-Entwickler und Administratoren (Operations). Vorkenntnisse in Hadoop sind nicht notwendig. Voraussetzungen sind:
• idealerweise grundlegende Kenntnisse in der Linux Shell
Ein eigener Laptop mit OpenVPN-Client ist für die Praxisübungen erforderlich.

Referent

Lars Francke beschäftigt sich seit 2009 mit Hadoop (und seinem Ökosystem), HBase und Big Data im Allgemeinen. Er arbeitet aktiv an diversen Projekten mit und ist Hive, HBase und ORC Committer sowie Mitglied der Apache Foundation. Er hat Dutzende Hadoop Cluster jeglicher Größe, Version und Variation aufgesetzt und gewartet und in seiner Laufbahn mehr als 40 verschiedene Kunden betreut. 2016 hat Lars Francke die Firma OpenCore mitbegründet, die sich auf Hadoop, Big Data und Open Source konzentriert.


Frank Schmidt

Kontakt

Frank Carl Schmidt
Competence Center Manager
DE +49 (89) 122 281 110
CH +41 (44) 585 39 80

Nächster Termin

21. - 23.01.2019

18. - 20.02.2019

 

Dauer

3 Tage

Kosten

1.495 €

(netto)

Schulungsort

München