Inhalt

Wer im Big-Data-Umfeld Data Engineering oder Data Science betreiben will, kommt an Spark nur schwer vorbei. Apache Spark ist ein Framework für die Verarbeitung großer Datenmengen mit integrierten Modulen für Streaming, SQL und Machine Learning.

Der 1-tägige Kurs richtet sich an Anfänger und gibt eine Einführung in das Framework. Ziel des Kurses ist, in einem Theorieteil die Konzepte und Besonderheiten zu erläutern, so dass die Kursteilnehmer am Ende des Tages über die Technologie Auskunft geben und die Eignung in ihren Projekten bewerten können. Im Praxisteil werden mit SQL und Python erste Praxisübungen mit echten Datensätzen durchgeführt. Dazu werden alle Beispiele auf Laptops vorbereitet.

Ziele

Die Kursteilnehmer erhalten in dem 1-tägigen Einsteigerkurs Antworten auf alle wichtigen Fragen rund um Apache Spark und bekommen viele neue Ansatzpunkte für mögliche Projekte im Big-Data-Umfeld:

  • Was ist Apache Spark und welche Position nimmt es im Big-Data-Universum ein?
  • Wo wird es für welche Use Cases eingesetzt?
  • Konnektivität von Spark mit anderen Technologien
  • Konzepte und Konsequenzen der verteilten Verarbeitung mit Spark
  • Möglichkeiten zur Ausführung von Spark (Notebooks, Shell ...)
  • Dataframes, Spark SQL
  • Performance-Faktoren
  • Einblick in weitere Komponenten: Spark Streaming und Machine Learning
  • Hands-on-Übungen zur Datenaufbereitung, Analyse und Visualisierung

Und vieles, vieles mehr! Die Kursteilnehmer verlassen den Kurs mit theoretischen und praktischen Erfahrungen und einer klaren Vorstellung davon, wie sie Spark für sich und ihre Projekte effizient und effektiv nutzen können.

Voraussetzungen & Teilnehmer

Der Kurs richtet sich an Software-Entwickler, Analysten und Architekten aus den Bereichen Data Science und Data Engineering. Vorkenntnisse in Apache Spark sind nicht erforderlich. Voraussetzungen sind:

  • Erfahrung mit SQL
  • Idealerweise erste Programmiererfahrung in Python oder Scala

Ein eigener Laptop ist erforderlich.

Referent

Stefan Seltmann ist Diplom-Psychologe und Principal Consultant im Competence Center Data Science bei b.telligent. Er ist Experte für Machine Learning auf Basis von unterschiedlichen Sprachen und Technologien und setzt Apache Spark bereits erfolgreich in diversen Projekten mit Python und mit Scala ein. Als erfahrener Data-Science-Praktiker mit mehr als 15 Jahren Projekterfahrung kennt er die Welt der relationalen Datenbanken ebenso wie die der Big-Data-Technologien und freut sich darauf, den Kursteilnehmern Lust auf den Umgang mit Apache Spark zu machen.

Nächster Termin

27.11.2018

Schulungsort

München

Dauer

1 Tag

Kosten

495 €

(netto)