Blog

Handfestes Know-how, Tipps & Tricks und die Insights unserer Datenprofis findest Du hier in unseren Blogbeiträgen

Nahaufnahme von Händen auf einer Laptop-Tastatur
Thank you! Your submission has been received!
Oops! Something went wrong while submitting the form.
Erweitern von Datenlösungen On-Premises auf Snowflake in Azure
Erweitern von Datenlösungen On-Premises auf Snowflake in Azure

Erweitern von Datenlösungen On-Premises auf Snowflake in Azure

Diese komplette und schrittweise schnelle Demo zeigt Ihnen, wie man eine existierende Datenquelle intern mit einer modernen Cloud-Warehouse-Lösung wie Snowflake verbindet:  

  • Einfach
  • Schnell
  • Sicher und
  • ohne eine einzige Codezeile schreiben zu müssen.
Mehr lesen
SAP BW - Distinct Count optimiert oder: "Wie zähle ich meine Kunden?"
SAP BW - Distinct Count optimiert oder: "Wie zähle ich meine Kunden?"

SAP BW - Distinct Count optimiert oder: "Wie zähle ich meine Kunden?"

Ausnahmeaggregationen waren vor HANA in SAP BW häufiger eine Herausforderung bei der Laufzeit; dazu gehörte auch die Distinct-Count-Operation. Diese wird zum Beispiel beim Zählen von Kunden aus den Aufträgen genutzt.

Früher wurden Distinct-Count-Operationen häufig folgendermaßen umgesetzt:  Es wurde eine berechnete Kennzahl mit dem Wert 1 angelegt und diese dann über eine Ausnahmeaggregation aufsummiert. Was in Umgebungen ohne HANA gut geklappt hat, führt aktuell jedoch dazu, dass der Pushdown nicht mehr funktioniert. Je nach Einstellung kann es also dazu kommen, dass die Berechnung nicht optimal durchgeführt wird.

Eine Lösung für HANA-Umgebungen muss also her: Konzentrieren wir uns daher im Weiteren auf die optimale Implementierung von Distinct Count mit BW on HANA oder BW/4HANA.

Mehr lesen
Customer Data Platforms – ein Überblick über die Kategorien
Customer Data Platforms – ein Überblick über die Kategorien

Customer Data Platforms – ein Überblick über die Kategorien

Erhalte im foglenden Beitrag einen Überblick über die verschiedenen Kategorien von Customer Data Platforms - angelehnt an die Einteilung von David Raab vom Customer Data Platform Institute und weiterentwickelt von den b.telligent-Experten zum Thema CDP.

Mehr lesen
Customer Data Platforms - Abgrenzung zu Kampagnenmanagementsystemen
Customer Data Platforms - Abgrenzung zu Kampagnenmanagementsystemen

Customer Data Platforms - Abgrenzung zu Kampagnenmanagementsystemen

Deutsche Unternehmen müssen einen großen Schritt in Richtung digitale Transformation und Verbesserung der Customer Experience wagen, diese Einsicht reift bei den Entscheidern zunehmend.  Die Gründe hierfür sind vielfältig:

  • Wachsende Anzahl an Customer Touchpoints sowie die richtige Nutzung der Daten dahinter
  • Die Erwartungshaltung der Kunden steigt immens.
  • Neue Technologien halten Einzug in die Welt der Marketers.
  • Gängige Kampagnenmanagementsysteme sind in Bezug auf die Implementierung sehr aufwändig.
  • Die Toollandschaft wächst und wächst: Es gilt, den Überblick zu bewahren.

Da erscheinen CDP-Systeme, die es in den USA bereits seit 2013 gibt, wie gerufen. Während Kampagnenmanagementsysteme eher workflowbasiert oftmals in relationalen Datenmodellen CRM-basierte Kampagnenprozesse automatisieren, kümmern sich CDP-Systeme ganzheitlich um die Optimierung der Kundeninteraktion auf allen digitalen Kanälen wie Web, E-Mail, Mobile, Onlineshop oder Social – von der kundenzentrischen Datenhaltung in Big-Data-Technologien bis hin zum E-Mail-Versand in Realtime.

Mehr lesen
BCBS 239 - Chance für effiziente Business Intelligence im Bankenumfeld
BCBS 239 - Chance für effiziente Business Intelligence im Bankenumfeld

BCBS 239 - Chance für effiziente Business Intelligence im Bankenumfeld

Die Europäische Zentralbank (EZB) sowie viele andere Aufsichtsbehörden erkannten in der Analyse der Ursachen der Finanzkrise 2008 unter anderem große Defizite in der IT und Datenarchitektur der Institute. Diese Defizite führten dazu, dass Risikobewertungen nicht schnell und präzise genug und nicht vollständig durchgeführt werden konnten. Kurz gesprochen: Risiken konnten weder im angemessenen Maße berichtet noch kontrolliert werden. Aus dieser Lehre heraus wurde von dem Baseler Ausschuss für Bankenaufsicht (engl. Basel Committee on Banking Supervision, kurz BCBS) der vielseits durch die Presse bekannte Standard 239 veröffentlicht, auch bekannt als „Principles for effective risk data aggregation and risk reporting“ bzw. als AT 4.3.4 der MaRisk.

Mehr lesen
Einstieg in Continuous Integration bei der Entwicklung von Data-Warehouse-Systemen
Einstieg in Continuous Integration bei der Entwicklung von Data-Warehouse-Systemen

Einstieg in Continuous Integration bei der Entwicklung von Data-Warehouse-Systemen

Immer neue Datenquellen und Anwendungsgebiete sorgen auch weiterhin für den stetigen Ausbau von Datenhaltungssystemen, wie DWH, Data Lake oder Analytics Platform. Mit den erweiterten Anforderungen müssen auch die Datenbewirtschaftungsprozesse Schritt halten. Nicht selten wachsen kleine BI-Anwendungen zu großen Initiativen, an denen mehrere Entwicklerteams beteiligt sind. In vielen Branchen müssen Anpassungen schneller vorgenommen werden als jemals zuvor, was die Lage zusätzlich verschärft. Den Teams wird dadurch eine kurze Reaktionszeit sowie eine hohe Flexibilität abverlangt, die jedoch nicht zuletzt von der Infrastruktur getragen werden muss.

Mehr lesen
VERY Best Practice: Arbeiten in Python mit Pfaden - Teil 2
VERY Best Practice: Arbeiten in Python mit Pfaden - Teil 2

VERY Best Practice: Arbeiten in Python mit Pfaden - Teil 2

Immer noch das Problem: Ordner oder Laufwerke katalogisieren

Im letzten Eintrag haben wir in einer Lösung von weniger als zehn Zeilen mit einer rekursiven Funktion die Möglichkeit geschaffen, Ordner zu scannen und die Dateien nach Änderungsdatum und Dateigröße auswertbar zu machen.

Aufbauend auf diesem Beispiel möchte ich die Latte nochmal etwas höher legen und noch bessere Alternativen aufzeigen.

Mehr lesen
Best Practice: Arbeiten in Python mit Pfaden - Teil 1
Best Practice: Arbeiten in Python mit Pfaden - Teil 1

Best Practice: Arbeiten in Python mit Pfaden - Teil 1

Das Problem: Ordner oder Laufwerke katalogisieren

Vor kurzem wurde mir von Kollegen im Projekt die Frage gestellt, ob man mit Python nicht den Inhalt von Laufwerken katalogisieren könne. Natürlich geht das, und der Aufwand hierfür ist so überschaubar, dass ich hier das Beispiel nutzen möchte, um die wichtigsten Best-Practice-Empfehlungen für das Arbeiten mit Laufwerkspfaden zu erläutern.

Mehr lesen
Snowflake-Cloud-DB und Python: "zwei gute Freunde"
Snowflake-Cloud-DB und Python: "zwei gute Freunde"

Snowflake-Cloud-DB und Python: "zwei gute Freunde"

Was leistet Snowflake als Cloud-DB?

Snowflake ist eine native Cloud-DB und läuft auf AWS und inzwischen auch auf Azure. Die Internetverbindung vom Client zur Cloud und die Daten innerhalb der DB sind verschlüsselt. Dabei kann es während der Ausführung beliebig und automatisch hochskalieren und am Ende wieder herunterschalten. Da für das (Speicher-)Volumen und die Ausführungszeit gezahlt wird, können so durch die geringen Zeiten Kosten gespart werden. Eine ausführliche Online-Dokumentation ist unter folgender URL verfügbar: https://docs.snowflake.net/manuals/index.html

Man muss übrigens kein AWS-Kunde sein, um Snowflake verwenden zu können. Snowflake selbst bietet als Cloud-DB-Service keine eigenen ETL-Tools an, sondern überlässt dies den Herstellern von ETL-, Reporting- oder Self-Service-BI-Tools. Diese bieten meist native Treiber und Connections an, um ihre Tools mit Snowflake verwenden zu können. Soll im Unternehmen kein separates ETL-Tool eingesetzt werden, gibt es verschiedene Möglichkeiten, die Daten zu laden und die ETL-Strecken zu realisieren. Das Umsetzen der Logik in SQL und die Orchestrierung über Python ist dabei ein möglicher Weg.

Mehr lesen
Recommendation Systems - Teil 1: Motivation & Grundlage
Recommendation Systems - Teil 1: Motivation & Grundlage

Recommendation Systems - Teil 1: Motivation & Grundlage

Dieser Blogbeitrag beantwortet zwei Fragebereiche:

  1. Für wen ist ein Recommendation System relevant? Warum?
  2. Welche grundsätzlichen Varianten gibt es? Wie aufwändig ist eine dementsprechende Implementierung?
Mehr lesen
Data-Warehouse-Automatisierung (Teil 2)
Data-Warehouse-Automatisierung (Teil 2)

Data-Warehouse-Automatisierung (Teil 2)

Große Teile an bisher manueller Programmierung können durch DWA-Tools abgelöst oder zumindest stark vereinfacht werden. Welche Teile der Entwicklung dabei genau automatisiert werden können, kann von Tool zu Tool stark differieren. So gibt es Ansätze von reinen Code-Generatoren, mithilfe derer Datenbankstrukturen und ETL-/ELT-Prozesse automatisch generiert werden können („design-time“). Auf der anderen Seite existieren umfangreiche Integrationssuiten, die den gesamten DWH-Lebenszyklus, von der Bereitstellung der Daten in den Quellen bis hin zu den Data Marts, generieren, aber auch verwalten können („run-time“).

Bei der Entwicklung gibt es eine Reihe von Aufgaben, bei denen ein DWA-Tool unterstützen kann. Im Folgenden wird insbesondere auf die Bereiche Reverse Engineering und Kompatibilität, Analyse, Implementierung und Rahmenbedingungen eingegangen.

Mehr lesen
7 Faktoren für eine erfolgreiche Marketing-Automation-Einführung
7 Faktoren für eine erfolgreiche Marketing-Automation-Einführung

7 Faktoren für eine erfolgreiche Marketing-Automation-Einführung

Durch die verstärkte Nutzung des Internets und des Smartphones ändert sich zunehmend auch das Konsumentenverhalten der User. Mit zunehmender Digitalisierung der Kanäle und Touchpoints ist der Kunde heute besser denn je informiert und damit schwerer zu fassen. Das Konsumentenverhalten auch digital einzufangen, auszuwerten und zu verstehen, dazu muss der Marketingverantwortliche heute zielgenaue Segmente bilden und eine darauf abgestimmte Strategie für potentielle Customer Touchpoints erstellen, um den Kunden auf dem richtigen Kanal zum richtigen Zeitpunkt mit dem richtigen Angebot anzusprechen und ihn auf der anderen Seite nicht mit E-Mails oder Push-Nachrichten zu überfluten.

Mehr lesen