Blog

Handfestes Know-how, Tipps & Tricks und die Insights unserer Datenprofis findest Du hier in unseren Blogbeiträgen

Nahaufnahme von Händen auf einer Laptop-Tastatur

Blogposts im Rampenlicht

Das Potenzial von Openflow freisetzen: Praktische Lösungen für reale Herausforderungen bei der Datenintegration

Thank you! Your submission has been received!

Oops! Something went wrong while submitting the form.

Alle Filter zurücksetzen

HOWTO: Große Dateien verarbeiten mit Standard-Python

19.8.2015

8.5.2025

HOWTO: Große Dateien verarbeiten mit Standard-Python

Vorgefertigte Datensätze, die den Rahmen sprengen

Häufig werde ich mit bereitgestellten Rohdaten für Analysen konfrontiert, welche sich unkomprimiert durchaus auf Dateien von einem halben Gigabyte oder mehr erstrecken. Ab einem Gigabyte kommen die Desktop-gestützten Statistik-Tools langsam ins Schwitzen. Es gibt natürlich je nach Tool Möglichkeiten, nur einen Teil der Spalten zu selektieren oder nur die ersten 10.000 Zeilen zu laden usw.

Aber was macht man, wenn man aus der Datenlieferung nur eine zufällige Stichprobe ziehen möchte? Man darf sich nie darauf verlassen, dass die Datei zufällig sortiert ist. Sie kann durch Prozesse im Datenbankexport bereits systematische Reihenfolgeeffekte beinhalten. Es kann aber auch vorkommen, dass man z.B. nur ein Zehntel einer Gruppierung analysieren möchte, wie etwa die Einkäufe jedes zehnten Kunden. Dazu muss die komplette Datei gelesen werden, sonst kann man nie sicherstellen, dass alle Einkäufe der gefilterten Kunden berücksichtigt wurden.

Uplift-Modeling als Zusatz zum klassischen Response-Modeling

24.7.2015

8.5.2025

Uplift-Modeling als Zusatz zum klassischen Response-Modeling

Uplift-Modeling kann Kampagnenmanager bei der Kampagnensteuerung und -planung unterstützen, da es das klassische Response-Modell des Kampagnenscorings ergänzt. Uplift-Modeling geht von der Grundidee aus, dass man die Kampagnenreagierer in zwei Gruppen einteilt: diejenigen, die auch ohne die Kampagne reagiert hätten, und die, die das ohne die Kampagne nicht getan hätten. Während klassisches Scoring unterschiedslos auf beide Gruppen abzielt, versucht das Uplift-Scoring, exklusiv nur die zweite Gruppe zu isolieren und dabei die erste möglichst zu ignorieren. Zu diesem Zweck werden die Responseinformationen aus der Kontrollgruppe verwendet, die im klassischen Kampagnenscoring ungenutzt bleiben.

Anleitung: HICHERT (IBCS) out of the Box

22.6.2015

8.5.2025

Anleitung: HICHERT (IBCS) out of the Box

arcplan ist das erste Software-Tool für Business Intelligence (BI), das von der BARC und HICHERT+FAISST das renommierte HICHERT®IBCS-Gütesiegel erhalten hat. Durch die ausgesprochen hohe Flexibilität des Tools arcplan Enterprise war es möglich, jede Anforderung an Grafiken, Tabellen, Strukturen und Kommentare zu 100 % zu erfüllen. Seitdem hat arcplan weitere Entwicklungsarbeit investiert, um dem Anwender (Berichtsentwickler) das Erstellen von "IBCS-konformen" Berichten zu erleichtern und somit viel Zeit und Ressourcen bei der Berichtserstellung einzusparen. arcplan 8.5 bietet nun ein Portfolio von fertigen und zu 100 % IBCS-konformen Grafiken an, die mit wenigen Klicks in die Applikation eingebunden werden können. Selbstverständlich bieten auch die "Quicksteps" die volle arcplan-Flexibilität und können verändert, erweitert und an die spezifischen Anforderungen angepasst werden.

HOWTO: Einfaches Web Scraping mit Python

27.5.2015

8.5.2025

HOWTO: Einfaches Web Scraping mit Python

Erschlagendes Angebot im Webshop

Vor zwei Wochen wurde ich von einem oft genutzten Online-Versand, dessen Namen an ein Fluss in Südamerika erinnert, per freundlicher Info-Mail auf eine Aktion aufmerksam gemacht. Und zwar wurden mir drei Musik-CDs aus einer großen Auswahl für 15€ angeboten.

Ich erwerbe immer noch gerne, wie früher, Musik auf physischen Tonträgern und wollte mir das Angebot genauer ansehen. Nun stellte sich heraus, dass etwa 9,000 CDs offeriert wurden, und das über etwa 400 Seiten im Online-Shop. Dieser Shop bietet mir die Möglichkeit, das Angebot nach Beliebtheit oder nach Kundenbewertung zu sortieren. Wenn ich jedoch die Beliebtheit absteigend betrachte, finde ich viele Titel, die nicht mehr ganz meiner Altersklasse entsprechen. Andererseits, wenn ich nach Kundenbewertung sortiere, stellt sich heraus, dass der Shop die Bewertungen ungewichtet verarbeitet. D.h. irgendeine CD mit volkstümlichen Schlagern wird mit nur einer 5-Sterne Bewertung vor einer anderen CD mit 4.9 Sternen auf 1000 Bewertungen aufgeführt.

19.5.2015

8.5.2025

Howto: Transaktionssichere Eingaben

arcplan-Applikationen bieten oft die Möglichkeit, dass ein Benutzer durch Eingaben in die Applikation bzw. in die dahinter liegende Datenbank zurückschreibt. Dies ist im Besonderen bei Planungsapplikationen, aber auch vereinfacht bei Kommentareingaben der Fall.

13.5.2015

8.5.2025

R Tipps und Tricks - Teil 1

R, der Open-Source-Allrounder mit schwerem Einstieg

Vor etwa drei Jahren bin ich von kommerziellen Statistiklösungen, wie SPSS, auf R umgestiegen. Mittlerweile kann ich mit Überzeugung sagen, dass ich erstmal kein anderes Tool mehr für Advanced Analytics brauche. Vor allem in Verbindung mit der IDE "R-Studio" hat die Software einen Reifegrad erreicht, um sie bedenkenlos in großen Data-Science-Projekten einzusetzen.

Man braucht sich allerdings nicht vormachen, dass man R einfach installiert und loslegt. Die Lernkurve ist vergleichsweise steil und es gibt nicht nur in Bezug auf die verschiedenen Pakete viele unterschiedliche Wege, dasselbe zu tun. Nicht selten hab ich mich geärgert, dass ich mitten im Auswerten plötzlich über einen banalen Schritt gestolpert bin, dessen Umsetzung ich für R erst recherchieren musste. Ich möchte daher in diesem und hoffentlich vielen folgenden Teilen Tipps und Tricks für R aufgreifen, die ich gerne schon früher als Einsteiger gekannt hätte.

Kampagnenmanagement im Mobile-Engagement-Umfeld

8.4.2015

11.2.2015

8.5.2025

Standardisierung eines Erfolgskontrollprozesses in einem Versicherungsunternehmen

Im Direktmarketing-Umfeld ist es bei vielen Unternehmen immer noch der Fall, dass die Erfolgsmessung der gefahrenen Kampagnen eine nur untergeordnete Rolle spielt. Dabei vermitteln gut durchgeführte Kampagnen-Erfolgsmessungen Wissen über die Effektivität bestimmter Kampagnen und ermöglichen fundierte Entscheidungen über deren Ausgestaltung und zukünftige Optimierung. Ziel sollte es sein, für Direktmarketing-Maßnahmen eine standardisierte Erfolgsmessung einzuführen und mit dem generierten Wissen neue Kampagnen zu verbessern und somit mehr Umsatz bzw. Gewinn zu erzielen.

Blog

Blogposts im Rampenlicht

Das Potenzial von Openflow freisetzen: Praktische Lösungen für reale Herausforderungen bei der Datenintegration

HOWTO: Große Dateien verarbeiten mit Standard-Python

Vorgefertigte Datensätze, die den Rahmen sprengen

Uplift-Modeling als Zusatz zum klassischen Response-Modeling

Anleitung: HICHERT (IBCS) out of the Box

HOWTO: Einfaches Web Scraping mit Python

Erschlagendes Angebot im Webshop

Howto: Transaktionssichere Eingaben

R Tipps und Tricks - Teil 1

R, der Open-Source-Allrounder mit schwerem Einstieg

Kampagnenmanagement im Mobile-Engagement-Umfeld

Schaffung von Kampagnenintelligenz im Mobile-App-Kanal

Der Customer Lifetime Value: Populäre Irrtümer und ungeschminkte Wahrheiten

Fehlende Werte in logistischer Regression

Die arcplan-Funktion ZUORDNEN

Wandflächenberechnung vektorisiert in R

Standardisierung eines Erfolgskontrollprozesses in einem Versicherungsunternehmen

München

Berlin

Cluj

Düsseldorf

Frankfurt

Hamburg

Nürnberg

Wien

Zürich

Basel

Cluj

Wien - Postanschrift

Wien - Besucheranschrift

Zürich

Nürnberg

Frankfurt

Düsseldorf

Hamburg

Berlin

München