Process Engines mit Unterstützung von BPMN (Business Process Model and Notation), wie z.B. Camunda, erfreuen sich immer größerer Beliebtheit. Durch die systemgestützte Ausführung von Unternehmensprozessen fallen eine Menge von Prozessdaten an, deren Nutzung ein großes Potential für die Optimierung der Prozesse bietet. In diesem Talk zeigen wir, wie wir mit Hilfe von Apache Spark eine leistungsfähige Pipeline zur Vorverarbeitung von Prozessdaten realisiert haben, um damit Machine Learning Algorithmen in H2O anlernen können. Diese können in verschiedenen Stufen zur Unterstützung und Optimierung von Unternehmensprozessen eingesetzt werden. Zudem zeigen wir am Beispiel von Camunda, wie wir mit Hilfe von Apache Kafka die Prozessdaten so extrahieren und archivieren, dass der Produktivbetrieb der Process Engine nicht beeinträchtig wird, wir aber trotzdem einen schnellen und effizienten Zugriff auf die Prozessdaten haben. Wir freuen uns über interessierte Entwickler und Feedback zum zugehörigen Open Source-Prozess bpmn.ai.
Speakers: Mario Micudaj