Mit Hilfe von Pentaho Data Integration (PDI) wird der komplexe Datenflussprozess für R und Weka somit beschleunigt. Unternehmen haben dadurch mehr Zeit für erweiterte und prognostische Analysen, die dabei helfen eine bessere Einsicht in das Kundenverhalten zu erhalten.
"Bisher gab es eine Marktlücke, sodass man verschiedene Lösungen für Datenaufbereitung und -bereinigung sowie Orchestrierung analytischer Datensets nutzen mussten. Das Pentaho Data Science Pack schließt nun diese Lücke," sagte Ken Krooner, ESRG Präsident. "Wir haben Pentaho seit mehr als sieben Jahren in unsere Lösung eingebettet, um webbasierte und On-Premise Analysen für maritime Flotten und Schiffe anzubieten und haben mehrjährige Erfahrung mit verschiedenen Daten-Tools und Pentaho Data Integration ist entscheidend für mein Team. Wir nutzen gegenwärtig Weka mit PDI, um unseren Kunden dabei zu helfen, eine 360°-Sicht aller Geräte-Datenquellen zu erstellen und potentiellen Maschinenausfall rechtzeitig vorherzusagen. "
Laut Markforschungsunternehmen Ventana Research zählen das Lösen von Datenqualität- (46%) und Konsistenz-Probleme (52%) zu den beiden zeitaufwendigsten Big Data Arbeiten. Pentaho Kunde Paytronix, ein Anbieter von Marketing- und Bonusprogrammen für die Gastronomie, nutzt die Programmiersprache R in Kombination mit Pentaho und Hadoop, um Betrugsfälle und Kaufverhalten für ihre Kunden zu prognostizieren. Saad Khalid, Data Insights Produkt Manager bei Paytronix erklärt, "Datenaufbereitung ist ein wichtiger, aber langwieriger Prozess. "Pentaho Data Integration in Kombination mit R hat Paytronix ermöglicht, unseren Kunden viel schneller mit Analytics und Einblicken zu versorgen. Was vorher mehrere Wochen dauerte, erledigen wir nun in einigen Minuten. "
"Mit unseren Blaupausen für die vier häufigsten Big Data Anwendungsfälle ist Pentaho führend bei der Lösung von Datenintegrationsherausforderungen und wir wissen, dass erweiterte und prognostische Analysen Kernbestandteile des Erfolges sind," erklärt Christopher Dziekan, EVP und Chief Product Officer bei Pentaho. "Die beste Einsicht wird bei der Analyse dann erlangt, wenn Rückblick und Vorausschau so kombiniert werden, dass sich aus Daten Handlungsanweisungen ergeben. Das Pentaho Data Science Pack ermöglicht unseren Kunden, ihre Fachkentnisse besser zu nutzen und ihre Kundenanalysen und Vorhersagen zu verbessern."
Das Data Science Pack verbessert die Produktivität durch die Ausführung fortgeschrittener deskriptiver Statistiken und maschineller Lern-Algorithmen im großen Ausmaß während der Transformationsphase.
Das Data Science Pack beinhaltet u.a. folgende Funktionen:
- R Script Executor Step - ermöglicht die Nutzung der mehr als 5.500 Pakete des Comprehensive R Archive Network (CRAN) Repository während der PDI Transformation
- Weka Forecasting Step - nutzt Machine Learning um basierend auf historischen Beobachtungen zukunftsorientierte Zeitreihen Datensets zu generieren
- Weka Scoring Step - führt Machine Learning Modelle aus, um Wahrscheinlichkeitswerte zu berechnen und auf neue Datensätze zu übertragen
Mehr Informationen zum Pentaho Data Science Pack
Zum on-demand Webinar über das Pentaho Data Science Pack anmelden:
PentahoWorld, 8. - 10. Oktober in Orlando, Florida besuchen. Hier für den Trainingskurs Test Drive Pentaho with Weka registieren.
Über Pentaho
Pentaho ist Anbieter von richtungsweisenden Business Analytics Lösungen mit Funktionen für Datenzugriff, -integration, -analyse, -visualisierung und Data Mining. Ein kostenloser Download zur Evaluierung von Pentaho Business Analytics steht unter www.pentaho.de/testdrive/ zur Verfügung.