Pentaho Data Science Pack operationalisiert die Nutzung von R und Weka

Erschließung häufig genutzter Data Scientist Werkzeuge erleichtert Arbeit und gibt bessere Einsicht ins Kundenverhalten

Hadoop Summit – San Jose, Kalifornien — 03. Juni 2014 — Laut des Data Scientist Salary Survey von O'Reilly ist die statistische Programmiersprache R das meist genutzte Werkzeug von Data Scientisten während Weka eine häufig genutzte und populäre Open Source Sammlung von Machine Learning Algorithmen ist.  Heute hat Pentaho sein Data Science Pack angekündigt, ein Toolkit, das diese beiden häufig genutzten Technologien operationalisiert, um die Datenaufbereitung und -bereinigung sowie die Orchestrierung analytischer Datensets zu vereinfachen.

Mit Hilfe von Pentaho Data Integration (PDI) wird der komplexe Datenflussprozess für R und Weka somit beschleunigt. Unternehmen haben dadurch mehr Zeit für erweiterte und prognostische Analysen, die dabei helfen eine bessere Einsicht in das Kundenverhalten zu erhalten.

„Bisher gab es eine Marktlücke, sodass man verschiedene Lösungen für Datenaufbereitung und -bereinigung sowie Orchestrierung analytischer Datensets nutzen mussten. Das Pentaho Data Science Pack schließt nun diese Lücke,“ sagte Ken Krooner, ESRG Präsident. "Wir haben Pentaho seit mehr als sieben Jahren in unsere Lösung eingebettet, um webbasierte und On-Premise Analysen für maritime Flotten und Schiffe anzubieten und haben mehrjährige Erfahrung mit verschiedenen Daten-Tools und Pentaho Data Integration ist entscheidend für mein Team. Wir nutzen gegenwärtig Weka mit PDI, um unseren Kunden dabei zu helfen, eine 360°-Sicht aller Geräte-Datenquellen zu erstellen und potentiellen Maschinenausfall rechtzeitig vorherzusagen. “

Laut Markforschungsunternehmen Ventana Research zählen das Lösen von Datenqualität- (46%) und Konsistenz-Probleme (52%) zu den beiden zeitaufwendigsten  Big Data Arbeiten.  Pentaho Kunde Paytronix, ein Anbieter von Marketing- und Bonusprogrammen für die Gastronomie, nutzt die Programmiersprache R in Kombination mit Pentaho und Hadoop, um Betrugsfälle und Kaufverhalten für ihre Kunden zu prognostizieren. Saad Khalid, Data Insights Produkt Manager bei Paytronix erklärt, „Datenaufbereitung ist ein wichtiger, aber langwieriger Prozess. „Pentaho Data Integration in Kombination mit R hat Paytronix ermöglicht,  unseren Kunden viel schneller mit Analytics und Einblicken zu versorgen. Was vorher mehrere Wochen dauerte, erledigen wir nun in einigen Minuten. “

„Mit unseren Blaupausen für die vier häufigsten Big Data Anwendungsfälle ist Pentaho führend bei der Lösung von Datenintegrationsherausforderungen und wir wissen, dass erweiterte und prognostische Analysen Kernbestandteile des Erfolges sind,“ erklärt Christopher Dziekan, EVP und Chief Product Officer bei Pentaho. „Die beste Einsicht wird bei der Analyse dann erlangt, wenn Rückblick und Vorausschau so kombiniert werden, dass sich aus Daten Handlungsanweisungen ergeben. Das Pentaho Data Science Pack ermöglicht unseren Kunden, ihre Fachkentnisse besser zu nutzen und ihre Kundenanalysen und Vorhersagen zu verbessern.“

Das Data Science Pack verbessert die Produktivität durch die Ausführung fortgeschrittener deskriptiver Statistiken und maschinellen Lern-Algorithmen im großen Ausmaß während der Transformationsphase.

Das Data Science Pack beinhaltet u.a. folgende Funktionen:

  • R Script Executor Step - ermöglicht die Nutzung der mehr als 5.500 Pakete des Comprehensive R Archive Network (CRAN) Repository während der PDI Transformation
  • Weka Forecasting Step - nutzt Machine Learning um basierend auf historischen Beobachtungen zukunftsorientierte Zeitreihen Datensets zu generieren
  • Weka Scoring Step - führt Machine Learning Modelle aus, um Wahrscheinlichkeitswerte zu berechnen und auf neue Datensätze zu übertragen

Das Data Science Pack ist bei Pentaho ab Frühsommer erhältlich.

Über Pentaho

Pentaho ist der Anbieter von Business Analytics Lösungen Pentaho stellt leistungsstarke Analyse zur Verfügung mit Funktionen für Datenzugriff, -integration, -, -analyse, -visualisierung und Data Mining. Ein kostenloser Download zur Evaluierung von Pentaho Business Analytics steht unter pentaho.de/download zur Verfügung.

Pentaho Media Contact

Round Earth Consulting
44-20 72 93 27 58
admin@roundearthconsulting.com