SAP HANA Vora – Interaktion von HANA mit Apache Spark

Mit „SAP HANA Vora“ hat SAP eine In-Memory-Query-Engine entwickelt, die das „Spark“-Framework von Apache nutzt und erweitert. HANA Vora (abgeleitet von „voracious“, englisch für „gefräßig“) ersetzt im Wesentlichen die Query Engine von Apache Spark und ermöglicht so OLAP-ähnliche Analysen von Daten eines BigData-Clusters. Damit wird HANA Vora zu einer kommerziellen Variante von Apache Shark.

Das Projekt Apache Spark wurde für die Datenverarbeitung großer Datenmengen im Batchbetrieb entwickelt. Es optimiert durch Verwendung der In-Memory Technologie die Zugriffe um etwa den Faktor 100 gegenüber früheren Verfahren (wie bspw. einfaches Map-Reduce). Apache Shark ermöglicht die Verwendung von SQL ähnlichen Befehlen für Spark.

Mit SAP HANA Vora sollen Drill-Downs und Drill-Throughs von der SAP-Seite nach „Hadoop“ möglich sein, ohne dass dafür Daten repliziert oder kopiert werden müssen. Vora unterstützt Hierarchien, (Mengen- und Währungs-) Einheiten, sowie Währungsumrechnung „on-the-fly“. Durch die Möglichkeit Vora auch als Service zu nutzen können hybride Anwendungen entwickelt werden, welche auf strukturierte Daten aus HANA und polystrukturierten Daten aus einem Cluster zugreifen kann und eine Interaktion mit beiden Seiten erlaubt.

201509 SAP HANA Vora Overview

Vora ist nicht Teil von SAP HANA, sondern basiert auf eigenem Code. Vora ist eine Erweiterung der Hadoop Plattform. Damit grenzt sich SAP HANA Vora von der Möglichkeit über Smart Data Access in HANA eine Verbindung zu Spark herzustellen klar ab. SAP HANA Vora kann auch ohne gänzlich ohne SAP HANA verwendet werden. Voraussetzung zu Betrieb ist im wesentlichen nur ein verteiltes Dateisystem wie HDFS (Hadoop File System) und natürlich Apache Spark. SAPs neuer Chief Technology Officer (CTO) Quentin Clark stellt SAP HANA Vora im folgenden Video vor.

YouTube Preview Image

Bereits seit Juli 2015 wurde eine Beta-Version bei einigen Testkunden evaluiert. So zitiert die ComputerWeekly Aziz Safa, Vice President und General Manager IT Enterprise Applications und Application Strategy bei Intel wie folgt: „Im Rahmen unserer Big-Data-Initiative setzen wir derzeit Hadoop und SAP HANA in unserer IT-Landschaft ein, um bei der Verwaltung großer unstrukturierter Datenmengen zu helfen. Bessere Analysten von Big Data ist eine unserer Kernanforderungen, aber das Mining dieser großen Datenmengen in Hadoop nach kontextuellen Informationen ist schwierig. SAP HANA Vora wird uns in die Lage versetzen, OLAP-Processing direkt über diese großen, reichhaltigen Datenmengen in Hadoop komplett In-Memory zu fahren. So können wir Informationen im Kontext extrahieren und diese wertvollen Einsichten dann wieder ans Business zurückspielen.“

SAP HANA Vora wird noch Ende September im Ramp-Up für ausgewählte Kunden verfügbar sein. Zeitgleich soll es auch schon eine kostenfreie Cloud-basierte Developer Edition geben. Mit der allgemeinen Verfügbarkeit ist zum Jahresende zu rechnen. Dann ist auch mit der On-Premise Version zu rechnen.

Getagged mit: , , , , , , , , , , ,

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.

*

*