R

Lange vor der allgemeinen Verfügbarkeit von SAP HANA 1.0, als praktisch nur die SAP selbst Zugang zum System hatte war immer mal wieder die Rede von R. Hier und da in Gesprächen, selten auch auf einer Folie war zu lesen: „Das haben wir mit R realisiert.“ Grund genug sich mit R einmal näher auseinander zu setzen.

R ist eine freie Programmiersprache für statistisches Rechnen und statistische Grafiken. Sie ist in Anlehnung an die Programmiersprache S entstanden und weitgehend mit dieser kompatibel. Außerdem orientierten sich die Entwickler an der Programmiersprache Scheme. R ist Teil des GNU-Projekts und auf vielen Plattformen verfügbar. Vor allem im akademischen Bereich gilt sie heute als statistische Standardsoftware. Soweit wikipedia.

R ist also keine neue Programmiersprache der SAP, R ist nicht das neue ABAP. Vielleicht ist der Zusammenhang zwischen HANA und R am HPI in Potsdam zu suchen, vielleicht hat einer der Entwickler ein Faible für Statistik, vielleicht gibt es aber auch ganz andere Gründe. In jedem Fall kann R aus SQL Script in HANA heraus ausgeführt werden und das macht es interessant.
Heute möchte ich ein kleines Beispiel zeigen wie man R auch ohne SAP Software ausprobieren kann, wenn man möchte. Jeder kann R von http://cran.r-project.org/ für verschiedene Betriebssysteme herunterladen. Ich persönlich habe mir noch das RStudio dazu installiert, um die Arbeit mit R etwas komfortabler zu gestalten.

Als Einstiegs-Beispiel habe ich folgendes kleines Szenario umgesetzt. Einige Datensätze werden per csv-Datei nach R geladen. Die Daten werden aggregiert, angezeigt und eine Datenbankverbindung hergestellt. Über diese Verbindung werden Daten in eine Datenbanktabelle geschrieben und wieder ausgelesen. R unterstützt über Zusatzpakete verschiedene Datenverbindungen. Ich habe das Paket RODBC installiert um eine ODBC Verbindung herzustellen. Ich konnte mir nicht verkneifen als Datenbank die HANA Datenbank zu verwenden, hier kann aber selbstverständlich auch jede andere Datenbank verwendet werden die ODBC unterstützt. Installation des richtigen Treibers vorausgesetzt. Unter Windows erledigt man die notwendigen Einstellungen unter Systemsteuerung -> Verwaltung -> ODBC-Verbindungen. Nachstehendes Coding zeigt meine ersten Gehversuche in R:

In HANA sieht das Ergebnis dann so aus:


Mit ABAP funktioniert das übrigens ganz ähnlich. Einfach Datenbankverbindung aufbauen und Daten austauschen (Blogbeitrag folgt).HANA ist eben doch irgendwie auch nur eine ganz normale Datenbank…


Getagged mit: , , ,
2 Kommentar auf “R
  1. Sven Zech sagt:

    Hallo Jürgen. R ist deshalb so interessant weil R in HANA ab SP4 dann offiziell integriert ist. Zum Zeitpunkt als dieser Blog geschrieben wurde war HANA allerdings noch nicht so weit. Um nun R testen zu können konnte man R natürlich ebenso gut proprietär ausprobieren. Um eine Verbindung zu HANA zu schaffen habe ich aufgezeigt wie einfach man aus einer beliebigen Programmiersprache wie eben beispielsweise auch R auf HANA als Datenbank zugreifen kann. Perspektivisch macht ein solches Szenario natürlich wenig Sinn da R ja, wie gesagt in HANA direkt integriert ist. Wir haben seit dieser Woche die HANA SP3 nun verfügbar und seit gestern als Datenbank für das SAP BW auch am laufen. Vielleicht schaffe ich es ja in den nächsten Wochen einmal einen Beitrag zu verfassen wie ein Szenario mit R im Zusammenspiel mit dem SAP BW auf HANA aussehen könnte.

  2. Jürgen sagt:

    Interessant, nur warum sollte ich das machen? Wann brauche ich einen Direktzugriff auf HANA an jegliochem Datenmodell vorbei? Vielleicht raff ich es auch gerade nicht….Können wir mal gerne drüber philosophieren.

    Grüße
    Jürgen

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.

*

*